相关工作
1. 消息传递库
除了mpich(2)外,其他的我发现都有内嵌fault tolerance,checkpoint/restart支持
- MPICH(2) by Argonne National Laboratory
- MPICH-V by INRIA
- LA-MPI by Los Alamos National Laboratory
- FT-MPI by Jack J. Dongarra (University of Tennesses)
- OPEN-MPI by Indiana University
- 其他
2. 分布式执行引擎
- MAP-REDUCE
- DRYAD
- WORKFLOW
3. 事件驱动的编程方法
4. 其他