gluster和hadoop的区别
光泽:
基于对象的存储模型
支持不同版本之间的互操作性。
用户可以同时操作同一文件的不同部分
Hadoop:
流式数据访问
支持大文件和数千万数据集。
一种“一写多读”的文件访问模型
安全模式
管道复制
浏览器和JAVA界面
在特定时间段之前删除的文件可以恢复。
格鲁斯特:
线延伸
用在每个节点运行的动态算法代替MDS。
支持多种存储和文件协议
基于保险丝
Hadoop和Lustre的层次比较
Hadoop分为四个层次:mapper输入,mapper输出,reducer输入,reducer输出。
1.映射输入:读/写
(1)文件块的位置信息可用。
Hadoop:以流的形式执行每一个读写任务,几乎没有远程网络I/O..
Lustre:通过每个客户端并行执行每个读写任务。
(2)没有文件块的位置信息。
Hadoop:以流的形式执行每一个读写任务,几乎没有远程网络I/O..
Lustre:每个读写任务由每个客户端并行执行,这比Hadoop的远程网络I/O要少..
添加文件块的位置信息,可以使读写操作尽可能的本地化,从而最小化网络流量,提高读写速度。
2.映射输出:读/写
HDFS:写在本地Linux文件系统上,而不是HDFS本身。
Lustre:写在Lustre上。
3.Recude输入完成阶段(洗牌阶段)读写。
HDFS:使用HTTP从远程地图节点获取地图输出。
Lustre:将恢复与地图输出的硬连接。
4.减少输出:写入
HDFS:reduce任务将把结果写到HDFS,每个Reducer都是有序列号的。
Lustre:reduce任务会将结果写入Lustre,每个Reducer都是并行的。