hadoop是做什么的?

提供海量数据存储和计算需要java语言基础。

Hadoop实现了分布式文件系统(HDFS)。它具有高容错性的特点,设计用于部署在低成本的硬件上。此外,它还提供了访问应用数据的高吞吐量,适用于那些具有大数据集的应用。

特性

1.快照支持存储特定时间的数据副本。快照可以将故障集群回滚到之前的正常时间点。HDFS已经支持元数据快照。

2.HDFS旨在支持大文件。在HDFS上运行的程序也被用来处理大型数据集。这些程序只写数据一次,读数据请求一次或多次,这些读操作需要满足流速度。

HDFS支持一次写入多次读取。在HDFS,典型的块大小是64MB。一个HDFS文件可以分成多个64MB大小的块,如果需要,每个块可以分布在不同的数据节点上。

3.阶段状态:客户端创建文件的请求不会立即转发到名称节点。事实上,起初,HDFS客户端将文件数据缓存在本地临时文件中。