HDFS是hadoop兼容最好的标准级文件系统。Hadoop是分布式服务器集群上存储海量数据并运行分布式分析应用的开源框架,而HDFS是一个分布式文件系统,是Hadoop中的一个核心部件,主要是对数据进行分布式储存和读取。
HDFS(Hadoop Distributed File System)是hadoop项目的核心子项目,是基于流数据模式访问和处理超大文件的需求而开发的。
HDFS的优点:
1) 处理百MB、设置数百TB大小的文件
2) 流式的访问数据,响应"一次写入、 多次读写"
3) 运行于廉价的商用集群上
HDFS的缺点:
1) 不适合低延迟数据访问
2) 无法高效存储大量小文件
3)不支持多用户写入及任意修改文件
HDFS是开源的,存储着Hadoop应用将要处理的数据,类似于普通的Unix和linux文件系统