您现在的位置是: 首页 > 初识Hadoop


初识Hadoop

纯真年代 2018-09-15 14:50:42 2 569人围观

直达车:Apache Hadoop

简介
  • Hadoop 是可靠的(reliable), 可扩展的(scalable), 分布式计算(distributed) 框架.
  • Hadoop 允许我们使用简单的编程模型分布式的处理大数据集,这些数据集是可以横跨在集群上面的。它可以从单个servers扩展到数千台机器的,每个机器都可提供计算和存储......
包含模块
  • Hadoop Common: The common utilities that support the other Hadoop modules.(提供一些工具类,对Hadoop的其他模块提供支持)
  • Hadoop Distributed File System (HDFS™): A distributed file system that provides high-throughput access to application data.(一个分布式的文件系统,对应用的数据访问提供一个高的吞吐量)
  • Hadoop YARN: A framework for job scheduling and cluster resource management.(作业的调度以及集群资源的管理)
  • Hadoop MapReduce: A YARN-based system for parallel processing of large data sets.(基于YARN系统之上,能够并行处理大数据集)
  • Hadoop Ozone: An object store for Hadoop.(HDFS的新方向:Ozone对象存储
Hadoop GitHub
  • https://github.com/apache/hadoop  直达车
Hadoop能干什么
  • 大型数据的存储、处理、日志分析、数据挖掘......


说明:整理于网络
本人学习大数据的课程全来源慕课网(
Michael PK老师),我是初学者,老师讲得很好,作为学生价格可能有点难,像我一样,忍忍就好了哈哈

本文章作为个人笔记,也供大家监督

全部评论