/BigDataStudy

关于大数据相关的学习项目

Primary LanguageJava

BigDataStudy简介

关于大数据相关的学习项目。目前已经搭建了Nutch2.3+HBase0.98.9+Hadoop2.6+Solr4.7.2伪分布式环境。该项目基于该环境如下课题:

  • 熟悉大数据环境搭建过程
  • 学习Nutch抓取,掌握抓取过程
  • 学习使用Hadoop分布式计算平台,HDFS分布式文件系统,MapReduce计算框架,YARN资源管理框架
  • 学习使用NOSQL数据HBase
  • 学习使用开源数据挖掘库Mahout