大数据项目仓库、涉及 Hadoop、Spark、Kafka、Hbase..... 等,更新中...
项目名 |
所属组件 |
介绍 |
ch2noaa |
MapReduce |
MapReduce 实验 - 计算气温 最大/最小/平均 值 |
hdfscrud |
HDFS |
HDFS Java API 增删查改 |
hdfslogcollect |
HDFS |
Timer 定时将日志文件备份到 HDFS 中去,copyFromLocalFile |
commonfans |
MapReduce |
MapReduce 计算共同好友 |
hadoopjoin |
MapReduce |
MapReduce 两表进行左连接 left join,两表进行 map join |
customizePartition |
MapReduce |
MapReduce 自定义分区 ,Partitioner 决定每条记录应该送往哪个reducer节点 |
sparkSqlSample |
Spark SQL |
Spark SQL 样例,关于HiveContext、SQLContext、SparkSession、RDD、DataFrame、Dataset的使用 |
curator-example |
Zookeeper |
基于Apache Curator实现对Zookeeper的操作,以及数据发布/订阅、负载均衡、命名服务、分布式协调/通知、集群管理、Master选举、分布式锁和分布式队列等Zookeeper的应用场景 |
HbaseExamples |
HBase |
Hbase Java API的基本操作,包括增删查改、过滤器、协处理器,Phoenix、Phoenix+Mybatis等 |
kafka-example |
Kafka |
深入理解Kafka各种操作,生产者、消费者、主题、分区、应用、可靠性、spark |