该仓库记录了分布式计算系统期末实验设计中配套使用的代码、负载生成和运行脚本,并介绍如何使用。
├─input 负载数据
├─out jar包
├─scripts 数据生成和任务提交的脚本
└─src
hadoop版本: 2.10.1
spark版本:2.4.7
jdk版本: 1.8.0_171
可跳过,直接使用已打包好的out/artifacts/DCS_1_0/DCS-1.0.jar
mvn clean package
mv target/DCS-1.0.jar out/artifacts/DCS_1_0/DCS-1.0.jar
使用脚本前需要启动HDFS和spark,配置hadoop和spark的环境变量,并将主节点设置为ecnu01(或根据环境修改脚本内容)
scripts/gen_and_upload.sh
scripts/submit_shuffle_group.sh
scripts/submit_shuffle_reduce.sh
scripts/submit_spill_partition2.sh
scripts/submit_spill_partition16.sh
scripts/submit_skewed_basic.sh
scripts/submit_skewed_salting.sh