如何选择 broadcast join 还是 shuffle join，优化器有一系列参数和公式，为了调试这些参数和公式，我们将

生成测试数据（需要导入1T数据的服务器）

导入tpcds 1t，执行 ddl/create_cust.sql, ddl/create_ss.sql 生成测试table

下面对 1v1.csv 的操作都需要应用在1v1.csv ... 16v1.csv 等文件上

将 1v1.csv 转化为 1v1_processed.csv，即，将 bc和sh 相同量级的join结果写到同一行，并计算两种join的时间差生成文件在 processed/*be

创建测试使用的空表

注入统计信息

在验证环境中跑explain shape，提取join shuffle，结果生成到eval/shuffle_type/*be/ 目录

对比eval/shuffle_type/*be/ 和 processed 文件，结果生成到result/*be/1v1.csv。如果shuffle type选择正确，那么得分，否则扣分，分数为broadcast join和shuffle join的时间差