Dzg0309 opened this issue a year ago · 1 comments
网上说本次开源了部分高质量训练数据 500GB(约100Btoken),请问数据开源在了什么地方?谢谢~
请参考:https://huggingface.co/datasets/wenge-research/yayi2_pretrain_data