- 本程序需要安装PyTorch;
- 安装其它依赖: pip install torchnet pip install Flask
我们已经完成了诗词数据的预处理工作,并提供了一个NumPy的压缩包data/tang.npz
,里面包含三个对象。
- data:形为(57598, 125)的NumPy数组,总共有57598首诗词,每首诗词长度为125字符(不足125的补空格,超过125的丢弃)。
- word2ix:每个字和它对应的序号,例如”春“这个字对应的序号是1000。
- ix2word:每个序号和它对应的字,例如序号1000对应着“春”这个字。