2017-5-26
获取oyez所有年份的字幕文件,对应的音频和切割音频的时间点
oyez一个美国案列的网站, 里面有案列视频和字幕
1.getTermsByYear来获取每年的数据 2.getDetails获取每一个的详情 3.getTxtAudio 获取最终需要的txt,音频等
依次执行,一个获取完再获取两外一个
json 放置音频的详细信息(包括字幕, 切割音频的信息) mp3 放置音频 txt 放置字幕文件 mp3.list 存放数据的音频下载地址
下载音频利用下载工具(迅雷,BitComet,电驴等)批量下载data下的mp3.list文件
- 部分带两个音频的数据只取了第一个
- 网站原始数据部分有音频没有字幕
- 2016年的txt和json数据获取分别存储到一个文件中了,音频正常
- 由于所有的写文件都是追加的方式,每次执行都是追加到原来的文件上,因此重新获取清除data terms details下面的文件,但不是文件目录