machine_learning_resource

神经网络模型的网络结构参数从 https://github.com/fchollet/deep-learning-models/releases 下载拷贝到C:\Users\XXX.keras\models 使用

数据集

CV数据集

MS-Celeb-1M 数据集
MS-Celeb-1M 是微软的一个非常大的人脸识别数据库，它是从名人榜上选择前100万的名人，然后通过搜索引擎采集每个名人大约100张人脸图片而形成的。
官方下载地址
Adience 数据集
Adience 数据集包含26580张图片，总共含有2284类，涉及的年龄范围有8个区段（0～2、4～6、8～13、15～20、25～32、38～43、48～53、60～），并且这个数据集含有噪声、姿势、光照等变化，尽可能真实地反映现实世界
官方下载地址

NLP数据集

VCTK-Corpus数据集(10G) VCTK-Corpus数据集可用来训练声纹识别，ASR；数据集中包含说话人（ID、年龄、性别、国家、地区),录音wav文件，说话内容txt文件。
(官方下载地址) (下载地址1) (百度网盘(ix2j))

[http://www.openslr.org/resources.php系列英语数据集 start]

Yesno
一个人用希伯来语记录是或否的60个录音; 每个录音长八个字。
官方下载地址
Vystadial
英语和捷克语数据，来自Vystadial项目
官方下载地址
TED-LIUM（21G）
来自TED讲座的英语语音识别训练语料库，由缅因州大学信息实验室（LIUM）创建
官方下载地址
TED-LIUMv2
TED-LIUM语料库发布2，来自TED讲座的英语语音识别训练语料库，由缅因州大学信息实验室（LIUM）创建（在这里镜像）
官方下载地址
TED-LIUM Release 3
TED-LIUM corpus release 3
官方下载地址
LibriSpeech language models, vocabulary and G2P models
语言建模资源，用于LibriSpeech ASR语料库
官方下载地址
libriSpeech_ASR_corpus数据集
该数据集是包含大约1000小时的英语语音的大型语料库。这些数据来自LibriVox项目的有声读物。它已被分割并正确对齐，如果你正在寻找一个起点，请查看已准备好的声学模型，这些模型在kaldi-asr.org和语言模型上进行了训练，适合评估。
官方下载地址
Mini LibriSpeech ASR corpus数据集
用于回归测试的一个LibriSpeech ASR corpus子集
官方下载地址
Free ST American English Corpus 由Surfingtech（www.surfing.ai）提供的免费美式英语语料库，包含来自10位发言者的话语，每位发言者约有350个话语
 官方下载地址
THCHS-30(中文)
THCHS-30是在安静的办公室环境下，通过单个碳粒麦克风录取的，总时长超过30个小时。大部分参与录音的人员是会说流利普通话的大学生。采样频率16kHz，采样大小16bits。
THCHS-30的文本选取自大容量的新闻，目的是为了扩充863语音库。我们选取1000句来录音。
官方下载地址
Aishell（中文）普通话数据，由北京贝壳科技有限公司提供
录音时长178小时；录音文本涉及智能家居、无人驾驶、工业生产等11个领域；录制过程在安静室内环境中；同时使用3种不同设备：高保真麦克风（44.1kHz，16-bit），Android系统手机（16kHz，16-bit），iOS系统手机（16kHz，16-bit），高保真麦克风录制的音频降采样为16kHz，用于制作AISHELL-ASR0009-OS1；400名来自**不同口音区域的发言人参与录制。经过专业语音校对人员转写标注，并通过严格质量检验，此数据库文本正确率在95%以上。分为训练集、开发集、测试集。
官方下载地址
Free ST Chinese Mandarin Corpus（中文）
由Surfingtech（www.surfing.ai）提供的免费中文普通话语料库，包含855位发言者的话语，102600个话语;
官方下载地址
Primewords Chinese Corpus Set 1(中文)
上海Primewords有限公司（www.primewords.cn）发布的中文普通话语料库，包含100小时的语音数据
 官方下载地址

[http://www.openslr.org/resources.php系列英语数据集 end]

VoxForge
该数据集是带口音的语音清洁数据集，对测试模型在不同重音或语调下的鲁棒性非常有用。 http://www.voxforge.org/
官方下载地址
TIMIT数据集
TIMIT数据集是来自美国630个人每个人说十个给定的句子，每一个句子都有标记
百度云(95k2)
voxceleb 官方下载地址
CN-Celeb

包含1,000名**明星（包括歌星、影星、说唱艺人等）在采访、歌舞及影视作品中的声音片段。这些片段全部由视频网站经过自动化处理程序提取，并通过人工校验得到。每位明星的声音时长约20分钟，整个数据集近300小时。该数据包含了11类实际场景，覆盖了噪音、信道、发音方式等各方面的复杂性，特别适用于研究复杂场景下的说话人识别技术。

资讯

官方下载地址

user-ZJ/machine_learning_resource

machine_learning_resource

数据集

CV数据集

NLP数据集