/Speech-Resources

语音方向实验室/公司/资源/实习等,欢迎推荐或自荐

Table of Contents generated with DocToc

Speech-Resource

语音方向实验室/公司/资源/实习等,欢迎推荐或自荐(排名不分先后)

国内高校

清华大学

电子工程系

  • 吴及:电子工程系副系主任,研究方向侧重于语音语言智能与医学结合
  • 张超:加入清华前为谷歌语音组Senior Research Scientist

电子工程系语音与音频技术实验室(SATLab)

  • 刘加:原实验室主任
  • 张卫强:实验室主任,语音识别、音频识别、音乐与声学信号处理

电子工程系语音处理与机器智能实验室(SPMI lab)

清华大学信息技术研究院语音和语言技术研究中心(CSLT)

该实验室以声纹识别为特色,对应北京得意音通公司。

计算机系

  • 贾珈:人机语音交互,偏向多媒体方向

清华大学人机语音交互实验室(THUHCSI)

北京大学

计算机科学技术研究所数字音频实验室

该实验室以多媒体音视频内容的检索与挖掘为主,很多内容涉及音频方向。

  • 陈晓鸥
  • 杨德顺

深圳研究生院现代信号与数据处理实验室(ADSPLAB)

  • 邹月娴

上海交通大学

计算机系跨媒体语言智能实验室(现X-Lance,前SpeechLab)

对应思必驰公司。

  • 俞凯:实验室主任,思必驰首席科学家,语音识别与合成,语音软硬件协同
  • 钱彦旻:实验室副主任,鲁棒性、多语言、低资源语音识别,Kaldi唯一的亚洲作者
  • 吴梦玥:语音感知与生成、多模态语音
  • 陈谐:端到端语音识别,加入交大前为微软语音组Principal Researcher

电子系未来媒体协同创新中心

  • 王钰

**科学院

自动化所模式识别国家重点实验室

  • 徐波
  • 陶建华
  • 刘文举
  • 刘斌

声学所

  • 颜永红

**科学技术大学

语音及语言信息处理国家工程实验室

对应科大讯飞,国内领先水平。

  • 刘庆峰

  • 胡郁

  • 戴礼荣

  • 王仁华

  • 陈恩红

  • 凌震华

  • 杜俊

西北工业大学

音频语音与语言处理研究组(ASLP)

智能声学与临境通信研究中心(CIAIC)

  • 陈景东:前贝尔实验室资深研究员,信号和信息处理做的很好

天津大学

智能与计算学部

  • 党建武
  • 王龙标

厦门大学

智能科学与技术系

  • 洪青阳:天聪智能创始人,主要研究语音识别、声纹识别

昆山杜克大学

大数据研究中心(SMIIPLab)

  • 李明

浙江大学

计算机科学与技术学院

  • 赵洲

哈尔滨工业大学

计算机科学与技术学院听觉智能研究中心

香港中文大学

Human-Computer Communications Laboratory (HCCL)

香港中文大学电子工程系

香港中文大学(深圳)数据科学学院

香港科技大学

计算机科学与工程系

香港理工大学

电子信息工程系

**大学

Speech Processing and Machine Learning Laboratory

海外高校

剑桥大学

Machine Intelligence Laboratory - Speech Research Group

  • Steve Young: The HTK book 一作

  • Phil Woodland

  • Mark Gales

牛津大学

Visual Geometry Group

  • Andrew Zisserman

爱丁堡大学

The Centre for Speech Technology Research

谢菲尔德大学

Speech and Hearing Group

蒙特利尔大学

Mila - Quebec AI Institute

麻省理工大学

MIT CSAIL

卡耐基梅隆大学

约翰霍普金斯大学

Center for Language and Speech Processing

  • Sanjeev Khudanpur

南加州大学

德克萨斯州大学达拉斯分校

罗切斯特大学

布尔诺理工大学

Faculty of Information Technology

  • Lukas Burget
  • Jan Cernocky

俄亥俄州立大学

新加坡国立大学

Human Language Technology Laboratory

南洋理工大学

新加坡科技设计大学

国立情报学研究所(Tokyo)

国内企业

  • MSRA-NLC组
  • MSRA-ML组
  • 腾讯AILAB语音技术中心
  • 腾讯天籁实验室
  • 阿里达摩院智能语音实验室
  • 阿里天猫精灵
  • 字节跳动SAMI组
  • 科大讯飞
  • 搜狗
  • 百度小度
  • 小米小爱
  • 小米k2
  • 思必驰
  • 云知声
  • 出门问问WeNet
  • 标贝科技

期刊&会议

  • TPAMI(IEEE Trans on Pattern Analysis and Machine Intelligence)
  • TASLP(IEEE Transactions on Audio, Speech, and Language Processing)
  • TSLP(ACM Transactions on Speech and Language Processing)
  • ICASSP(IEEE International Conference on Acoustics, Speech and Signal Processing)
  • INTERSPEECH(Conference of the International Speech Communication Association)
  • ASRU(IEEE Automatic Speech Recognition and Understanding Workshop)
  • SLT(IEEE Spoken Language Technology Workshop)
  • SPL(IEEE Signal Processing Letters)
  • ISCSLP(International Symposium on Chinese Spoken Language Processing)
  • JSLHR(Journal of Speech, Language, and Hearing Research)
  • Computer Speech and Language
  • Speaker Odyssey
  • JASA(Journal of the Acoustical Society of America)
  • Signal Processing
  • Speech Communication

竞赛

  • CHiME
  • VCC
  • DCASE
  • NIST SRE
  • Blizzard Challenge
  • OLR东方语种识别
  • VoxSRC

公众号

  • 语音杂谈

  • 谈谈语音技术

  • WeNet步行街

  • CCF语音对话与听觉专委会

  • 语音之家

  • 智能语音青年

  • 低调奋进

  • 新一代Kaldi

知乎专栏

谈谈语音技术

自监督语音识别

Kaldi源码解析

espnet--一个端到端语音识别工具箱

新一代Kaldi

常用资源

语音识别数据集汇总

语音识别 benchmark

语音预训练 paper list

语音合成 paper list

语音增强 paper list