温正棋副研究员

  • Email : zqwen@tsinghua.edu.cn
  • 电话:15001385087
  • 地址:北京市海淀区清华大学FIT楼
教育背景

2008年9月-2013年7月 中国科学院大学 自动化研究所模式识别国家重点实验室 模式识别与智能系统 硕博连读

2004年9月-2008年7月 中国科学技术大学 自动化系 自动化 本科

工作履历

2024年9月-至今 清华大学信息国家研究中心 副研究员

2016年11-2022年5月 中科院自动化研究所 副研究员

2013年7月-2016年10月 中科院自动化研究所 助理研究员

学术兼职

中国图形图像学会人机交互专委会秘书长,中国计算机学会语音听觉专委会委员

研究领域

(1)智能信息处理;

(2)认知决策智能;

(3)智能语音处理。

研究概况

主要研究方向智能信息处理,先后负责和参与了国家级项目(863计划、国家自然科学基金、科技部重点研发计划)和企业级项目20余项,在国内外学术重要期刊和会议上发表论文90余篇,申请国内发明专利20余项,论文2015、2017和2019年连续三次获得全国人机语音通信会议最佳学术论文奖、2019年全国信号处理优秀论文奖等,产品应用在腾讯、百度、华为等四十余家大型跨国公司产品中,在云平台、智能手机和导航设备中获得广泛的应用。

奖励与荣誉

(1)荣获中国电子学会科技进步一等奖(2024);

(2)荣获中国人工智能学会吴文俊人工智能技术发明特等奖(2023);

(3)天津市科学技术进步一等奖(2023);

(4)中国电子学会科技进步一等奖(2018);

(5)北京市科技进度二等奖(2014)。

学术成果

(1)发表论文:

[1] Language-Adversarial Transfer Learning for Low-Resource Speech Recognition.IEEE ACM Trans. Audio Speech Lang. Process. 2019.27(3) :621-630 Jiangyan Yi, Jianhua Tao, Zhengqi Wen, Ye Bai;

Forward-Backward Decoding Sequence for Regularizing End-to-End TTS.IEEE ACM Trans. Audio Speech Lang. Process.2019.27(12) :  2067-2079 Yibin Zheng, Jianhua Tao, Zhengqi Wen, Jiangyan Yi;

[2] End-to-End Post-Filter for Speech Separation With Deep Attention Fusion Features.IEEE ACM Trans. Audio Speech Lang. Process.2020 28: 1303-1314 Cunhang Fan, Jianhua Tao, Bin Liu, Jiangyan Yi, Zhengqi Wen, Xuefei Liu;

[3] Bi-Level Style and Prosody Decoupling Modeling for Personalized End-to-End Speech Synthesis. ICASSP 2021: 6568-6572 Ruibo Fu, Jianhua Tao, Zhengqi Wen, Jiangyan Yi, Tao Wang, Chunyu Qiang;

[4] Fast End-to-End Speech Recognition Via Non-Autoregressive Models and Cross-Modal Knowledge Transferring From BERT. IEEE ACM Trans. Audio Speech Lang.Process.2021. 29: 1897-1911 Ye Bai, Jiangyan Yi, Jianhua Tao, Zhengkun Tian, Zhengqi Wen, Shuai Zhang;

[5] Integrating Knowledge Into End-to-End Speech Recognition From External Text-Only Data. IEEE ACM Trans. Audio Speech Lang. Process. 2021.29: 1340-1351 Ye Bai, Jiangyan Yi, Jianhua Tao, Zhengqi Wen, Zhengkun Tian, Shuai Zhang;

[6] Gated Recurrent Fusion With Joint Training Framework for Robust End-to-End Speech Recognition. IEEE ACM Trans. Audio Speech Lang.Process. 2021 29: 198-209 Cunhang Fan, Jiangyan Yi, Jianhua Tao, Zhengkun Tian, Bin Liu, Zhengqi Wen;

[7] CampNet: Context-Aware Mask Prediction for End-to-End Text-Based Speech Editing. IEEE ACM Trans. Audio Speech Lang. Process.2022 30: 2241-2254,Tao Wang, Jiangyan Yi, Ruibo Fu, Jianhua Tao, Zhengqi Wen;

[8] Hybrid Autoregressive and Non-Autoregressive Transformer Models for Speech Recognition IEEE Signal Process.2022. Lett.29: 762-766 Zhengkun Tian, Jiangyan Yi, Jianhua Tao, Shuai Zhang, Zhengqi Wen;

[9] NeuralDPS: Neural Deterministic Plus Stochastic Model With Multiband Excitation for Noise-Controllable Waveform Generation. IEEE ACM Trans. Audio Speech Lang. Process.2022 30: 865-878  Tao Wang, Ruibo Fu, Jiangyan Yi, Jianhua Tao, Zhengqi Wen.

(2)授权专利:

[1] 基于逆滤波的谐波噪声激励模型声码器 中国、ZL201110140269.6、2012.10.03

[2] 一种基于自注意力机制的流式语音转写系统 中国、ZL201910850127.5、2021.11.5

[3] 一种单通道语音分离系统 中国、ZL2019108665008.7、2021.11.12

[4] 一种基于知识迁移的序列到序 列语音识别模型训练方法 中国、ZL2019 1 0866156.0、2022.1.11

[5] 基于门控递归融合深度嵌入式特征的多通道语音分离系统 中国 ZL202010985342.9 、2022.3.1

[6] 基于触发式非自回归模型的语音识别方法及系统 中国、ZL202010987375.7、2022.3.1

[7] 基于自回归网络的非平行语料语音转换方法及系统 中国、ZL202011161519.x、2022.3.18

[8] 基于前馈神经网络的低延时语音识别模型及训练方法 中国 ZL202010988191.2、2022.5.6