温正棋-清华大学信息国家研究中心

温正棋副研究员

Email : zqwen@tsinghua.edu.cn
地址：北京市海淀区清华大学FIT楼

教育背景

2008年9月-2013年7月中国科学院大学自动化研究所模式识别国家重点实验室模式识别与智能系统硕博连读

2004年9月-2008年7月中国科学技术大学自动化系自动化本科

工作履历

2024年9月-至今清华大学信息国家研究中心副研究员

2016年11-2022年5月中科院自动化研究所副研究员

2013年7月-2016年10月中科院自动化研究所助理研究员

学术兼职

中国图形图像学会人机交互专委会秘书长，中国计算机学会语音听觉专委会委员

研究领域

（1）智能信息处理；

（2）认知决策智能；

（3）智能语音处理。

研究概况

主要研究方向智能信息处理，先后负责和参与了国家级项目（863计划、国家自然科学基金、科技部重点研发计划）和企业级项目20余项，在国内外学术重要期刊和会议上发表论文90余篇，申请国内发明专利20余项，论文2015、2017和2019年连续三次获得全国人机语音通信会议最佳学术论文奖、2019年全国信号处理优秀论文奖等，产品应用在腾讯、百度、华为等四十余家大型跨国公司产品中，在云平台、智能手机和导航设备中获得广泛的应用。

奖励与荣誉

（1）荣获中国电子学会科技进步一等奖（2024）；

（2）荣获中国人工智能学会吴文俊人工智能技术发明特等奖（2023）；

（3）天津市科学技术进步一等奖（2023）；

（4）中国电子学会科技进步一等奖（2018）；

（5）北京市科技进度二等奖（2014）。

学术成果

（1）发表论文：

[1] Language-Adversarial Transfer Learning for Low-Resource Speech Recognition.IEEE ACM Trans. Audio Speech Lang. Process. 2019.27(3) :621-630 Jiangyan Yi, Jianhua Tao, Zhengqi Wen, Ye Bai;

Forward-Backward Decoding Sequence for Regularizing End-to-End TTS.IEEE ACM Trans. Audio Speech Lang. Process.2019.27(12) : 2067-2079 Yibin Zheng, Jianhua Tao, Zhengqi Wen, Jiangyan Yi;

[2] End-to-End Post-Filter for Speech Separation With Deep Attention Fusion Features.IEEE ACM Trans. Audio Speech Lang. Process.2020 28: 1303-1314 Cunhang Fan, Jianhua Tao, Bin Liu, Jiangyan Yi, Zhengqi Wen, Xuefei Liu;

[3] Bi-Level Style and Prosody Decoupling Modeling for Personalized End-to-End Speech Synthesis. ICASSP 2021: 6568-6572 Ruibo Fu, Jianhua Tao, Zhengqi Wen, Jiangyan Yi, Tao Wang, Chunyu Qiang;

[4] Fast End-to-End Speech Recognition Via Non-Autoregressive Models and Cross-Modal Knowledge Transferring From BERT. IEEE ACM Trans. Audio Speech Lang.Process.2021. 29: 1897-1911 Ye Bai, Jiangyan Yi, Jianhua Tao, Zhengkun Tian, Zhengqi Wen, Shuai Zhang;

[5] Integrating Knowledge Into End-to-End Speech Recognition From External Text-Only Data. IEEE ACM Trans. Audio Speech Lang. Process. 2021.29: 1340-1351 Ye Bai, Jiangyan Yi, Jianhua Tao, Zhengqi Wen, Zhengkun Tian, Shuai Zhang;

[6] Gated Recurrent Fusion With Joint Training Framework for Robust End-to-End Speech Recognition. IEEE ACM Trans. Audio Speech Lang.Process. 2021 29: 198-209 Cunhang Fan, Jiangyan Yi, Jianhua Tao, Zhengkun Tian, Bin Liu, Zhengqi Wen;

[7] CampNet: Context-Aware Mask Prediction for End-to-End Text-Based Speech Editing. IEEE ACM Trans. Audio Speech Lang. Process.2022 30: 2241-2254，Tao Wang, Jiangyan Yi, Ruibo Fu, Jianhua Tao, Zhengqi Wen;

[8] Hybrid Autoregressive and Non-Autoregressive Transformer Models for Speech Recognition IEEE Signal Process.2022. Lett.29: 762-766 Zhengkun Tian, Jiangyan Yi, Jianhua Tao, Shuai Zhang, Zhengqi Wen;

[9] NeuralDPS: Neural Deterministic Plus Stochastic Model With Multiband Excitation for Noise-Controllable Waveform Generation. IEEE ACM Trans. Audio Speech Lang. Process.2022 30: 865-878 Tao Wang, Ruibo Fu, Jiangyan Yi, Jianhua Tao, Zhengqi Wen.

（2）授权专利：

[1] 基于逆滤波的谐波噪声激励模型声码器中国、ZL201110140269.6、2012.10.03

[2] 一种基于自注意力机制的流式语音转写系统中国、ZL201910850127.5、2021.11.5

[3] 一种单通道语音分离系统中国、ZL2019108665008.7、2021.11.12

[4] 一种基于知识迁移的序列到序列语音识别模型训练方法中国、ZL2019 1 0866156.0、2022.1.11

[5] 基于门控递归融合深度嵌入式特征的多通道语音分离系统中国 ZL202010985342.9 、2022.3.1

[6] 基于触发式非自回归模型的语音识别方法及系统中国、ZL202010987375.7、2022.3.1

[7] 基于自回归网络的非平行语料语音转换方法及系统中国、ZL202011161519.x、2022.3.18

[8] 基于前馈神经网络的低延时语音识别模型及训练方法中国 ZL202010988191.2、2022.5.6