undefined

张勇 副研究员

可信软件与大数据研究部 大数据驱动的知识管理和决策团队

通信地址:北京市海淀区清华大学FIT楼1-310

联系电话:010-62772704

Email:zhangyong05@tsinghua.edu.cn

教育背景

1992.09–1997.07 清华大学计算机科学与技术系 计算机科学与技术 学士

1997.09–2002.07 清华大学计算机科学与技术系 计算机软件与理论 博士

工作履历

2002.08-2005.07 剑桥大学e-Science中心 博士后

2005.12-2019.01 清华大学 信息技术研究院 副研究员

2019.02-2019.10 清华大学 信息学院 副研究员

2019.11至今 清华大学 北京信息科学与技术国家研究中心 副研究员

学术兼职

2006.07-现在 中国计算机学会高级会员

2011.11-现在 中国计算机学会信息系统专委会委员

2001.01-现在 IEEE会员

TKDD、WWWJ、TMIS、FCS、CMPB、BDR、CMBJ、IMU、CI、ACI等国际期刊的审稿人

中国科学、软件学报、清华大学学报等国内核心期刊的审稿人

DASFAA、ICC、WAIM、COMPSAC、SEKE、HealthCom、ICSH等国际会议的审稿人

研究领域

数据库,大数据管理与分析,智慧健康

研究概况

1)面向大数据分析的高效查询的关键技术研究

(a)对分析型查询的优化:在集合相似性搜索方面,首次提出了采用B+树和将集合变换为矢量的方法,将搜索速度提高了2-10倍;在集合相似性连接方面,首次提出了分布采样和生成式的方法,将速度提高了1-2个数量级,而且保证了错误有界;在近似查询处理方面,首次提出了统一提要的方法,将存储量减少了1-2个数量级,在线速度提高了数倍;在空间文本查询方面,首次提出了结合空间文本的层次化索引结构,将速度提高了2个数量级。以上研究成果均发表在中国计算机系学会认定的A类会议或期刊上。

(b)新硬件:针对SSD和SGX等新硬件,提出了创新的方法,显著提高了检索的效率,同时保证了在云环境下数据的安全性。相关成果发表在中国计算机系学会认定的重要会议或期刊上。

2)医疗健康大数据管理的关键技术研究

(a)医疗健康大数据处理;在文档分类方面,首次提出了将文档内部结构与多任务学习相结合的方法,将准确度提高了2-7个百分点;在情感分类方面,提出了基于社会关系和MF-CNN的方法,将准确度提高了4个百分点;针对医疗花费,提出了基于概率生成模型的方法,将F1提高了5个百分点;在垃圾健康信息检测方面,利用多种特征和DBN,使F1达到了86%。相关成果分别发表在中国计算机系学会认定的A类或重要国际会议上。

(b)医疗健康知识图谱构建:分别针对中文在线问诊数据和中文电子病历数据,研究了命名实体识别和关系抽取,提出了基于健康词典、特征选择和CRF的实体方法,以及基于CRF、CNN和特征选择的关系抽取方法。相关成果分别发表在医疗健康相关的重要的国际会议上。

3)华鼎大数据管理和分析平台研发及应用

该平台面向行业大数据,提供了海量数据管理、快速检索和可配置分析,目前已经应用到同方股份、河北心神、北京倍肯和安贞医院等单位。以该平台为核心研发了区域医疗资源共享平台,已经在鞍山、锦州、哈尔滨、南宁等地区的医院得到了应用,有效的降低了死亡率,产生了较好的社会影响。

奖励与荣誉

1. 自2006年开始担任信研院Web与软件中心副主任,负责中心科研、外事和安全。Web与软件中心分别于2006年、2009年、2012年被提名校工会先进小组,于2014年获校工会先进小组,于2009年被提名校先进集体。

2. 2015.09至今担任信研院党支部副书记,信研院党支部获得2017年清华大学优秀党支部称号,2018年10月荣获清华大学第一批党建标兵支部创建单位,全校一共有10个教师党支部被授牌。

3. 荣获清华大学先进个人1次,信研院先进个人2次。

学术成果

在国内外重要期刊和会议,包括TKDE、ICDE、VLDB Journal、IJCAI、DASFAA、计算机学报、软件学报、物理学报等发表论文160余篇,其中EI检索130余篇,SCI检索10余篇,获得发明专利17项。近五年Google学术引用527次,h指数12,i10指数17。论文列表见:https://dagege.github.io/

人才培养

1. 课堂教学

在课堂教学与课程体系建设方面,作为主讲教师,于2011独立开设面向全校留学生的公选理论课程《软件项目管理过程与方法》(英文教学,每学年48学时),与邢春晓老师于2008合开面向研究生的公选理论课程《软件项目管理》(每学年48学时,本人承担24学时)。在课程中,重视理论与实际相结合,组织学生到具有先进管理理念的IT公司进行参观交流,包括谷歌、百度、微软、IBM等公司。此外,分别于2008年和2015年与邢春晓老师一起翻译了美国Kathy Schwalbe教授的经典教材《IT项目管理》。

2. 学生指导

所指导的2011级硕士生马鹏斐获得2014清华大学启航奖金奖,通过选调生招录,回到家乡宁夏工作,现任通贵乡乡长。所指导的2016级硕士生李秀星和2017级硕士生杨俊晔分别获得2018和2019年计算机系“西贝尔学者”奖学金(全校金额最高的奖学金)。