undefined

邢春晓 研究员

可信软件与大数据研究部 大数据驱动的知识管理和决策团队

通信地址:北京市海淀区清华大学FIT楼1-311

联系电话:010-62798998

Email:xingcx@tsinghua.edu.cn

教育背景

1986.09-1990.07 北京航天航空大学 制造工程系计算机辅助设计与制造专业 本科

1992.09-1995.07 西北大学 计算机科学系计算机软件专业 硕士

1995.09-1999.09 西北工业大学 自动控制系智能控制/计算机控制专业 博士

1999.10-2002.01 清华大学 计算机科学与技术系 博士后

工作履历

2003.10-2008.11 清华大学 信息技术研究院 副研究员

2008.12-2019.10 清华大学 信息技术研究院 研究员

2019.11至今 清华大学 北京信息科学与技术国家研究中心 研究员

2003.10-至今 清华大学信息技术研究院WEB与软件技术研究中心 主任

2010.07-2016.01 清华大学 信息技术研究院 院长助理

2016.02至今 清华大学 信息技术研究院 副院长

学术兼职

2012.12至今 中国计算机学会信息系统专委会 副主任

2016.07至今 中关村区块链产业联盟 副理事长

2017.12至今 中国医疗保健国际交流促进会健康大数据和数字化医疗分会 副主任

2018.10至今 中国电子学会区块链分会 副会长

2019.06至今 中国医师协会智慧医疗分会 委员

研究领域

主要研究领域:数据库和数据仓库,大数据和知识工程,人工智能,软件工程,区块链技术,智慧医疗、智慧城市、数字图书馆和电子政务关键技术研究等。

研究概况

提出了一个支持海量数字资源服务和管理系统(DRMS)多层体系结构,该框架满足大规模数字资源分布、动态、海量、异构的特点,提供了一个面向互联网具有自主知识产权的基础软件支撑平台,发表了国内首篇数字图书馆博士论文及博士后出站报告,为国家数字图书馆的总体设计和建设实施提供了重要技术支撑。针对组合WEB服务的可信软件验证问题,提出了Web服务接口控制流自动机WCFA形式化模型, 该模型可以对Web服务的接口进行建模,并可进行形式化验证。基于领域分类模型上的概率分布,提出一种新的用户兴趣表达、相似性计算和用户兴趣更新的方法;针对协作过滤中数据稀疏性问题,提出了用户权威性和资源流行性以及全局权威性和领域权威性的概念,分别反映用户评价的稳定性和资源受欢迎的程度,发表了国内首篇WWW2003顶级国际学术会议论文。

针对电子政务应用的总体规划和顶层设计方面,提出了一个政府信息化架构(GIA),包括它科学理论方法、技术支撑体系、分层参考模型以及标准规范等;主持并编制了国家电子政务信息资源目录体系和交换体系标准,GIA已经成为国家信息化总体架构的重要参考,目录体系已成为国家标准。

提出了面向大数据管理和分析的LCUKS模型,研制的国内首款列式存储数据库-华鼎数据库(Huabase)是具有自主知识产权的基于列存储的关系型数据库管理系统,解决了数据压缩、按需读取和稀疏索引、数据对象模型、全生命周期管理、对象溯源、个性化推荐等一批核心关键技术,在非结构化数据组织、数据分布、数据加载和并行查询等方面有突出创新;针对集合近似搜索、集合近似连接、近似查询处理和空间文本搜索等分析性查询,基于索引、数据变换、复用、产生式等技术及SSD和SGX等新硬件,提出了创新的方法,显著提高了检索的效率,同时保证了在云环境下的数据的安全性,系统在基于列存储的数据库管理系统的架构设计和关键技术实现上达到了同类技术国际领先水平。

针对医疗健康大数据异构、自治、复杂、演化挑战和大数据管理和决策的重大需求,提出了可信高效智能大数据驱动的知识表示、管理、融合、推理方法及关键技术创新,建立基于知识图谱的医疗健康辅助决策原型系统,研究了医疗健康数据的分类和预测问题,深入挖掘数据内部特征,并结合领域知识、社会关系等的支持,提出了新的深度学习的框架及相应算法,显著提高了分类和预测结果的准确性,并针对心血管领域,研究了实体抽取、关系抽取和健康知识图谱构建的方法。医疗健康大数据管理和融合方法有明显突破,知识图谱构建技术有显著创新,语义分析、知识发现、大数据共享进行了自主创新,达到同类技术国际领先水平。

学术成果

主持国家自然科学基金重点项目、国家 973 项目课题、国家 863 重点项目、重大横向3项目。发表学术论文350余篇,其中SCI 40余篇、EI 200余篇(SCI他引172次,SCOPUS他引636次),软件著作权40余项,获得发明专利25项,教育部科技成果1项,论著和译著9部(包括合著)。

人才培养

培养硕士研究生40余人、指导博士生10余人、指导博士后10余人。