5月22日上午,“下一代人工智能研讨会及技术论坛”在信息科学技术大楼举办。英国皇家工程院院士、萨里大学教授Josef Kittler,江南大学二级教授吴小俊等专家应邀作专题报告。国家自然科学基金委员会刘克研究员、北京航空航天大学李波教授、中国科学院自动化研究所徐常胜研究员、重庆邮电大学韩军伟教授、北京科技大学刘红敏教授等专家学者出席活动。清华大学信息国家研究中心类脑智能技术交叉创新群体负责人韩军功教授和群体核心成员刘烨斌教授分别主持会议,来自校内外的50余名师生参加了本次活动。

活动现场
Josef Kittler教授作了题为《Theoretical underpinning of Self-supervised learning by clustering》的报告。报告围绕聚类的自监督学习理论展开,系统介绍了团队近期在自监督学习理论基础方面的研究进展。报告将学习问题形式化为KL散度优化问题,从而推导出以数学原理为基础的学生网络与教师网络更新机制,并进一步提出了基于逆聚类先验的教师分布归一化方法,为理解自监督学习机制及其未来发展提供了新的理论支撑。
吴小俊教授作了题为《黎曼流形上的深度学习》的报告。报告系统阐述了在黎曼流形上构建深度学习算法的基本思想与实现方案,同时分享了团队将欧氏空间中的分类器、注意力机制等推广至黎曼流形的研究成果,验证了基于黎曼流形的建模能够更有效地捕捉多模态输入的关键信息。他还介绍了团队最近出版的专著《黎曼流形上的智能优化与深度学习》,是全球首部系统论述黎曼流形深度学习的学术专著。
在青年学者报告环节,群体青年教师和科研人员围绕各自研究方向分享了最新工作,并与在场专家进行了充分交流。
清华大学软件学院徐枫副教授作了题为《初探医学人工智能的数据挑战》的报告,围绕医学人工智能研究中数据获取难、隐私保护要求高等关键问题进行了介绍。清华大学自动化系封硕副教授作了题为《自动驾驶汽车安全性加速测试与可持续优化》的报告,围绕自动驾驶安全性评估中的关键科学问题展开分享。清华大学信息国家研究中心陈辉助理研究员作了题为《资源受限下高效视觉理解关键技术》的报告,围绕资源受限条件下视觉模型高效推理关键问题开展一系列研究,构建了“轻量模型设计—通用能力增强—高效端侧部署”的全链条技术闭环。针对当前视觉模型在开放场景中面临的泛化性不足挑战,他重点分享了团队在模型结构设计、开放视觉理解和模型压缩优化方面的研究进展。清华大学自动化系博士后段皓然作了题为《面向具身VLA的语义表征、因果泛化与高效适配》的报告,围绕韩军功教授团队近期在具身智能中视觉—语言—动作模型(VLA)的研究工作展开介绍。
韩军功教授作总结发言。他表示,本次活动创新交流形式,设置了青年教师汇报、专家现场点评环节。与会专家提出大量具有针对性、建设性和启发性的指导意见,有效助力青年学者开阔思路、发现问题、加快成长,也为群体今后持续开展高质量学术交流活动积累了宝贵经验。
供稿 | 类脑智能技术交叉创新群体
编排 | 李琳
审核 | 陈文华 王钰言