2025年9月27日,由中国人工智能学会(CAAI)主办,CAAI智能光学成像专委会、电子科技大学信息与通信工程学院承办的“CAAI智能光学成像专委会工作会暨多媒体智能青年学者云论坛”将在线举办。论坛旨在响应国家人工智能发展策略,推动智能光学成像与多媒体智能领域的前沿研究,同时为青年学者提供学术交流与成长平台,并促进产学研合作与创新人才培养。


论坛组织者

邱荷茜
电子科技大学信息与通信工程学院副教授
个人简介:
硕士生导师,入选CSIG博士学位论文激励计划提名、首批四川省博新计划,中国博士后特别资助(站前)。从事多媒体智能信息处理方向研究,在IEEE Transactions、CVPR、ICCV等国际重要期刊和会议发表论文50余篇,获CVPR2024W最佳论文,CVPR2023亮点论文,ICIP2024 最佳论文候选。申请与授权国家发明专利25项。承担科技部2030新一代人工智能重大项目、国家自然科学基金联合基金重点、重点基金、青年基金、中国博士后科学基金等10余项项目。先后荣获吴文俊人工智能科技进步一等奖、中国航天大会思源联盟优秀成果以及多项国内外学术竞赛冠军等奖励。担任CAAI智能成像专委会委员、CSIG女工委委员、CSIG多媒体专委会委员等。

报告嘉宾

佃仁伟
湖南大学机器人学院教授
报告题目:高分辨率高光谱融合成像
报告摘要:高光谱成像是一种空-谱合一的颠覆性探测技术,能同时获取目标的几何空间信息和精细光谱信息,不仅能够感知目标的现状与颜色,还能够辨识目标的材质与成分,在国防安全、对地遥感等领域得到了广泛的应用。受制于成像原理与器件制造工艺,现有的高光谱成像时-空-谱分辨率相互制约,无法实现高空间分辨率高光谱视频成像。
针对上述问题,汇报人开展了高分辨率高光谱融合成像方法研究,并取得了一系列研究成果,成功研制了高分辨率高光谱视频相机。本次汇报将从①高分辨率高光谱时域融合成像模型;②高光谱结构化低秩张量表示模型;③模型引导的低秩张量融合成像网络三个方面出发,系统性的汇报高分辨率高光谱融合成像方面的进展。
个人简介:博士生导师,入选国家优青和博新计划。从事高光谱融合成像研究,以第一/通讯作者在IEEE TPAMI、IJCV、IEEE TIP和CVPR等权威期刊和会议上发表论文20余篇,其中ESI高被引论文8篇,授权发明专利16项,获得了国家自然科学二等奖(排2)、中国光学学会科技创新奖郭光灿光学奖、中国人工智能学会优秀青年奖、中国图象图形学学会优秀博士学位论文奖、粤港澳大湾区国际算法算例大赛一等奖和蚂蚁科技奖。
李亮
中国科学院计算所研究员
报告题目:跨模态细粒度理解与生成技术
报告摘要:随着预训练AI技术的发展,单一模态数据提供的信息已不能满足提升AI模型认知能力的需求。与人类利用视觉、听觉、触觉等多种感官信息来感知世界类似,机器也需要多模态信息来提升认知水平。随着多模态数据的爆发和计算能力的提升,研究人员已提出大量方法来探索利用多模态信息。本此报告将围绕跨模态细粒度理解与生成主题,深入探讨文本语言、图像、音频等模态的可控生成技术,并分享对以生成数据为中心的人工智能范式的一些探索。
个人简介:博士生导师,国家优秀青年基金获得者。研究领域为生成式人工智能、计算机视觉和多模态学习,发表TPAMI等CCF-A类期刊和会议论文80余篇,谷歌引用5600余次,获国际会议最佳论文奖4次(包括CCF-A类会议ACM MM2024最佳论文奖),6项工作入选ESI高被引论文;主持/参与科技部科技创新2030重大项目、973课题、NSFC优青/面上/青年项目等20余项,担任中国科学院1区国际期刊IEEE TMM等编委,国际会议ACL/EMNLP/NAACL高级领域主席,NeurIPS/ICLR/AAAI/ACM MM领域主席, 7次领域国际会议和6次国内会议的组织主席。获2025年教育部科学研究优秀成果奖工程技术一等奖、2024年中国图象图形学学会青年科学家奖、2022年浙江省科技进步一等奖、2020年吴文俊人工智能自然科学一等奖、2013年中国科学院院长奖。相关技术在华为、淘宝、大华、华数传媒等公司使用,服务于2022北京冬奥会等任务。
马超
上海交通大学人工智能研究院教授
报告题目: 多模态场景理解和生成
报告摘要: 多模态场景理解与生成是计算机视觉的核心与热点问题,本报告面向自动驾驶任务,介绍多模态大模型理解与生成任务的最新进展,汇报如何提高多模态大模型对复杂场景里目标的指代推理能力,以及如何实现多种输入条件下统一的多模态大模型可控场景生成。
个人简介:博士生导师。上海市浦江人才、中国图象图形学学会优博。上海交通大学与加州大学默塞德分校联合培养博士。澳大利亚机器人视觉研究中心(阿德莱德大学)博士后研究员。主要研究计算机视觉问题。谷歌学术引用1万4千余次,连续五年入选爱思唯尔中国高被引学者(2020-2024)。任中国图象图形学学会优博俱乐部主席、青年工作委员会副秘书长。担任CVPR 2024/2025、ICCV 2025、ICLR 2025、AAAI 2026等会议领域主席,IEEE Trans. on Multimedia (TMM)、Journal of Artificial Intelligence Research (JAIR)编委。主持自然基金委青年项目(B类)。获中国图象图形学学会青年科学家奖、第30届多媒体建模会议(MMM 2024)唯一最佳论文奖、华为技术合作领域2021年度优秀技术成果奖。
邓欣
北京航空航天大学电子信息工程学院副教授
报告题目:稀疏驱动的多模态图像智能处理
报告摘要:近年来,多模态图像处理在遥感、医疗成像和自动驾驶等领域应用广泛,不同成像模态可提供互补信息,但其差异性也为联合处理带来了严峻挑战。尽管传统深度学习方法性能出色,却往往缺乏可解释性,被视为“黑箱”模型。稀疏建模能够有效捕捉图像本质特征,为多模态数据提供了一种数学基础良好的耦合表示方式。基于此,本次报告介绍了我们近期在基于稀疏建模的多模态可解释网络方面的探索性工作。通过构建多模态耦合稀疏表征模型,将稀疏先验嵌入至网络架构设计中,使整体模型与其各个模块均具备明确的物理解释,从而推动神经网络从“被动理解”向“主动设计”转变。该方法在多模态图像配准、融合与目标检测等任务中取得了优异性能,显示出稀疏驱动的多模态模型在实际应用中的潜力与价值。
个人简介:博士生导师,国家级青年人才。研究领域为多模态图像处理和可解释性神经网络,在人工智能顶级期刊TPAMI、图像处理顶级期刊TIP,计算机视觉领域顶级会议ICCV、CVPR等发表论文60余篇,获2023年度北京市自然科学一等奖(排2)、第13届吴文俊人工智能自然科学一等奖(排2)。在个人荣誉方面,入选2025年度北京市科技新星,获第14届吴文俊人工智能青年科技奖、2021年度中国图象图形学学会石青云女科学家奖,2021年度英国 Eryl Cadwallader Davies Prize、入选斯坦福大学全球前2%顶尖科学家。担任CSIG宣传工作委员会秘书长,CCF多媒体技术专业委员会执行委员、CSIG图像视频通信专业委员会委员,VALSE执行委员等。

欢迎扫码参会
本文由CAAI智能光学成像专委会供稿
