2025年8月23日下午,新加坡南洋理工大学计算与数据科学学院副院长Weisi Lin教授做客“三元名家论坛”,在科技馆5208会议室为计控学院师生带来题为“大模型驱动的视觉与多媒体计算新机遇”的学术讲座。本次讲座由计控学院副院长郑强主持,学院相关科研人员、校外专家(包括武汉大学陈超锋、深圳大学岳广辉、西南大学刘运、青岛大学杨环、山东大学李峰等老师)及学院研究生代表共同参会。
报告中,Weisi Lin 教授指出,大模型正为视觉计算带来范式上的深刻变革。它不仅能够提供更强的通用表征能力,使视觉任务从依赖大规模标注数据逐步转向零样本和小样本学习,还通过跨模态对齐与语言知识融合,显著提升了对复杂场景的语义理解与推理能力。同时,大模型推动了视觉计算由“任务孤岛”走向“统一范式”,使分类、检测、分割、生成等多类任务能够在同一模型框架下实现,极大提高了灵活性与可扩展性。
此外,Weisi Lin 教授还分享了大模型在视觉与多媒体计算中的典型应用,例如文本辅助的遮挡物分割、核心数据集的选择、大模型驱动的美学图像质量评估,以及模型剪枝与量化等优化技术。他进一步展望了大模型时代的研究方向,强调未来应考虑扩展到更广义的多媒体范畴,涵盖嗅觉、触觉等新型感知模态。
专家简介:Weisi Lin,新加坡南洋理工大学计算与数据科学学院校长讲席教授,兼任该学院研究副院长。他是IEEE和IET Fellow,并多次被评为科睿唯安“高被引科学家”,荣获2023年南洋理工大学工学院研究奖。他曾担任IEEE TIP、IEEE TNNLS、IEEE TCSVT、IEEE TMM、IEEE SPL等期刊副主编,以及多个国际会议技术程序委员会主席以及担任2025年IEEE ICME联合大会主席。也即将担任2027年IEEE ICIP首席大会主席。2020年至2024年,他主持淡马锡基金会亚洲人工智能研究、教育与创新项目,研发的技术已成功应用于工业界的10多个主要系统。
作者:郑强 责任编辑:马文明 审核:段昕