2020年7月27日下午15:00,应我院学术团队邀请,中国人民大学高领人工智能研究院刘勇副研究员在学院二楼会议室6205做了题为“核K-means及其统计误差分析”的报告。我院学术团队骨干教师,部分研究生参加了报告会。
报告结束后,刘勇副研究员还与我院师生进行了深入的交流与探讨,对部分教师和研究生所提出的一些问题进行了探讨,特别是站在审稿人的角度对研究生撰写的论文的格式,论文的理论分析和实验分析进行了一些深入交流,双方积极的互动,使得我院师生对理论和算法关系有了更深的认识,同时提高了老师和研究生加强理论学习的动力!
报告摘要:核K-means是当前最流行的无监督学习算法之一,在工业和学术界得到广泛应用和关注。但核K-means统计误差分析还缺乏深入研究,特别在泛化误差分析研究领域还处于初级阶段。报告首先从理论研究在计算机研究中的重要性出发,提出基于统计学习理论来分析常见的无监督学习算法,如聚类算的性能是很有必要。随后基于改进的聚类Rademacher复杂度分析,报告首次给出了核K-means最优泛化误差界。在此基于上,报告进一步研究了基于Nystrom的近似核K-means的统计性质,并证明在满足一定限制条件下,基于Nystrom的近似核K-means方法能保证其最优统计性能。最后,报告给出了所提出的理论结果的应用展望,即可以分析其他的聚类方法如谱聚类,其他无监督学习方法,如矩阵分解算法的理论性能。
报告人简介:刘勇,中国人民大学,副研究员,博导。长期从事大规模机器学习、模型选择研究,共发表论文30余篇,其中以第一作者/通讯作者发表顶级期刊和会议论文20余篇,涵盖机器学习领域顶级期刊TPAMI、TNNLS、TIP和会议NeurIPS、ICML、IJCAI、AAAI、ECML。获中国科学院“青年创新促进会”成员、中国科学院信息工程研究所“引进优青”人才称号。主持国家自然科学基金青年,中科院基础前沿科学研究计划和腾讯犀牛鸟基金等项目。