“大模型系统能力涌现机理机制”学术研讨会顺利召开
10月19日,“大模型系统能力涌现机理机制”学术研讨会在安徽合肥召开。本次研讨会围绕大模型涌现的复杂系统科学理论、因果推理机理、泛化能力的机制等基础性前沿问题开展研讨,由科大讯飞、西安交通大学、中国科学技术大学联合主办,认知智能全国重点实验室承办。科大讯飞高级副总裁、认知智能全国重点实验室主任胡国平,科大讯飞研究院执行院长、认知智能全国重点实验室副主任王士进,特邀报告及专题报告专家,项目负责人,以及参研单位的共计80余名专家、师生参与会议。

2024年1月新一代人工智能国家科技重大专项“大模型系统能力涌现的机理机制”正式立项,分别由科大讯飞、西安交通大学、中国科学技术大学等三个单位牵头项目开展研究。基于此,为更深入地推进项目研究,激发碰撞学术思想,特组织开展此次学术研讨。会议伊始,项目主管部门国家自然科学基金委员会高技术研究发展中心项目主管孟召宾致辞,期待本次研讨会能够汇聚各方智慧,共同探讨大模型涌机理机制问题,分享最新研究成果和思考。
会议现场邀请到哈尔滨工业大学人工智能研究院副院长车万翔教授、北京师范大学系统科学学院张江教授、复旦大学计算机科学技术学院张奇教授作特邀报告。
车万翔教授以“思维链与语境学习的推理粒度分析与统一电路解释”为主题,介绍其采用黑盒分析方法提出了推理边界以及最短可行思维链的假设,及基于该假设在提升推理性能上的应用,同时还给出了该方法与电路理论的映射解释。

张江教授围绕“量化复杂系统涌现现象”,以复杂系统科学的视角分享了对涌现的认识、在涌现量化方面的研究工作,并介绍了因果涌现理论,其将涌现分为了三类,并提出复杂系统的有效信息对于该系统能力提升及涌现至关重要。

张奇教授作“大模型能力边界与发展思考”主旨报告,报告以大模型领域的十个问题为牵引,从预训练、微调、强化学习等过程逐个分析了各环节对大模型能力提升的作用,并指出全数据驱动的大模型实现“推理”面临巨大挑战,大模型基础理论、大模型能力边界的清晰认知决定了投入力度和发展方向。

在接下来的研讨交流环节,实验室主任胡国平、副主任王士进及项目团队负责人魏思、丁宁、毛震东等围绕涌现的定义和边界、多模态大模型涌现、涌现能力的评估等问题与特邀报告专家开展交流,三位特邀报告专家围绕会议主题及提问依次发言指导,并提出了项目牵头单位间的协同研究、分技术路线开展等若干建议。



此次研讨会还组织了六位项目组成员分别作专题报告。国防科技大学许可乐副研究员从多模态大模型持续学习、数据筛选、复杂系统视角对大模型涌现提出见解;西安交通大学周三平特聘研究员在大模型泛化与语言学习的关系方面提供了新的思路;人民网刘毅研究员从实践出发阐述了大语言模型价值对齐方法;中国科学技术大学王翔教授探讨了多模态大模型中的神经元归因策略研究;旷视科技闫洁研究员分享了大模型在数学推理中的应用及思考;中国科学院自动化研究所郭龙腾副研究员分享了大模型规模法则的研究进展。

大模型展现出了强大的自然语言理解能力和复杂任务解决能力,其构建过程涉及到更为复杂的训练、微调及强化学习方法,然而当前对于大模型的因果溯源、上下文学习、多步推理、语义对齐、泛化能力提升等方面仍然缺乏理论、机理机制等层面的解释。
新一代人工智能国家科技重大专项的布局及此次会议的研讨,旨在瞄准大模型系统能力涌现这一充满挑战与机遇的研究方向持续探索。随着研究的不断深入和技术的持续进步,我们有望更加深刻地理解与应用大模型的高阶认知能力,为实现大模型技术的广泛、可靠领域应用奠定基础,对于推动人工智能技术的持续创新、抢抓通用人工智能新机遇具有重要意义。
