研究方向

(一)认知基础共性技术

面向科技前沿,开展以大模型为核心的认知智能研究框架和产学研协同模式研究,围绕认知智能基础共性技术中的高质量数据处理与知识表示、知识构建与推理、持续学习与自主进化,研究高质量数据处理与生成、跨模态知识统一表达范式、跨模态语义关联与融合、多模态知识抽取与对齐、可信知识推理框架、思维树提示学习方法、增量知识学习、大模型能力认知诊断、意图对齐反馈的强化学习进化机制等关键技术,并开展神经网络大模型智能涌现原理探究及大模型与脑科学的交叉前瞻探索。

(二)行业认知

面向“幸福中国”实现基于人工智能的教育、医疗优质资源普惠供给的需求,研究认知智能应用关键技术,具体包括在教育领域研究口头语言运用能力评测、书面语言运用能力评阅、理科解答题批改、学情诊断、学习路径规划和个性化推荐,在医疗领域研究医学文本内涵解析与知识构建、时序推理智能诊断、多模态问诊、病历书写内涵质控,在司法领域研究案件信息自动抽取、案件自动量刑预判、司法文书自动生成、司法文书自动质检与纠正、基于案情分析的法条推荐、司法证据链分析审查等关键技术。

(三)人机交互

面向“中国智造”升级手机/汽车/家电/机器人等人机智能交互的需求,深入布局拟人化人机交互技术,解决人机交互领域的核心科学问题,主要包括如何结合认知智能实现触摸、语音、语言、手势、人脸、视频等跨模态交互方式的融合,以及如何准确认知理解人机交互过程的广泛信息需求,最终完成自然有效的交互系统响应,提升整体人机交互体验。重点研究人机交互对话管理、多模态交互感知、全双工交互、主动交互、多轮对话、智能知识问答、情感交互、多维度表达等关键技术。

(四)多语种语言

面向“一带一路”构建跨语言沟通无障碍的经济文化交流环境的需求,研究多语种数据和专家资源稀缺条件下的语音识别、语音合成、图文识别、机器翻译建模方法,以及多语种语音翻译/同传翻译/图片翻译中多任务协同优化技术,建立以中文为核心的多语种自动翻译系统和平台,支持“一带一路”沿线65个国家53种官方语言及其他周边语种,与汉语之间的文本、语音和图像等多种模态输入的双向互译,并实现中文和20个语种的高可用语音同传,为不同国家和地区之间的跨语言沟通交流和信息传播提供核心支撑。

(五)科技文献服务 (拟设立)

面向成果调研、论文研读、科研写作等AI for Science场景下助力科研加速的需求,构建大规模科技文献知识库,持续积累优化科技文献论文数据;持续优化基于语义检索的多阶段论文阅读理解、大模型检索增强算法、基于科技文献向量知识库的知识问答和结论解读、多语种文献智能分析等技术;构建端到端的检索增强模型优化流程,实现人类偏好反馈和模型选择的迭代优化;通过科技文献服务智能化,服务更多科技工作者,助力我国科技发展创新。