代表性成果

认知基础共性技术突破

实验室突破认知基础共性技术，达到整体国际一流、部分领域国际领先的水平，自批准建设至2023年底共获得16项国际认知智能领域权威评测冠军、中国计算机学会自然科学一等奖。其中，2022年实验室三次夺得常识推理赛事冠军——常识推理挑战赛CommonsenseQA 2.0、科学常识推理挑战赛OpenBookQA、常识推理挑战赛QASC，并两次超越人类平均水平，实现认知智能技术的重大突破；2023年实验室提出了用于知识构建和推理的D-Reasoner模型，并在离散推理阅读理解任务DROP中夺冠，所有指标均刷新最好成绩；提出了用于持续学习的VL-Reasoner模型，在多模态问答比赛A-OKVQA中夺冠，大幅提升VQA效果。推出中文“羊驼”系列大模型开源项目，累计获得超22800个Star，多次荣登GitHub全球Trending项目和个人总榜榜单，并成功荣登总榜首位。

星火认知大模型

面向通用人工智能国际科技前沿，实验室于2022年12月15日自主部署“认知智能大模型技术及应用”专项攻关，开展数据获取、数据清洗、算力建设、国产化移植、内容安全、算法攻关和应用技术等各方面工作，突破了软硬一体化自主可控训练、跨领域异构知识统一表征、训推一体协同优化等技术，取得了积极进展，于2023年5月6日首次发布星火认知大模型并持续迭代升级， 2024年6月27日发布的讯飞星火大模型V4.0已实现全面对标GPT-4 Turbo。

基于大模型的应用创新

实验室在既定研究任务基础上，面向教育、医疗、办公、汽车、工业、金融等领域开展基于认知大模型的应用创新，解决社会刚需。在教育领域，大模型中英作文批改准确率已经超过一般老师的水平；口语教学已支持CET、雅思、托福等多类口语学习和模考。在医疗领域，研制了超越GPT-4的医疗大模型，研发具备多轮、主动交互能力的讯飞晓医APP ，覆盖1600种常见疾病、2800种常见药品、6000种常见检查检验，满足用户看病前、用药时、检查后的核心场景健康需求。在科研领域，与中科院文献情报中心合作研发了科技文献大模型和星火科研助手，支持成果调研、论文研读以及学术写作等研究工作，目前已覆盖超5万科研工作者，成果调研等效率可提高近10倍。