代表性成果

认知基础共性技术突破

实验室突破认知基础共性技术,达到整体国际一流、部分领域国际领先的水平,自批准建设至2023年底共获得16项国际认知智能领域权威评测冠军、中国计算机学会自然科学一等奖。其中,2022年实验室三次夺得常识推理赛事冠军——常识推理挑战赛CommonsenseQA 2.0、科学常识推理挑战赛OpenBookQA、常识推理挑战赛QASC,并两次超越人类平均水平,实现认知智能技术的重大突破;2023年实验室提出了用于知识构建和推理的D-Reasoner模型,并在离散推理阅读理解任务DROP中夺冠,所有指标均刷新最好成绩;提出了用于持续学习的VL-Reasoner模型,在多模态问答比赛A-OKVQA中夺冠,大幅提升VQA效果。推出中文“羊驼”系列大模型开源项目,累计获得超22800个Star,多次荣登GitHub全球Trending项目和个人总榜榜单,并成功荣登总榜首位。

星火认知大模型

面向通用人工智能国际科技前沿,实验室于2022年12月15日自主部署“认知智能大模型技术及应用”专项攻关,开展数据获取、数据清洗、算力建设、国产化移植、内容安全、算法攻关和应用技术等各方面工作,突破了软硬一体化自主可控训练、跨领域异构知识统一表征、训推一体协同优化等技术,取得了积极进展,于2023年5月6日首次发布星火认知大模型并持续迭代升级, 2024年6月27日发布的讯飞星火大模型V4.0已实现全面对标GPT-4 Turbo。

基于大模型的应用创新

实验室在既定研究任务基础上,面向教育、医疗、办公、汽车、工业、金融等领域开展基于认知大模型的应用创新,解决社会刚需。在教育领域,大模型中英作文批改准确率已经超过一般老师的水平;口语教学已支持CET、雅思、托福等多类口语学习和模考。在医疗领域, 研制了超越GPT-4的医疗大模型,研发具备多轮、主动交互能力的讯飞晓医APP ,覆盖1600种常见疾病、2800种常见药品、6000种常见检查检验,满足用户看病前、用药时、检查后的核心场景健康需求。在科研领域,与中科院文献情报中心合作研发了科技文献大模型和星火科研助手, 支持成果调研、论文研读以及学术写作等研究工作 ,目前已覆盖超5万科研工作者,成果调研等效率可提高近10倍。