讯飞星火深度推理模型 X1 重磅发布!多项指标国内第一

互联网
2025
01/15
17:25
分享
评论

1月15日,科大讯飞发布了当前全国产算力平台上唯一的深度推理大模——讯飞星火X1。该模型在中文数学能力方面居于国内领先地位,并率先在教育、医疗等实际需求领域获得应用。

与此同时,讯飞星火4. 0Turbo平台的底座能力迎来了全面的升级,图文识别、数学处理及长文本的处理能力得到了显著增强,并首发混域知识搜索技术,旨在有效解决行业与企业面临的难点问题。

1

全国产算力攻关,打破技术壁垒

科大讯飞一直秉持全国产化的发展路径。尽管在国产算力平台上训练深度推理模型存在挑战,但通过与华为的合作,成功攻克了训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题,最终成功训练出我国首个基于全国产算力训练的具备深度思考和推理能力的大模型——讯飞星火X1。

在发布会上,科大讯飞研究院的研究员展示了讯飞星火X1对高考、AIME竞赛及高中奥林匹克竞赛题目的解答。讯飞星火X1不仅给出了正确答案,还详细解析了解题的方法和步骤,展现出更贴近人类“慢思考”的解题过程。

在此过程中,讯飞星火X1展现了其深度推理模型的三大特点:化繁为简,将复杂问题分步拆解简化;进行自我探索和反思验证;基于答案正确与否的优质反馈信息进行强化训练。

尤为值得一提的是,讯飞星火X1近期参与了多项考试,如小初高(含竞赛)、大学(包含竞赛)、AIME、MATH 500等,取得了优异的成绩。其在业界的多项标志性指标中都位居第一,实现了以更少算力带来的卓越成果。

1

全国产算力攻关,打破技术壁垒

科大讯飞一直秉持全国产化的发展路径。尽管在国产算力平台上训练深度推理模型存在挑战,但通过与华为的合作,成功攻克了训练推理强交互、高吞吐推理优化以及国产算子优化等一系列难题,最终成功训练出我国首个基于全国产算力训练的具备深度思考和推理能力的大模型——讯飞星火X1。

在发布会上,科大讯飞研究院的研究员展示了讯飞星火X1对高考、AIME竞赛及高中奥林匹克竞赛题目的解答。讯飞星火X1不仅给出了正确答案,还详细解析了解题的方法和步骤,展现出更贴近人类“慢思考”的解题过程。

在此过程中,讯飞星火X1展现了其深度推理模型的三大特点:化繁为简,将复杂问题分步拆解简化;进行自我探索和反思验证;基于答案正确与否的优质反馈信息进行强化训练。

尤为值得一提的是,讯飞星火X1近期参与了多项考试,如小初高(含竞赛)、大学(包含竞赛)、AIME、MATH 500等,取得了优异的成绩。其在业界的多项标志性指标中都位居第一,实现了以更少算力带来的卓越成果。

1

数学能力一直是讯飞星火的强项,基于讯飞星火X1的高质量合成数据,讯飞星火4. 0 Turbo的数学处理能力更强,更能有效支持数学教学、金融分析和科研演示等工作。

图文识别优化,数据获取无忧

图文识别能力直接影响企业的效率,讯飞星火4. 0Turbo在这方面的提升,使得通用文档的版面分析和识别准确率增加了40%,特别针对复杂表格和潦草手写文字的准确率提高了60%。这些能力显著提升了高价值数据的获取效率。

长文本框架创新,知识溯源精准

此次升级还针对文档要素的检测进行了强化,使得知识的准确切分和构建更加精细,减少模型幻觉的发生。同时推出极速版扫描文档解析技术,使得从扫描到解析的速度提升超过10倍,优化了长文本处理效果。

1

首发混域搜索,信息整合高效

为了帮助用户在报告编写、调查研究等方面节省时间,讯飞星火还推出了混域知识搜索技术,用户可通过一次性提问获得综合搜索结果,极大提升了信息获取的便利性。

1

根据第三方数据统计,在2024年,讯飞星火在大模型的中标数与金额方面均将取得“双第一”,尤其是在能源、金融、汽车、电信等领域,与客户共同打造了近百个智能体应用。

借助“技术与应用”的良性循环,讯飞星火4.0 Turbo全面提升了其行业能力,特别是在金融、油气、电力、钢铁、航空等行业,整体能力提升幅度均超过10%。可以说,它是“最懂得行业需求的大模型”。

THE END
广告、内容合作请点击这里 寻求合作
免责声明:本文系转载,版权归原作者所有;旨在传递信息,不代表砍柴网的观点和立场。

相关热点

相关推荐

1
3