注册|登录

当前位置:首页 > 前沿

有道14B低成本轻量模型“子曰3”开源,数学推理性能超大模型

2025-06-24 10:03:41
6月23日,网易有道宣布正式开源“子曰3”系列大模型的数学模型(英文名称Confucius3-Math)。这是国内首个专注于数学教育,可在单块消费级GPU上高效运行的开源推理模型。其在一系列数学推理任务中取得当前最优性能,超越了许多规模更大的通用模型。该模型的开源,为教育领域提供了低成本、高性能的AI解决方案,推动大模型技术向教育领域加速渗透。



低成本高性能,助力教育公平

据「TMT星球」了解,“子曰3数学模型”在解决国内数学问题任务中展现出了显著优势。其通过大规模增强学习以及一系列的创新算法,训练成本仅为2.6万美元,推理性能约为DeepSeek R1的15倍。

测试数据显示,在CK12-math(Internal)、GAOKAO-Bench(Math)、MathBench(K12)、MATH500等数据集上,14B轻量级的“子曰3数学模型”各项得分均高于DeepSeek-R1等通用大模型。在GAOKAO-Bench(Math)这一基于高考数学题的大模型评测框架中,“子曰3数学模型”的得分高达98.5分。



除了出色的性能,“子曰3数学模型”的成本优势同样显著,其在消费级GPU即可运行,大大降低了教育场景的AI应用门槛。

事实上,中小学教育长期面临教育资源不平等、个性化辅导资源不足、复杂题型讲解成本高等痛点,而教育大模型能有效辅助提升学习效果,但高性能大模型的构建和部署成本却非常高昂,许多低收入地区难以负担。

针对这一问题,“子曰3数学模型”实现了部署性能的极致突破,服务成本每百万token低至0.15美元,远超目前大多数通用大模型的成本效益。这意味着更广泛的普通教育机构和开发者都能以低成本部署专业级的数学AI应用。

“对于行业而言,‘子曰3数学模型’证明了在低成本情况下,在特定领域构建强大推理模型的可行性,为垂类推理大模型的研发与应用提供了重要参考。”网易有道首席科学家段亦涛表示。

“AI+教育”加速进化,子曰释放教育大模型应用价值

自2023年7月推出国内首个教育大模型“子曰”以来,网易有道在“AI+教育”领域加速进化,持续释放大模型在教育行业的应用价值。

从“子曰”大模型在一年内快速推出10余个垂直应用,到今年初发布国内首个输出分步式讲解的推理模型“子曰-o1”,再到如今“子曰3数学模型”正式开源,网易有道充分结合应用场景进行模型迭代和优化,持续推动教育大模型技术创新和应用落地。

此次“子曰3数学模型”发布及开源,标志着“子曰”大模型系列在轻量级模型推理能力上实现了又一重要突破,也使得有道在教育大模型领域长期积累的技术成果能够共享给更多的开发者和从业者,构建起协同发展的行业格局。

段亦涛强调:“AI+教育的终极目标不是替代教师,而是让技术成为教育公平的杠杆。希望‘子曰3数学模型’的开源能够吸引更多开发者加入,共同探索推理模型在教育领域的应用价值。”

猜你喜欢

中国新能源汽车,正在重绘全球汽车产业版图。 2025年4月,中国车企比亚迪在欧洲市场的纯电动车注册量首次超过特斯拉。据市场研究公司JaoDyamics数据,比亚迪当月注册

2025-06-05

中新网太原6月5日电(杨佩佩)记者5日从山西航空产业集团有限公司获悉,当日,太原武宿国际机场三期改扩建工程新建二跑道顺利亮灯。这一关键节点的完成,标志着新建二跑道向

2025-06-05

中新网海南陵水5月29日电(张月和)陵水海归小镇作为海南自贸港“数据产业核心载体”与“文化出海战略枢纽”,正全力打造“数字内容生产-全球传播-商业变现”的全链条生

2025-05-29

说起最近的银行市场来说,各种存款不赚钱正在成为一种大家热议的事情,就在最近有部分银行的股息率突破8%的消息传来,让人不禁想问这是存银行不如买银行股要成趋势了吗?我们该怎么

2025-05-28

他们都是Mea的顶尖人才。Mea开源Llama模型家族帮助该公司制定了AI战略,某种程度上也改变了全世界的大模型格局。然而,令人意想不到的是,短短几年,Llama的初创者们大多

2025-05-28

过去两年,大模型成为企业数智化词典中出现频率最高的词之一。DeepSeek、字节跳动的豆包、阿里通义、百度文心——AI正以肉眼可见的速度普及。但当我们从技术叙事回

2025-05-28

热门推荐

快讯阅读

热文排行

本站内容收集于互联网和网友上传,不代表本站赞成与立场,如有对您作品有侵权请联系我们删除!技术支持:Qq:

Copyright 2021 © All Rights Reserved.版权所有