网站首页
手机版

复旦大学高考数学大模型评测:阿里巴巴钱文、科大讯飞、星火击败GPT4o

更新时间:作者:佚名

大家好,关于复旦大学高考数学大模型评测:阿里巴巴钱文、科大讯飞、星火击败GPT4o很多朋友都还不太明白,今天小编就来为大家分享关于的知识,希望对各位有所帮助!

复旦大学高考数学大模型评测:阿里巴巴钱文、科大讯飞、星火击败GPT4o

在本次评价中,阿里巴巴钱文和科大讯飞Spark分别获得2024年高考新数学卷一第一名和第二名,新高考数学第二卷第二名和第一名。在两份试卷的评估中,GPT-4o排名第三。

复旦NLP团队认为,新发布的高考题具有高度原创性和保密性,是评估大型模型的优秀评估合集。在新卷一中,阿里钱文和科大讯飞Spark 对14 道客观数学题的准确率达到了70% 以上,大幅领先GPT-4o 的57%。字节豆宝、智浦轻言、百川等大型模型紧随其后,准确率超过50%。百度文心一言、腾讯元宝、Kimi等大型模型准确率较低。

在新卷二的评测中,科大讯飞Spark、阿里钱文、GPT-4o的准确率均超过60%。与其他大型车型的差距更小。除百川、DeepSeek、海螺外,准确率均在50%以上。

数学能力是GPT-4o一直引以为豪的能力模块。 OpenAI在5月14日的发布会上推出大语言模型GPT-4o时,重点展示了其数学能力。

在现场演示中,GPT-4o利用其实时图像识别和语音功能进行在线教学。从评测结果可以看出,阿里巴巴钱文和科大讯飞Spark对数学问题的深入理解和分析已经超越了GPT-4o,使得它们在回答高考数学题时更加准确。有网友表示,毕竟做数学题还是我们中国人的特长。

以阿里巴巴前文、科大讯飞Spark为代表的国内大规模人工智能模型在数学领域的突出能力,为未来人工智能技术在教育领域的应用提供了有力支撑。

为您推荐

复旦大学官宣! 2024年新增优秀青年1名、优秀青年1名

9月14日,TOP小编查询复旦大学数学科学学院网站发现,该所公布了2024年度自然科学基金项目立项结果。个人简介李志远,复旦大学上海数学中心与数学科学学院长聘教

2025-12-13 17:03

培训班招生计划(附招生标语)

当前由于二胎开放、应试需求提高、社会竞争压力加大,导致教育培训行业成为众行业的香饽饽,人人都想从中分一杯羹。虽然目前市场需求不断增加,但是作为开办教育培训的负责

2025-12-13 17:03

对学是一个在全国范围内免费报名和推广教育培训的网站。

都爱学简介都爱学是全国教育机构培训机构发布平台,汇聚全国培训机构,培训学校、培训课程等相关信息,为全国培训学校、培训机构提供招生信息发布,为学员打造低价团课秒杀

2025-12-13 17:02

2021年青岛市南、市北、李沧、崂山、高新区初中盘点

新学期伊始给大家盘点一下市内四区&高新区现有初中情况据不完全统计目前市内四区+高新区共有初中75所其中公办54所,民办21所同时还有10余所初中将在明年及后面陆

2025-12-13 17:01

合肥市区三所高中已改制为一年级、六年级、八年级。对2021年中考招生有何影响?

12月28日上午,合肥市第一中学教育集团、合肥市第六中学教育集团、合肥市第八中学教育集团和合肥一六八中学教育集团正式挂牌。合肥大小一六八,作为合肥市区乃至安徽高

2025-12-13 17:01

东城区10所小学对应的学区房

一、府学胡同小学:府学胡同(甲一号除外)、北剪子巷、麒麟碑胡同、张自忠1号码-35号(单号)、交南大街(双号)、交东大街2、4、6、8、10号楼、北吉祥胡同、土

2025-12-13 17:00