中欧在线minimba

  • 谷歌Gemini在国际数学奥林匹克竞赛测试中获金牌水平成绩_推理_Deep_模型

  • 发布日期:2025-08-19 11:22    点击次数:61

IT之家 7 月 22 日消息,国际数学奥林匹克竞赛(IMO)是全球最负盛名的数学竞赛之一,每年每个国家由六名高中生代表参赛,他们需在规定时间内解答六道极具挑战性的数学难题。在这一竞赛中,仅有约 8% 的参赛者能够获得金牌,这使得 IMO 的金牌成为数学领域的至高荣誉。

在今年的国际数学奥林匹克竞赛中,OpenAI 和谷歌都使用了它们最新的大语言模型(LLM)参赛。

上周末,OpenAI 宣布其实验性推理语言模型在 2025 年 IMO 的题目测试中取得了金牌级别的成绩。OpenAI 的模型在与学生相同的规则下进行了测试,需要在两场时长各 4.5 小时的考试时段内完成题目解答,且不能使用任何工具或联网,最终还需以自然语言形式书写证明过程。

今日,谷歌也宣布其升级版的 Gemini Deep Think 成功解决了 IMO 六道题目中的五道,同样达到了金牌水平的表现。这一升级版的 Gemini Deep Think 采用了谷歌 DeepMind 最新研究成果中的改进推理模式,包括并行思维技术,使其能够同时探索多种解决方案,而不再局限于逐一尝试。

IT之家注意到,谷歌 DeepMind 团队在介绍这一升级版的 Gemini Deep Think 时表示:“为了充分发挥 Deep Think 的推理能力,我们利用了新颖的强化学习技术,进一步增强了模型的多步推理、问题解决和定理证明能力。此外,我们还为 Gemini 提供了高质量数学问题解决方案的精选语料库,并在其指令中添加了一些关于如何应对 IMO 问题的通用提示词和技巧。”

发布于:山东省

相关资讯

特雷-杨抗议种族不公掉粉:我能接受 乃必要代价

新闻动态 2025-06-27
自从黑人乔治-弗洛伊德被白人警察虐杀之后,老鹰当家球星特雷-杨就一直积极抗议种族不公,无怨无悔。 他最近在接受采访时透露,自己因为参加抗议导致他的推特掉粉,“我绝对是因为发声和表达观点,失去了一些粉丝,但我能够接受。这是必要的(代价)。” ...

“像布娃娃一样”扔来扔去!英国八旬老人遭护理人员虐待后死亡_奥拉古尼_约翰·阿塔德_判决

新闻动态 2025-07-07
记者 | 傅圆圆 英国一名护理人员暴力对待一名患有阿尔茨海默病的虚弱老人,“像布娃娃一样”把他扔来扔去。近日,该案在法院审理。 △比利克斯·奥拉古尼正在拖拽88岁的约翰·阿塔德。 据法院审理,42岁的护理人员比利克斯·奥拉古尼在肯特郡贝克斯...

人民日报:价格战竞争没有未来!

新闻动态 2025-06-25
(原标题:人民日报:价格战竞争没有未来!) 人民日报再次针对汽车行业的价格战进行发声。其指出从长远看,打“价格战”这种“内卷式”竞争,没有出路,更没有未来。每个人都期待质优价廉的好汽车,但如果失去“质优”,“价廉”将没有意义。人民日报从产业...
    友情链接:

Powered by 中欧在线minimba @2013-2022 RSS地图 HTML地图