中欧在线minimba

  • 谷歌Gemini在国际数学奥林匹克竞赛测试中获金牌水平成绩_推理_Deep_模型

  • 发布日期:2025-08-19 11:22    点击次数:60

IT之家 7 月 22 日消息,国际数学奥林匹克竞赛(IMO)是全球最负盛名的数学竞赛之一,每年每个国家由六名高中生代表参赛,他们需在规定时间内解答六道极具挑战性的数学难题。在这一竞赛中,仅有约 8% 的参赛者能够获得金牌,这使得 IMO 的金牌成为数学领域的至高荣誉。

在今年的国际数学奥林匹克竞赛中,OpenAI 和谷歌都使用了它们最新的大语言模型(LLM)参赛。

上周末,OpenAI 宣布其实验性推理语言模型在 2025 年 IMO 的题目测试中取得了金牌级别的成绩。OpenAI 的模型在与学生相同的规则下进行了测试,需要在两场时长各 4.5 小时的考试时段内完成题目解答,且不能使用任何工具或联网,最终还需以自然语言形式书写证明过程。

今日,谷歌也宣布其升级版的 Gemini Deep Think 成功解决了 IMO 六道题目中的五道,同样达到了金牌水平的表现。这一升级版的 Gemini Deep Think 采用了谷歌 DeepMind 最新研究成果中的改进推理模式,包括并行思维技术,使其能够同时探索多种解决方案,而不再局限于逐一尝试。

IT之家注意到,谷歌 DeepMind 团队在介绍这一升级版的 Gemini Deep Think 时表示:“为了充分发挥 Deep Think 的推理能力,我们利用了新颖的强化学习技术,进一步增强了模型的多步推理、问题解决和定理证明能力。此外,我们还为 Gemini 提供了高质量数学问题解决方案的精选语料库,并在其指令中添加了一些关于如何应对 IMO 问题的通用提示词和技巧。”

发布于:山东省

相关资讯

谷歌Gemini在国际数学奥林匹克竞赛测试中获金牌水平成绩_推理_Deep_模型

新闻动态 2025-08-19
IT之家 7 月 22 日消息,国际数学奥林匹克竞赛(IMO)是全球最负盛名的数学竞赛之一,每年每个国家由六名高中生代表参赛,他们需在规定时间内解答六道极具挑战性的数学难题。在这一竞赛中,仅有约 8% 的参赛者能够获得金牌,这使得 IMO ...

中金公司(601995)2月28日主力资金净卖出3.47亿元

新闻动态 2025-03-08
证券之星消息,截至2025年2月28日收盘,中金公司(601995)报收于35.27元,下跌9.26%,换手率2.61%,成交量76.45万手,成交额27.75亿元。 2月28日的资金流向数据方面,主力资金净流出3.47亿元,占总成交额12...

现货黄金日内涨超1%,现报3273.54美元/盎司

新闻动态 2025-05-24
每经AI快讯,5月5日,现货黄金日内涨超1%,现报3273.54美元/盎司。...
    友情链接:

Powered by 中欧在线minimba @2013-2022 RSS地图 HTML地图