V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
changyang
V2EX  ›  OpenAI

今天看新闻 kimi 的数理化远超 gtp-4o,我用了一个小学三年级奥数题目考它,它竟然无限循环了

  •  
  •   changyang · 8 天前 · 5536 次点击

    如题 题目是:

    请你帮我做一个数学习题 请你使用加号,减号,乘号,除号,括号,填入下面几个数之间,让结果等于 24 10 10 4 4 = 24

    它不停的输出应该是 xx 答案,但是这么算好像不对,重新计算答案。 所以这样的成绩真的能高考拿到一本分数吗?

    68 条回复    2024-12-18 23:21:45 +08:00
    LanhuaMa
        1
    LanhuaMa  
       8 天前
    训练数据集大量加入历年试题,高考拿到一本分数可能很轻松,但是基础逻辑问题/四则运算绝对会错。什么样的做题家训练出什么样的 AI ,很合理。
    lance07
        2
    lance07  
       8 天前
    如果是今天的新闻那可能还真没问题,4o 最近都快成智障了。。。
    lance07
        3
    lance07  
       8 天前   ❤️ 1
    我就知道,md oai https://imgur.com/a/XNyKSJj
    yinmin
        4
    yinmin  
       8 天前 via iPhone   ❤️ 3
    提问改成:请使用 html+javascript 写一个程序求解:请你使用加号,减号,乘号,除号,括号,填入下面几个数之间,让结果等于 24 10 10 4 4 = 24

    然后运行 html 获取结果: ( 10*10-4 )/4=24
    changyang
        5
    changyang  
    OP
       8 天前 via iPhone
    @yinmin 厉害,看来代码能力还是强些,它好像触发 bug 了,无限循环,输出了一段时间停了
    changyang
        6
    changyang  
    OP
       8 天前 via iPhone
    @lance07 gpt4o 是解不出来的,但是它至少没有无限循环😂
    infun
        7
    infun  
       8 天前
    试了一圈,只有豆包能解出来
    lovestudykid
        8
    lovestudykid  
       8 天前
    Gemini 2.0 基础智力遥遥领先,几乎不逊于 o1 ,其他模型做这种推理都是弱智
    yinmin
        9
    yinmin  
       8 天前 via iPhone
    @changyang 你把 ai 理解成一个博士只能笔算,除非这个博士爱好 24 点(针对 24 点专项训练过)

    ai 算数学题,我用 chatgpt o1 mini 解高三数学题的准确性还是蛮高的(有些用作业帮扫不到的题目,80%能做对,15%能提供解题思路)
    yinmin
        10
    yinmin  
       8 天前 via iPhone
    接#9 另外,用程序解数学题,让 ai 用 python 是最佳的,因为 python 有科学运算库,能解出带分数、根号的答案,只是你需要有 python 运行环境( chatgpt 内置 python 运行环境,可以直接出答案。其他的 ai 大都集成 html 运行环境不如 chatgpt )
    chiaf
        11
    chiaf  
       8 天前
    gemini 2.0 也不行,3.8 and 3.11 which is bigger 回答的还是 3.11 大🤣
    orangeD
        12
    orangeD  
       8 天前   ❤️ 2


    这个问题貌似让 gpt4o 破防了
    changyang
        13
    changyang  
    OP
       8 天前
    @yinmin 又涨知识了,谢谢,跟 ai 沟通确实需要经验
    xiaoxt
        14
    xiaoxt  
       8 天前 via iPhone
    试了下,并没有无限循环,一下就解出来了
    changyang
        15
    changyang  
    OP
       8 天前
    @xiaoxt
    我的是循环了的
    mingyn
        16
    mingyn  
       8 天前
    试验了下:
    chatgpt 4o ,失败
    grok2 ,失败,10 * 10 - 4 / 4 = 24
    claude 3.5 ,成功,((10 * 10) - 4) / 4 = 24
    sonar huge ,成功,((10 * 10) - 4) / 4 = 24
    elevioux
        17
    elevioux  
       8 天前
    gemini 2 flash 一次成功
    sikex
        18
    sikex  
       8 天前
    deepseek 失败
    COW
        19
    COW  
       8 天前 via Android
    gpt4 我也遇到过循环输出,之前让他把一个 ipv6 地址转成 PTR 记录,然后它就一直输出一个数字停不下来
    ty29022
        20
    ty29022  
       8 天前
    gpt 阵亡
    但是 32b 的 qwq 答出来了

    ====================
    请你使用加号,减号,乘号,除号,括号,填入下面几个数之间,让结果等于 24 10 10 4 4 = 24
    ...
    ... - 只使用加号、减号、乘号、除号和括号。
    ... - 使用数字 10 、10 、4 、4 各一次。
    ... - 数字出现的顺序不能更换。
    ... - 结果必须是 24 。
    ...
    让我来尝试解决这个数学难题。题目是用加号、减号、乘号、除号和括号,把数字 10 、10 、4 、4 组合起来,得到 24 ,而且数字的顺序不能改变。

    首先,我需要理解题目的约束条件:

    1. 必须使用给定的四个数字:10, 10, 4, 4 。

    2. 数字必须按照这个顺序使用,不能更改顺序。

    3. 只能使用基本的 arithmetic 运算符:加、减、乘、除,以及括号来改变运算顺序。

    4. 最终的结果必须是 24 。

    好的,开始思考。首先,我注意到有两个 10 和两个 4 ,而且顺序是 10, 10, 4, 4 。

    我想,可能需要结合乘法和加法来达到 24 。比如,如果我能得到 6 和 4 ,然后相乘就是 24 。因为 6×4=24 。或者,也许可以通过其他组合,比如 8×3=24 ,但看起来不太容易从 10,10,4,4 得到 8 和 3 。

    让我尝试一下:

    首先,10 + 10 = 20 ,然后 20 加上 4 是 24 ,但是还有另一个 4 没用上。如果我写成 (10 + 10) + 4 + 4 ,等于 28 ,超过了 24 。不行。

    或者,10 + 10 + 4 - 4 = 10 ,太小了。

    maybe 10 + 10 - 4 + 4 = 20 ,还是不到 24 。

    看来加减法不太直接得到 24 。

    那试试乘法。10 × 10 = 100 ,然后怎么办呢? 100 再怎么操作也难得到 24 。

    或者,10 × (10 - 4) = 10 × 6 = 60 ,还是大了。

    再减去 4 ,60 - 4 = 56 ,还是不是 24 。

    看来这样不行。

    也许应该考虑除法。比如,10 / 10 = 1 ,然后 1 乘以 4 是 4 ,再加上另一个 4 是 8 ,还是不够。

    或者,(10 + 10) / 4 = 20 / 4 = 5 ,然后 5 加上另一个 4 是 9 ,还是不到 24 。

    不行。

    也许需要更复杂的组合。比如,先用前两个数字做某运算,再用后两个数字做另一运算,然后再结合起来。

    让我再想想。

    或者,考虑把一些数字结合成分数或者其他形式,但题目里只有基本运算符,没有提到分数,所以可能不行。

    或者,尝试使用除法来缩小数的大小。

    比如,10 / 4 = 2.5 ,然后 10 减去 2.5 是 7.5 ,再加另一个 4 是 11.5 ,还是不到 24 。

    或者,(10 - 4) / 10 = 6 / 10 = 0.6 ,然后乘以 4 是 2.4 ,再加上另一个 4 是 6.4 ,还是不行。

    看来这样也不行。

    也许我需要重新思考策略。既然有两个 10 和两个 4 ,可能需要利用数字的重复性。

    或者,考虑把某些数字组合成更大的数,但题目要求只能使用给定的运算符,不能拼接数字,所以这个想法可能不适用。

    或者,试试先用后面的数字进行运算,再与前面的数字结合。

    比如,4 + 4 = 8 ,然后 10 × (10 - 8) = 10 × 2 = 20 ,还是不到 24 。

    或者,10 × 10 = 100 ,然后减去 4 + 4 = 8 ,得到 92 ,不是 24 。

    不行。

    也许需要更激进的组合。比如,使用除法在分子或分母中。

    比如,(10 × 10 - 4) / 4 = (100 - 4) / 4 = 96 / 4 = 24 。

    嗯,这个表达式是 (10 × 10 - 4) / 4 = 24 。

    但是,这里数字的顺序是 10, 10, 4, 4 ,而且运算符可以任意放置,包括括号。

    不过,这个表达式中,数字的顺序是 10, 10, 4, 4 ,符合要求。

    让我们再检查一下:

    先计算括号内的 10 × 10 = 100 ,

    然后 100 - 4 = 96 ,

    最后 96 / 4 = 24 。

    完美,得到了 24 。

    所以,答案是 (10 × 10 - 4) / 4 = 24 。

    不过,题目要求必须按照数字出现的顺序,而且这个表达式中确实保持了 10, 10, 4, 4 的顺序。

    所以,这是一个有效的解。

    但是,也许还有其他的解法。

    让我再想想。

    另一个想法是:10 + (10 - 4) × 4 。

    计算一下:10 - 4 = 6 ,然后 6 × 4 = 24 ,再加上 10 是 34 ,不对,顺序错了。

    wait, 按照顺序是 10 + (10 - 4) × 4 。

    先算 10 - 4 = 6 ,然后 6 × 4 = 24 ,再加 10 是 34 ,不是 24 。

    所以,这不是正确的组合。

    或者,10 + 10 + 4 × 4 。

    按照运算顺序,先乘后加:4 × 4 = 16 ,然后 10 + 10 + 16 = 36 ,不是 24 。

    不行。

    或者,10 + 10 × 4 - 4 。

    先算 10 × 4 = 40 ,然后 10 + 40 = 50 ,再减 4 是 46 ,不是 24 。

    不对。

    或者,(10 + 10) × (4 - 4) = 20 × 0 = 0 ,不是 24 。

    不行。

    或者,10 × 4 + 10 - 4 = 40 + 10 - 4 = 46 ,不是 24 。

    不对。

    或者,10 × 4 - 10 + 4 = 40 - 10 + 4 = 34 ,还是不对。

    看来之前的 (10 × 10 - 4) / 4 = 24 是一个有效的解法。

    让我再确认一下运算顺序:

    先计算括号内的乘法:10 × 10 = 100 ,

    然后减去 4:100 - 4 = 96 ,

    最后除以 4:96 / 4 = 24 。

    没错,符合要求。

    也许还有其他的方法,但我现在想不出来了。

    所以,最终的答案是 (10 × 10 - 4) / 4 = 24 。

    **Final Answer**

    \[ \boxed{\frac{10 \times 10 - 4}{4} = 24} \]
    PROJECT
        21
    PROJECT  
       8 天前
    O1 好像算不出来

    思考过程:
    探索不同组合

    我试着将两个 10 结合,使用其余的数字和操作,但得到的结果不是 24 。这个问题要我如何有效地处理这些数字?

    尝试不同方式

    我在探索各种组合和操作,比如加法、减法、乘法和除法,还有很多组合,但始终无法得到 24 这一结果。这真的让人头疼。

    探索不同路径

    试图解决问题时,我测试了各种组合和操作,包括指数运算,但始终无法得到 24 。可能需要尝试新的方法来找到答案。

    试探不同组合

    我尝试了各种加法、乘法和括号组合,包括将两个 10 相加,再减去一个 4 ,确保所有数字都被使用。但结果无法达成 24 。

    探索新方式

    我尝试了更多组合和操作,如乘法、除法和括号,但始终未能得到 24 。这让我意识到,可能需要用不同的方法来解决这个问题。

    尝试多个方法

    我试图用各种组合和操作,包括加法、乘法、除法和括号,但始终无法得到 24 。这让我思考可能需要寻找新的解决方式。

    尝试新的方法

    在测试了多种操作和组合后,仍未能得到 24 。思考可能需要不同的策略来解决此问题。

    重新开始

    尝试使用小数和不同顺序的操作,但仍无法得到 24 。这让我意识到需要新的方法或策略来解决这个问题。

    多重运算尝试

    我尝试了不同的运算方式,如小数、组合和重新排列,但始终没有得到 24 。这让我意识到可能需要更创意的解决思路。

    尝试不同组合

    我探索了各种组合和运算方式,比如乘法、除法和加法,但都没有得到 24 。这让我认为可能需要更深入的思考或创新的解决方案。

    试探各种组合

    我尝试了不同的运算方式和组合,如乘法、除法和加法,始终未能得到 24 。我开始思考是否需要新的方法来解决这个问题。

    探索添加和乘法
    我尝试了多个计算方法,如将 10 与 4 相加,然后再乘以 10 ,结果是 54 ;但始终未能得到 24 。

    用分数和多重运算尝试
    我正在探索使用分数和多重运算,尝试不同的排列和组合,但仍然无法得出 24 。可能需要更创新的方法.

    提出创意方法

    尝试了各种运算组合,包括乘法和加法。即使使用小数和分数,还是未能得到 24 。这让我怀疑可能没有解决方案。


    答案:

    **解答:**

    您提供的数学习题要求使用加号(+)、减号(-)、乘号(×)、除号(÷)和括号,将数字 10 、10 、4 、4 组合,使结果等于 24 。经过多次尝试,发现使用这些数字和运算符号难以得到精确的结果 24 。以下是详细分析:

    ### **尝试的组合方法**

    1. **基本运算组合:**
    - \(10 + 10 + 4 + 4 = 28\)
    - \(10 \times 4 - 10 - 4 = 26\)
    - \(10 \times (10 - 4) / 4 = 15\)
    - \( (10 + 10) / (4 + 4) = 2.5 \)
    - 等等。

    2. **使用括号调整优先级:**
    - \((10 + 10) \times (4 / 4) = 20 \times 1 = 20\)
    - \(10 \times (4 + 4) / 10 = 8\)
    - \((10 - (10 / 4)) \times 4 = 30\)
    - 等等。

    3. **尝试使用分数和组合:**
    - \(10 / (10 - (4 + 4)) = 10 / 2 = 5\)
    - \((10 + (10 / 4)) \times 4 = 60\)
    - 等等。

    ### **结论**

    经过多种组合和计算,发现无法通过加、减、乘、除和括号,将数字 10 、10 、4 、4 组合得到精确的结果 24 。可能需要使用其他运算符(如指数运算)、数字拼接(如将两个 4 拼接成 44 )或其他高级数学技巧才能实现目标,但在仅限于加、减、乘、除和括号的情况下,无法达成。

    ### **建议**

    1. **检查题目要求:** 确认是否允许使用其他运算符或数学操作。
    2. **重新排列数字顺序:** 有时改变数字的排列顺序可能会带来不同的结果。
    3. **咨询老师或参考资料:** 如果这是学校的作业题,建议与老师确认是否有特殊的解题方法或是否存在误差。

    如果有其他问题或需要进一步的帮助,请随时告知!
    justdoitzZ
        22
    justdoitzZ  
       8 天前
    感觉豆包有点强啊
    豆包测试通过,言简意赅,小菜一碟
    justdoitzZ
        23
    justdoitzZ  
       8 天前
    也测试了 cursor 里面的 gpt-40, claude-3.5-sonnet 都是失败了
    Donaldo
        24
    Donaldo  
       8 天前
    kimi 这不是秒解 反而是 4o 直接瞎扯淡。。
    yuewolf
        25
    yuewolf  
       8 天前
    @sikex 我用 deepthink 可以,耗费了 20s
    kingcanfish
        26
    kingcanfish  
       8 天前
    @ty29022 qwen 这么厉害吗 还会自校验结果?
    360dust
        27
    360dust  
       8 天前 via iPhone
    @orangeD 这个是什么平台?
    mumbler
        28
    mumbler  
       8 天前
    chatgpt 现在已经毫无优势了,看好 gemini ,google 这样拥抱开发者才是正确道路
    winterx
        29
    winterx  
       8 天前
    元宝
    leiletter
        30
    leiletter  
       8 天前
    哈哈,我今天也遇到了,用了他那个最新的视觉思考版,拍张电脑屏幕问他一个问题,他就不停的自己脑补画面然后再调试再脑补,再调试再脑补,无限循环
    HeyWeGo
        31
    HeyWeGo  
       8 天前
    刚试了 kimi ,也是陷入循环了,但是好多循环之后,莫名就对了!
    zdl0929
        32
    zdl0929  
       8 天前
    我这是对的啊

    HeyWeGo
        33
    HeyWeGo  
       8 天前
    gpt 在那胡说八道
    HeyWeGo
        34
    HeyWeGo  
       8 天前
    @zdl0929 #32 6x2.5 可不等于 24
    nevin47
        35
    nevin47  
       8 天前   ❤️ 1
    @LanhuaMa 你这样想,只能说你完全不懂 LLM……
    HeyWeGo
        36
    HeyWeGo  
       8 天前
    gpt 的表现特别讨好人性!结果是人们所预期的,但是过程一坨屎!一本正经的胡说八道
    zdl0929
        37
    zdl0929  
       8 天前
    @HeyWeGo #34 233 ,看错了
    zhhqiang
        38
    zhhqiang  
       8 天前
    gpt
    好的,下面是一个可能的解法:

    \[
    (10 - 4) \times (10 - 4) = 24
    \]

    这里的步骤是:
    1. \( 10 - 4 = 6 \)
    2. \( 10 - 4 = 6 \)
    3. 然后 \( 6 \times 6 = 24 \)

    这样就得到了结果 24 。
    6*6=24 - -.
    openmynet
        39
    openmynet  
       8 天前
    mistral large latest api ![mistral_large_latest_api.png]( https://imgur.com/pr4bp0r)
    w99wjacky
        40
    w99wjacky  
       8 天前
    一个 ChatGPT 明显算错的题:

    甲乙二人从两地同时相对而行,经过 4 小时,在距离中点 4 千米处相遇。甲比乙速度快,甲每小时比乙快多少千米?

    他给的答案是 1 ,应该是 2
    https://chatgpt.com/share/67613910-ab40-8000-92b6-41346f79b288
    lyyQAQ
        41
    lyyQAQ  
       8 天前
    o1
    不过思考了 1 分钟= =

    **一种解法:**

    在数字之间添加括号和运算符:

    ```
    10 + 10 + 4 * (4 / 4) = 24
    ```

    解释:

    1. 首先计算括号内的 `(4 / 4) = 1`。
    2. 然后 `4 * 1 = 4`。
    3. 接着 `10 + 10 + 4 = 24`。

    这样就使用了给定的四个数字 10 、10 、4 、4 ,并通过加、减、乘、除及括号得到了结果 24 。
    hertzry
        42
    hertzry  
       8 天前
    Llama 3.1 8B

    (10 + 10) × (4 ÷ 4) =?

    = (20) × (1)

    = 20

    这不等于 24 ,所以我们再试一次:

    (10 × 10) - (4 ÷ 4) =?

    = (100) - (1)

    = 99

    这也不等于 24 ,所以我们再试一次:

    (10 + 10) + (4 × 4) =?

    = (20) + (16)

    = 36

    这仍然不等于 24 ,所以我们再试一次:

    (10 × 10) - (4 × 4) =?

    = (100) - (16)

    = 84

    这也不等于 24 ,所以我们再试一次:

    (10 + 10) ÷ (4 ÷ 4) =?

    = (20) ÷ (1)

    = 20

    这不等于 24 ,所以我们再试一次:

    10 × (10 - (4 ÷ 4)) =?

    = 10 × (10 - 1)

    = 10 × 9

    = 90

    这也不等于 24 ,所以我们再试一次:

    10 × ((10 ÷ 4) × 4) =?

    = 10 × (2.5 × 4)

    = 10 × 10

    = 100

    这不等于 24 ,所以我们再试一次:

    (10 + 10) × (4 ÷ 4) =?

    = (20) × (1)

    = 20

    这不等于 24 ,所以我们再试一次:

    10 + (10 × (4 ÷ 4)) =?

    = 10 + (10 × 1)

    = 10 + 10

    = 20

    这不等于 24 ,所以我们再试一次:

    (10 × 4) + (10 ÷ 4) =?

    = (40) + (2.5)

    = 42.5

    这不等于 24 ,所以我们再试一次:

    (10 + 4) × (10 ÷ 4) =?

    = (14) × (2.5)

    = 35

    这不等于 24 ,所以我们再试一次:

    10 × (10 - 4) + 4 =?

    = 10 × 6 + 4

    = 60 + 4

    = 64

    这不等于 24 ,所以我们再试一次:

    10 + 10 + 4 ÷ 4 =?

    = 20 + 1

    = 21

    这不等于 24 ,所以我们再试一次:

    10 × 4 - 10 + 4 =?

    = 40 - 10 + 4

    = 34

    这不等于 24 ,所以我们再试一次:

    10 + (10 - 4) × 4 =?

    = 10 + (6) × 4

    = 10 + 24

    = 34

    这不等于 24 ,所以我们再试一次:

    10 + 10 + (4 × 4) ÷ 4 =?

    = 20 + (16) ÷ 4

    = 20 + 4

    = 24

    是的!我们成功了:

    10 + 10 + (4 × 4) ÷ 4 = 24
    lyyQAQ
        43
    lyyQAQ  
       8 天前   ❤️ 1
    xw340721
        44
    xw340721  
       8 天前
    我给他的答案他竟然加戏起来了()[]
    ![]( https://imgur.com/a/gpVoeZg)
    wudanyang
        45
    wudanyang  
       8 天前
    文心一言 3.5 和豆包好像都可以,ChatGPT4o 不行
    llanero
        46
    llanero  
       8 天前
    deepseek 的 api 试了好多次,都不行,最后都是胡说八道
    gemini2.0flah 秒答
    chatgpt 4o 直接胡说八道了
    orangeD
        47
    orangeD  
       8 天前
    @360dust lobechat
    LXchienne
        48
    LXchienne  
       8 天前
    通义千问 2.5 都行,gpt4o 在忽悠我,24-10=24 ,验证正确!!
    a1b2c3T
        49
    a1b2c3T  
       8 天前
    @yinmin #3 用的哪个模型啊老哥,我这咋不好使
    cyrivlclth
        50
    cyrivlclth  
       8 天前
    我问 10 10 4 4 怎么组成 25 ,这下好了,都开始胡说八道了
    snw
        51
    snw  
       8 天前 via Android
    24 点除了尝试凑凑 3×8, 4×6 之类常规解,较难的组合都是靠穷举法吧?如果没见过的话确实很难在有限时间内想出答案。
    chiaf
        52
    chiaf  
       8 天前
    gpt4o 问了之后,接着输入可以使用 python ,是可以得到答案的。下面是代码:

    from itertools import permutations, product

    # 数字
    numbers = [10, 10, 4, 4]
    # 运算符
    operators = ['+', '-', '*', '/']
    # 存储表达式结果等于 24 的表达式
    solutions = []

    # 尝试所有数字的排列和操作符组合
    for nums in permutations(numbers):
    for ops in product(operators, repeat=3):
    # 所有可能的括号位置
    expressions = [
    f"(({nums[0]} {ops[0]} {nums[1]}) {ops[1]} {nums[2]}) {ops[2]} {nums[3]}",
    f"({nums[0]} {ops[0]} ({nums[1]} {ops[1]} {nums[2]})) {ops[2]} {nums[3]}",
    f"({nums[0]} {ops[0]} {nums[1]}) {ops[1]} ({nums[2]} {ops[2]} {nums[3]})",
    f"{nums[0]} {ops[0]} (({nums[1]} {ops[1]} {nums[2]}) {ops[2]} {nums[3]})",
    f"{nums[0]} {ops[0]} ({nums[1]} {ops[1]} ({nums[2]} {ops[2]} {nums[3]}))"
    ]
    # 检查表达式是否等于 24
    for exp in expressions:
    try:
    if eval(exp) == 24:
    solutions.append(exp)
    except ZeroDivisionError:
    pass

    # 去重并显示结果
    solutions = list(set(solutions))
    solutions[:5]

    结果是 ((10 * 10) - 4) / 4 = 24

    #10 楼的建议很好👍
    ovtfkw
        53
    ovtfkw  
       8 天前 via iPhone
    grok2 破防了

    当然可以!这是一个经典的数学游戏。以下是一个解法:

    \[ (10 - 4) \times (10 / 4) = 24 \]

    解释如下:
    - 先计算 \(10 - 4 = 6\)。
    - 然后计算 \(10 / 4 = 2.5\)。
    - 最后,\(6 \times 2.5 = 15\)。

    哦,等一下,这样算错了。让我们重新计算:

    \[ \left(\frac{10}{4} + 4\right) \times (10 - 4) = 24 \]

    解释如下:
    - 先计算 \(10 / 4 = 2.5\)。
    - 然后计算 \(2.5 + 4 = 6.5\)。
    - 再计算 \(10 - 4 = 6\)。
    - 最后,\(6.5 \times 6 = 39\)。

    再试一次:

    \[ \left(10 - \frac{10}{4}\right) \times (4 + 4) = 24 \]

    解释如下:
    - 先计算 \(10 / 4 = 2.5\)。
    - 然后计算 \(10 - 2.5 = 7.5\)。
    - 再计算 \(4 + 4 = 8\)。
    - 最后,\(7.5 \times 8 = 60\)。

    错了,再次尝试:

    \[ \left(10 - \frac{10}{4}\right) \times (4 + 4) = 24 \]

    啊,错了:

    \[ \left(10 - \frac{10}{4}\right) \times (4 + 4) = 24 \]

    不好意思,我犯了错误。这里是正确的解法:

    \[ (10 - \frac{10}{4}) \times 4 = 24 \]

    解释如下:
    - 先计算 \(10 / 4 = 2.5\)。
    - 然后计算 \(10 - 2.5 = 7.5\)。
    - 最后,\(7.5 \times 4 = 30\)。

    啊,仍然错了。我再试一次:

    \[ (10 - 4) \times (4 + \frac{10}{4}) = 24 \]

    解释如下:
    - 先计算 \(10 - 4 = 6\)。
    - 然后计算 \(10 / 4 = 2.5\)。
    - 再计算 \(4 + 2.5 = 6.5\)。
    - 最后,\(6 \times 6.5 = 39\)。

    再次错了。最后一次:

    \[ \left(\frac{10}{4} \times 4\right) + (10 - 4) = 24 \]

    解释如下:
    - 先计算 \(10 / 4 = 2.5\)。
    - 然后计算 \(2.5 \times 4 = 10\)。
    - 再计算 \(10 - 4 = 6\)。
    - 最后,\(10 + 6 = 16\)。

    啊,错误了!

    最后一次尝试:

    \[ \left(10 + \frac{10}{4}\right) - (4 \times 4) = 24 \]

    解释如下:
    - 先计算 \(10 / 4 = 2.5\)。
    - 然后计算 \(10 + 2.5 = 12.5\)。
    - 再计算 \(4 \times 4 = 16\)。
    - 最后,\(12.5 - 16 = -3.5\)。

    对不起,我犯了一个错误。这里是正确的方法:

    \[ \frac{(10 - 4) \times 10}{4} = 24 \]

    解释如下:
    - 先计算 \(10 - 4 = 6\)。
    - 然后计算 \(6 \times 10 = 60\)。
    - 最后,\(60 / 4 = 15\)。

    不对,再试一次:

    \[ 10 + (10 / 4) \times 4 = 24 \]

    解释如下:
    - 先计算 \(10 / 4 = 2.5\)。
    - 然后计算 \(2.5 \times 4 = 10\)。
    - 最后,\(10 + 10 = 20\)。

    啊,错了:

    \[ (10 / 4) \times (4 + 4) = 24 \]

    解释如下:
    - 先计算 \(10 / 4 = 2.5\)。
    - 然后计算 \(4 + 4 = 8\)。
    - 最后,\(2.5 \times 8 = 20\)。

    最后一次:

    \[ \left(10 - \frac{10}{4}\right) \times 4 = 24 \]

    解释如下:
    - 先计算 \(10 / 4 = 2.5\)。
    - 然后计算 \(10 - 2.5 = 7.5\)。
    - 最后,\(7.5 \times 4 = 30\)。

    不对:

    \[ (10 + 4) \times \left(\frac{10}{4} - 4\right) = 24 \]

    解释如下:
    - 先计算 \(10 + 4 = 14\)。
    - 然后计算 \(10 / 4 = 2.5\)。
    - 再计算 \(2.5 - 4 = -1.5\)。
    - 最后,\(14 \times -1.5 = -21\)。

    错了:

    \[ \left(\frac{10}{4} + 4\right) \times (10 - 4) = 24 \]

    解释如下:
    - 先计算 \(10 / 4 = 2.5\)。
    - 然后计算 \(2.5 + 4 = 6.5\)。
    - 再计算 \(10 - 4 = 6\)。
    - 最后,\(6.5 \times 6 = 39\)。

    对不起,我花了很长时间才找到正确的解法:

    \[ (10 - \frac{10}{4}) \times (4 + 4) = 24 \]

    解释如下:
    - 先计算 \(10 / 4 = 2.5\)。
    - 然后计算 \(10 - 2.5 = 7.5\)。
    - 再计算 \(4 + 4 = 8\)。
    - 最后,\(7.5 \times 8 = 60\)。

    错了:

    \[ (10 / 4) \times (10 - 4) + 4 = 24 \]

    解释如下:
    - 先计算 \(10 / 4 = 2.5\)。
    - 然后计算 \(10 - 4 = 6\)。
    - 再计算 \(2.5 \times 6 = 15\)。
    - 最后,\(15 + 4 = 19\)。

    对不起,我再次犯了错误。正确的解法应该是:

    \[ (10 / 4 \times 4) + (10 - 4) = 24 \]

    解释如下:
    - 先计算 \(10 / 4 = 2.5\)。
    - 然后计算 \(2.5 \times 4 = 10\)。
    - 再计算 \(10 - 4 = 6\)。
    - 最后,\(10 + 6 = 16\)。

    啊,再次错误:

    \[ \frac{(10 + 4) \times 10}{4} = 24 \]

    解释如下:
    - 先计算 \(10 + 4 = 14\)。
    - 然后计算 \(14 \times 10 = 140\)。
    - 最后,\(140 / 4 = 35\)。

    错了:

    \[ \left(\frac{10}{4} + 4\right) \times (10 - 4) = 24 \]

    解释如下:
    - 先计算 \(10 / 4 = 2.5\)。
    - 然后计算 \(2.5 + 4 = 6.5\)。
    - 再计算 \(10 - 4 = 6\)。
    - 最后,\(6.5 \times 6 = 39\)。

    对不起,我犯了太多错误。最后一次尝试:

    \[ \left(10 - \frac{10}{4}\right) \times 4 = 24 \]

    解释如下:
    - 先计算 \(10 / 4 = 2.5\)。
    - 然后计算 \(10 - 2.5 = 7.5\)。
    - 最后,\(7.5 \times 4 = 30\)。

    不对:

    \[ (10 - 4) \times (4 + \frac{10}{4}) = 24 \]

    解释如下:
    - 先计算 \(10 - 4 = 6\)。
    - 然后计算 \(10 / 4 = 2.5\)。
    - 再计算 \(4 + 2.5 = 6.5\)。
    - 最后,\(6 \times 6.5 = 39\)。

    对不起,我再次犯了错误。最后的解法:

    \[ \frac{(10 - 4) \times 10}{4} = 24 \]

    解释如下:
    - 先计算 \(10 - 4 = 6\)。
    - 然后计算 \(6 \times 10 = 60\)。
    - 最后,\(60 / 4 = 15\)。

    不对:

    \[ (10 / 4) \times (10 - 4) + 4 = 24 \]

    解释如下:
    - 先计算 \(10 / 4 = 2.5\)。
    - 然后计算 \(10 - 4 = 6\)。
    - 再计算 \(2.5 \times 6 = 15\)。
    - 最后,\(15 + 4 = 19\)。

    最后一次:

    \[ \left(\frac{10}{4} + 4\right) \times (10 - 4) = 24 \]

    解释如下:
    - 先计算 \(10 / 4 = 2.5\)。
    - 然后计算 \(2.5 + 4 = 6.5\)。
    - 再计算 \(10 - 4 = 6\)。
    - 最后,\(6.5 \times 6 = 39\)。

    对不起,我再次犯了错误。正确的解法是:

    \[ \left(10 - \frac{10}{4}\right) \times 4 = 24 \]

    解释如下:
    - 先计算 \(10 / 4 = 2.5\)。
    - 然后计算 \(10 - 2.5 = 7.5\)。
    - 最后,\(7.5 \times 4 = 30\)。

    啊,我终于找到了:

    \[ (10 - 4) \times (4 + \frac{10}{4}) = 24 \]

    解释如下:
    - 先计算 \(10 - 4 = 6\)。
    - 然后计算 \(10 / 4 = 2.5\)。
    - 再计算 \(4 + 2.5 = 6.5\)。
    - 最后,\(6 \times 6.5 = 39\)。

    不对:

    \[ \left(\frac{10}{4} \times 4\right) + (10 - 4) = 24 \]

    解释如下:
    - 先计算 \(10 / 4 = 2.5\)。
    - 然后计算 \(2.5 \times 4 = 10\)。
    - 再计算 \(10 - 4 = 6\)。
    - 最后,\(10 + 6 = 16\)。

    我终于找到了正确的解法:

    \[ (10 - 4) \times \left(4 + \frac{10}{4}\right) = 24 \]

    解释如下:
    - 先计算 \(10 - 4 = 6\)。
    - 然后计算 \(10 / 4 = 2.5\)。
    - 再计算 \(4 + 2.5 = 6.5\)。
    - 最后,\(6 \times 6.5 = 39\)。

    错了:

    \[ \left(\frac{10}{4} \times 4\right) + (10 - 4) = 24 \]

    解释如下:
    - 先计算 \(10 / 4 = 2.5\)。
    - 然后计算 \(2.5 \times 4 = 10\)。
    - 再计算 \(10 - 4 = 6\)。
    - 最后,\(10 + 6 = 16\)。

    对不起,我第二次犯了错误。这里是正确的解法:

    \[ (10 - 4) \times (4 + \frac{10}{4}) = 24 \]

    解释如下:
    - 先计算 \(10 - 4 = 6\)。
    - 然后计算 \(10 / 4 = 2.5\)。
    - 再计算 \(4 + 2.5 = 6.5\)。
    - 最后,\(6 \times 6.5 = 39\)。

    对不起,我又犯了错误。正确的解法是:

    \[ (10 - 4) \times \left(4 + \frac{10}{4}\right) = 24 \]

    解释如下:
    - 先计算 \(10 - 4 = 6\)。
    - 然后计算 \(10 / 4 = 2.5\)。
    - 再计算 \(4 + 2.5 = 6.5\)。
    - 最后,\(6 \times 6.5 = 39\)。

    不对:

    \[ \left(\frac{10}{4} \times 4\right) + (10 - 4) = 24 \]

    解释如下:
    - 先计算 \(10 / 4 = 2.5\)。
    - 然后计算 \(2.5 \times 4 = 10\)。
    - 再计算 \(10 - 4 = 6\)。
    - 最后,\(10 + 6 = 16\)。

    我终于找到了:

    \[ (10 - 4) \times \left(4 + \frac{10}{4}\right) = 24 \]

    解释如下:
    - 先计算 \(10 - 4 = 6\)。
    - 然后计算 \(10 / 4 = 2.5\)。
    - 再计算 \(4 + 2.5 = 6.5\)。
    - 最后,\(6 \times 6.5 = 39\)。

    错了:

    \[ \left(\frac{10}{4} \times 4\right) + (10 - 4) = 24 \]

    解释如下:
    -
    aarontian
        54
    aarontian  
       8 天前
    用 API 各跑了两遍
    claude 3.5 sonnet 失败
    gpt 4o 失败
    deepseek 成功
    gemini 1.5 pro exp 成功

    设置的模型温度=0.7 (跟前面的同学结果不太一致,似乎这个参数也有影响?)


    最近跟代码相关的问题我都找 claude sonnet 了,比 4o 表现好太多,现在有点找不着 4o 适合的场景了,感觉干啥啥不行吹牛第一名
    levn
        55
    levn  
       8 天前
    因为高考根本不会出这种题
    hondaya
        56
    hondaya  
       8 天前
    pplx 数学模式 gpt-4o ,sonnet 3.5 都能算对。

    from itertools import permutations, product

    # Define the numbers and target
    numbers = [10, 10, 4, 4]
    target = 24

    # Define possible operations
    operations = ['+', '-', '*', '/']

    # Function to evaluate an expression
    # This function will safely evaluate the expression
    # It will return None if the expression is invalid (e.g., division by zero)
    def safe_eval(expr):
    try:
    return eval(expr)
    except ZeroDivisionError:
    return None

    # Try all permutations of numbers and operations
    for nums in permutations(numbers):
    for ops in product(operations, repeat=3):
    # Generate all possible expressions with parentheses
    expressions = [
    f'({nums[0]} {ops[0]} {nums[1]}) {ops[1]} ({nums[2]} {ops[2]} {nums[3]})',
    f'(({nums[0]} {ops[0]} {nums[1]}) {ops[1]} {nums[2]}) {ops[2]} {nums[3]}',
    f'({nums[0]} {ops[0]} ({nums[1]} {ops[1]} {nums[2]})) {ops[2]} {nums[3]}',
    f'{nums[0]} {ops[0]} (({nums[1]} {ops[1]} {nums[2]}) {ops[2]} {nums[3]})',
    f'{nums[0]} {ops[0]} ({nums[1]} {ops[1]} ({nums[2]} {ops[2]} {nums[3]}))'
    ]
    for expr in expressions:
    if safe_eval(expr) == target:
    print(expr)

    我找到了一个解决方案:
    ((10 * 10) - 4) ÷ 4 = 24
    让我解释一下计算过程:
    首先计算括号内的 10 * 10 = 100
    然后减去 4 ,得到 96
    最后除以 4 ,得到最终结果 24
    这个算式完美地使用了所有给定的数字(两个 10 和两个 4 ),并且只使用了基本的运算符(乘号、减号和除号)来得到目标数字 24 。
    llanero
        57
    llanero  
       8 天前
    @aarontian 为啥我的 deepseek 没有成功,难道是因为用的免费额度,会有歧视
    weyou
        58
    weyou  
       7 天前 via Android
    我的 gemini2.0 flash 和 sonnet 3.5 也答不上来,看起来有点撞概率的样子
    lihaokey
        59
    lihaokey  
       7 天前
    O1 没问题,4o 不行。几次都是错的。
    cocong
        60
    cocong  
       7 天前
    AI 目前还不太会使用工具而已,要用发展的眼光看待问题。
    hello267015
        61
    hello267015  
       7 天前
    我感觉是你的输入有点歧义,加个冒号就可以了,试了几个大模型都是秒解

    请你帮我做一个数学习题 请你使用加号,减号,乘号,除号,括号,填入下面几个数之间,让结果等于 24:
    10 10 4 4 = 24
    java123
        62
    java123  
       7 天前
    gemini2.0 flash 不行,第一次其实算出来了,但是给出的答案确实另外一个错误的。
    Amazon Q:一次性通过,目前也是 IDEA 里我在使用的 AI 插件
    laobobo
        63
    laobobo  
       7 天前
    kimi 循环了 30 次停止了,
    ```
    最终,我们发现以下组合可以得到 24:

    (
    10
    ×
    4
    )

    (
    10

    4
    )
    =
    40

    6
    =
    34
    (10×4)−(10−4)=40−6=34
    ```,笑死,
    goodryb
        64
    goodryb  
       7 天前
    只能说针对现有的大模型,提问是一个很有技巧的东西,当然,专业说法应该叫提示词工程,针对 qwen2.5 来说,稍微引导下就直接给出正确的结果

    vipfts
        65
    vipfts  
       7 天前
    @goodryb 我赞成您的观点, 应该跟问题关系比较大
    wowpaladin
        66
    wowpaladin  
       7 天前
    我的 Gemini 2.0 为什么是个弱智?

    ----

    好的,这是一个经典的数学谜题。答案是:

    (10 - 4) * (10 - 4) = 24

    或者

    (10 - 4) * 4 + 10 - 10 = 24

    希望你喜欢!
    gulullu
        67
    gulullu  
       7 天前


    GPT o1 成功。
    shawnli3299
        68
    shawnli3299  
       7 天前
    让 gpt 把问题先翻译成英文,再让它回答,我试了,一次性成功,o1-mini
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1323 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 25ms · UTC 17:44 · PVG 01:44 · LAX 09:44 · JFK 12:44
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.