《问到底》人工智能网站集成了多个主流的大模型,deepseek,腾讯混元,阿里通义,讯飞星火,文心一言,不用出站,点击一下就能方便切换大模型
      本文以《问到底》人工智能网站作为实测对象,《问到底》集成了数学公式输入,方便输入复杂的数学公式以及各种特殊的符号,方便询问人工智能,并自动把人工智能解答的latex数学符号自动转成符合人工阅读的图片

       话不多说,以一道四年级小学奥数题为例子:
甲、乙两人岁数之和是一个两位数的质数.这个质数的数字之和是13,甲比乙也刚好大13岁.则甲
的年龄为多少岁.
讯飞星火回复:

点评:
可以看到,讯飞大模型的回答正确,思路也正确,但是用了解方程的方法,小学生能不能理解呢?
更改提示词为:
解答下面这道数学题,并给出详细的步骤,但是不能用方程的解法,用小学奥数的方法:
甲、乙两人岁数之和是一个两位数的质数.这个质数的数字之和是13,甲比乙也刚好大13岁.则甲
的年龄为多少岁?
但是很遗憾,讯飞大模型没有理解提示语,还是输出了同样的方法。
看腾讯混元的回复:

腾讯混元思路完全正确,也没有用方程的方法,完美,胜任辅导小学奥数
看阿里通义的回复:

阿里通义的答复思路简洁,但是也用了方程的方法,可能没有真正理解提示语,采用了方程的方法。

我们看最红的deepseek如何回复:

### 理解题目
首先,我们需要理解题目的意思:

1. 甲、乙两人岁数之和是一个两位数的质数。
2. 这个质数的数字之和是13。
3. 甲比乙刚好大13岁。

我们的目标是找出甲的年龄。

### 分析已知条件

#### 条件一:甲、乙两人岁数之和是一个两位数的质数。

这意味着甲和乙的年龄加起来是一个两位数,并且这个数是质数。质数是指只能被1和它本身整除的数,且大于1。

#### 条件二:这个质数的数字之和是13。

我们需要找出所有两位数的质数,然后计算它们的数字之和,看看哪些质数的数字之和等于13。

#### 条件三:甲比乙刚好大13岁。

这意味着甲的年龄减去乙的年龄等于13。

### 找出符合条件的质数

首先,我们需要列出所有两位数的质数。两位数的范围是10到99。我们列出这些质数:

11, 13, 17, 19, 23, 29, 31, 37, 41, 43, 47, 53, 59, 61, 67, 71, 73, 79, 83, 89, 97

接下来,我们需要计算这些质数的数字之和,看看哪些等于13。

让我们逐一计算:

- 11: 1 + 1 = 2 → 不等于13
- 13: 1 + 3 = 4 → 不等于13
- 17: 1 + 7 = 8 → 不等于13
- 19: 1 + 9 = 10 → 不等于13
- 23: 2 + 3 = 5 → 不等于13
- 29: 2 + 9 = 11 → 不等于13
- 31: 3 + 1 = 4 → 不等于13
- 37: 3 + 7 = 10 → 不等于13
- 41: 4 + 1 = 5 → 不等于13
- 43: 4 + 3 = 7 → 不等于13
- 47: 4 + 7 = 11 → 不等于13
- 53: 5 + 3 = 8 → 不等于13
- 59: 5 + 9 = 14 → 不等于13
- 61: 6 + 1 = 7 → 不等于13
- 67: 6 + 7 = 13 → 符合条件
- 71: 7 + 1 = 8 → 不等于13
- 73: 7 + 3 = 10 → 不等于13
- 79: 7 + 9 = 16 → 不等于13
- 83: 8 + 3 = 11 → 不等于13
- 89: 8 + 9 = 17 → 不等于13
- 97: 9 + 7 = 16 → 不等于13

经过计算,我们发现只有 67 的数字之和为13。因此,甲和乙的年龄之和是67岁。

### 确定甲和乙的年龄

根据条件三,甲比乙大13岁。设乙的年龄为 xx 岁,那么甲的年龄就是 x+13x+13 岁。

根据年龄之和为67岁,我们可以写出:

x+(x+13)=67x+(x+13)=67

简化方程:

2x+13=672x+13=67

接下来,我们解这个方程:

2x=67−132x=67−13
2x=542x=54
x=27x=27

因此,乙的年龄是27岁,甲的年龄是:

27+13=4027+13=40 岁。

### 验证答案

为了确保我们的答案正确,我们需要验证一下:

1. 年龄之和是否为67岁?

甲40岁,乙27岁,40 + 27 = 67 → 符合条件。

2. 67是否为质数?

67只能被1和67整除,是质数 → 符合条件。

3. 67的数字之和是否为13?

6 + 7 = 13 → 符合条件。

4. 甲比乙大13岁?

40 - 27 = 13 → 符合条件。

所有条件都满足,因此我们的答案是正确的。

### 最终答案

甲的年龄是 40岁。

deep seek回复太长了,非常啰嗦,浪费token,而且也用了方程的方法,没有理解提示语

综上所述,腾讯混元表现最完美,完全理解了提示词,其他大模型也胜任,家长/老师被人工智能取代,不说完全取代了,起码正在路上。

Logo

欢迎加入 MCP 技术社区!与志同道合者携手前行,一同解锁 MCP 技术的无限可能!

更多推荐