Home 解密一段字符串,DeepSeek vs ChatGPT o3.md
Post
Cancel

解密一段字符串,DeepSeek vs ChatGPT o3.md

太长不看: 最聪明的是 ChatGPT o3,也只有他完成了解密

大家好,我是 Ai 学习的老章

周末无聊测试了一下大模型的智商

方式:先用 Base64 把中文加密,然后看看哪些大模型可以完成解密

Base64 是网络上最常见的用于传输 8Bit 字节码的编码方式之一,包括小写字母 a-z、大写字母 A-Z、数字 0-9、符号”+”、”/”一共 64 个字符的字符集,(任何符号都可以转换成这个字符集中的字符,这个转换过程就叫做 base64 编码。

先测试了通用模型

明显不靠谱,豆包、通义千问,Claude-3.5-Sonnet 都不行。

Claude 3.5 Sonnet 识别出了这是经 Base64 编码的,但是解码失败

只能上推理模型了,先试试 DeepSeek

开启了漫长的思考

耗时 398 秒,整整六分钟,深度思考中它换了 N 多种方式,确定了是 Base64 编码,但是解密是错误的。

一直霸榜的 ChatGPT O3,我网络和账号都不太好,只能用 windsurf 中的 o3-mini,结果是秒出,结果正确✅

号称[[250220 马斯克还可以,“地球上最聪明的人工智能”Grok-3免费了]]

正常模式解密失败,Think 模式,经过 126 秒的思考,结果错误

DeepSeek 很强,但是还是不够强

我又重看了一下榜单,目前 o3 还是第一

马斯克的 Grok-3 号称超越了 o3-mini

这个解密任务而言,Crok-3 完全被 o3-mini 碾压了

This post is licensed under CC BY 4.0 by the author.