地球上最聪明的编程大模型 Claude 3.7 来了.md

大家好，我是Ai学习的老章

要说我最喜爱的编程类大模型，必须是Claude-3.5-Sonnet，没有之一

它永远是我的默认

可惜我的Cursor取消订阅了，Windsurf还未更新Claude-3.7-sonnet-thinking

先简单介绍一下3.7如何强悍吧

一句话总结：它可以一次性完成复杂编程任务，大幅降低开发者的工作量。

主要能力：

请看VCR

111

这段视频展示了人工智能在帮助你理解复杂主题方面的真正潜力。请注意，万一分析不够充分，你可以向 Claude 3.7 索要一个模拟器。code & reasoning.相结合的神奇之处。

222

在一个提示下创建了这个《我的世界》克隆体，并使其在工件中立即可以玩。

333

在 Claude 3.7 Sonnet（思考模式）中尝试了这个提示，它甚至生成了一些控制项。

📢 Claude 3.7 Sonnet

定位：目前Anthropic最智能的模型，也是市场上首个混合推理模型
核心特点：
- 一个模型同时支持两种工作模式：快速回复和扩展思考
- 在API中，用户可以控制模型思考的token数量(最高128K)，平衡速度、成本和回答质量
- 特别强化了编程和前端开发能力
性能亮点：
- 在SWE-bench Verified和TAU-bench等实际软件开发基准测试中达到了最先进水平
- 指令遵循、通用推理、多模态和编码能力都有显著提升
- 被多家合作伙伴(Cursor、Cognition、Vercel、Replit、Canva)评为编码能力最佳
可用性：
- 所有Claude计划都可使用(免费版、专业版、团队版和企业版)
- 也可通过Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI使用
- 扩展思考模式除免费版外所有平台均可使用
- 价格保持不变：输入$3/百万tokens，输出$15/百万tokens(包括思考tokens)

📢 Claude Code

定位：Anthropic首个智能编码工具，目前处于有限研究预览阶段
功能：
- 可以搜索和阅读代码、编辑文件、编写和运行测试
- 能够提交和推送代码到GitHub，使用命令行工具
- 在每个步骤都保持用户参与
实用效果：
- 已在Anthropic团队内部成为不可或缺的工具
- 特别适合测试驱动开发、复杂问题调试和大规模重构
- 早期测试表明可以一次性完成通常需要45+分钟手动工作的任务

📢 其他更新

Claude 3.5 本身就是 AI 编程实践中的最佳模型。Claude 3.7 则进一步巩固优势，提升了 20%，妥妥第一了。

并且官方特别强调，这次针对数学和计算机科学竞赛问题的优化较少，而是将重点转向更能反映用户需求的现实任务。

Claude3.7 还是一个混合推理模型，开启推理模式后，推理和数学相关任务指标也会提升，但是并未达到 o1 grok3 这样的专门的推理模型的水平。

Claude 3.7 Sonnet 和 Claude Code 标志着朝着能够真正增强人类能力的 AI 系统迈出了重要一步。

Claude正在经历从2024年的基础辅助功能，到2025年的专家级协作能力，最终发展为2027年能够解决需要团队数年才能攻克的复杂问题的智能系统

2024年 - Claude 协助：在这一阶段，Claude主要帮助个人更好地完成当前工作，提高效率，让每个人都能发挥最佳潜力。图中显示Claude正处于这一”协助”阶段。
2025年 - Claude 协作：这是目前正在过渡的阶段。在2025年，Claude将能够独立完成数小时的专业级工作，与专家水平相当，扩展人们和团队的能力边界。Claude将成为真正的协作伙伴。
2027年 - Claude 开拓：在未来的2027年，Claude将能够找到突破性解决方案，解决那些原本需要团队花费数年才能解决的挑战性问题。

参考：