大家好,我是Ai学习的老章
要说我最喜爱的编程类大模型,必须是Claude-3.5-Sonnet,没有之一
它永远是我的默认
可惜我的Cursor取消订阅了,Windsurf还未更新Claude-3.7-sonnet-thinking
简单介绍Claude 3.7
先简单介绍一下3.7如何强悍吧
一句话总结:它可以一次性完成复杂编程任务,大幅降低开发者的工作量。
主要能力:
- 代码搜索与阅读
- 自动化代码编辑
- 编写和运行测试
- GitHub 代码提交
- 使用命令行工具
Claude-3.7-sonnet 实战演示
请看VCR
111
这段视频展示了人工智能在帮助你理解复杂主题方面的真正潜力。请注意,万一分析不够充分,你可以向 Claude 3.7 索要一个模拟器。code & reasoning.相结合的神奇之处。
222
在一个提示下创建了这个《我的世界》克隆体,并使其在工件中立即可以玩。
333
在 Claude 3.7 Sonnet(思考模式)中尝试了这个提示,它甚至生成了一些控制项。
Claude 3.7 Sonnet 与 Claude Code 功能定位、核心功能、性能亮点
📢 Claude 3.7 Sonnet
- 定位:目前Anthropic最智能的模型,也是市场上首个混合推理模型
- 核心特点:
- 一个模型同时支持两种工作模式:快速回复和扩展思考
- 在API中,用户可以控制模型思考的token数量(最高128K),平衡速度、成本和回答质量
- 特别强化了编程和前端开发能力
- 性能亮点:
- 在SWE-bench Verified和TAU-bench等实际软件开发基准测试中达到了最先进水平
- 指令遵循、通用推理、多模态和编码能力都有显著提升
- 被多家合作伙伴(Cursor、Cognition、Vercel、Replit、Canva)评为编码能力最佳
- 可用性:
- 所有Claude计划都可使用(免费版、专业版、团队版和企业版)
- 也可通过Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI使用
- 扩展思考模式除免费版外所有平台均可使用
- 价格保持不变:输入$3/百万tokens,输出$15/百万tokens(包括思考tokens)
📢 Claude Code
- 定位:Anthropic首个智能编码工具,目前处于有限研究预览阶段
- 功能:
- 可以搜索和阅读代码、编辑文件、编写和运行测试
- 能够提交和推送代码到GitHub,使用命令行工具
- 在每个步骤都保持用户参与
- 实用效果:
- 已在Anthropic团队内部成为不可或缺的工具
- 特别适合测试驱动开发、复杂问题调试和大规模重构
- 早期测试表明可以一次性完成通常需要45+分钟手动工作的任务
📢 其他更新
- GitHub集成现已在所有Claude计划中可用
- 安全性改进:与前代相比,不必要的请求拒绝减少了45%
- 发布了系统卡片(system card),详细介绍了责任扩展政策评估
Claude 3.5 本身就是 AI 编程实践中的最佳模型。Claude 3.7 则进一步巩固优势,提升了 20%,妥妥第一了。
并且官方特别强调,这次针对数学和计算机科学竞赛问题的优化较少,而是将重点转向更能反映用户需求的现实任务。
Claude3.7 还是一个混合推理模型,开启推理模式后,推理和数学相关任务指标也会提升,但是并未达到 o1 grok3 这样的专门的推理模型的水平。
Claude 3.7 Sonnet 和 Claude Code 标志着朝着能够真正增强人类能力的 AI 系统迈出了重要一步。
Claude 5年计划
Claude正在经历从2024年的基础辅助功能,到2025年的专家级协作能力,最终发展为2027年能够解决需要团队数年才能攻克的复杂问题的智能系统
-
2024年 - Claude 协助: 在这一阶段,Claude主要帮助个人更好地完成当前工作,提高效率,让每个人都能发挥最佳潜力。图中显示Claude正处于这一”协助”阶段。
-
2025年 - Claude 协作: 这是目前正在过渡的阶段。在2025年,Claude将能够独立完成数小时的专业级工作,与专家水平相当,扩展人们和团队的能力边界。Claude将成为真正的协作伙伴。
-
2027年 - Claude 开拓: 在未来的2027年,Claude将能够找到突破性解决方案,解决那些原本需要团队花费数年才能解决的挑战性问题。
参考: