Home 地球上最聪明的编程大模型 Claude 3.7 来了.md
Post
Cancel

地球上最聪明的编程大模型 Claude 3.7 来了.md

大家好,我是Ai学习的老章

要说我最喜爱的编程类大模型,必须是Claude-3.5-Sonnet,没有之一

它永远是我的默认

可惜我的Cursor取消订阅了,Windsurf还未更新Claude-3.7-sonnet-thinking

简单介绍Claude 3.7

先简单介绍一下3.7如何强悍吧

一句话总结:它可以一次性完成复杂编程任务,大幅降低开发者的工作量。

主要能力:

  • 代码搜索与阅读
  • 自动化代码编辑
  • 编写和运行测试
  • GitHub 代码提交
  • 使用命令行工具

Claude-3.7-sonnet 实战演示

请看VCR

111

这段视频展示了人工智能在帮助你理解复杂主题方面的真正潜力。请注意,万一分析不够充分,你可以向 Claude 3.7 索要一个模拟器。code & reasoning.相结合的神奇之处。

222

在一个提示下创建了这个《我的世界》克隆体,并使其在工件中立即可以玩。

333

在 Claude 3.7 Sonnet(思考模式)中尝试了这个提示,它甚至生成了一些控制项。

Claude 3.7 Sonnet 与 Claude Code 功能定位、核心功能、性能亮点

📢 Claude 3.7 Sonnet

  • 定位:目前Anthropic最智能的模型,也是市场上首个混合推理模型
  • 核心特点:
    • 一个模型同时支持两种工作模式:快速回复和扩展思考
    • 在API中,用户可以控制模型思考的token数量(最高128K),平衡速度、成本和回答质量
    • 特别强化了编程和前端开发能力
  • 性能亮点:
    • 在SWE-bench Verified和TAU-bench等实际软件开发基准测试中达到了最先进水平
    • 指令遵循、通用推理、多模态和编码能力都有显著提升
    • 被多家合作伙伴(Cursor、Cognition、Vercel、Replit、Canva)评为编码能力最佳
  • 可用性:
    • 所有Claude计划都可使用(免费版、专业版、团队版和企业版)
    • 也可通过Anthropic API、Amazon Bedrock和Google Cloud的Vertex AI使用
    • 扩展思考模式除免费版外所有平台均可使用
    • 价格保持不变:输入$3/百万tokens,输出$15/百万tokens(包括思考tokens)

📢 Claude Code

  • 定位:Anthropic首个智能编码工具,目前处于有限研究预览阶段
  • 功能:
    • 可以搜索和阅读代码、编辑文件、编写和运行测试
    • 能够提交和推送代码到GitHub,使用命令行工具
    • 在每个步骤都保持用户参与
  • 实用效果:
    • 已在Anthropic团队内部成为不可或缺的工具
    • 特别适合测试驱动开发、复杂问题调试和大规模重构
    • 早期测试表明可以一次性完成通常需要45+分钟手动工作的任务

📢 其他更新

  • GitHub集成现已在所有Claude计划中可用
  • 安全性改进:与前代相比,不必要的请求拒绝减少了45%
  • 发布了系统卡片(system card),详细介绍了责任扩展政策评估

Claude 3.5 本身就是 AI 编程实践中的最佳模型。Claude 3.7 则进一步巩固优势,提升了 20%,妥妥第一了。

并且官方特别强调,这次针对数学和计算机科学竞赛问题的优化较少,而是将重点转向更能反映用户需求的现实任务。

Claude3.7 还是一个混合推理模型,开启推理模式后,推理和数学相关任务指标也会提升,但是并未达到 o1 grok3 这样的专门的推理模型的水平。

Claude 3.7 Sonnet 和 Claude Code 标志着朝着能够真正增强人类能力的 AI 系统迈出了重要一步。

Claude 5年计划

Claude正在经历从2024年的基础辅助功能,到2025年的专家级协作能力,最终发展为2027年能够解决需要团队数年才能攻克的复杂问题的智能系统

  1. 2024年 - Claude 协助: 在这一阶段,Claude主要帮助个人更好地完成当前工作,提高效率,让每个人都能发挥最佳潜力。图中显示Claude正处于这一”协助”阶段。

  2. 2025年 - Claude 协作: 这是目前正在过渡的阶段。在2025年,Claude将能够独立完成数小时的专业级工作,与专家水平相当,扩展人们和团队的能力边界。Claude将成为真正的协作伙伴。

  3. 2027年 - Claude 开拓: 在未来的2027年,Claude将能够找到突破性解决方案,解决那些原本需要团队花费数年才能解决的挑战性问题。

参考:

Claude 3.7 Sonnet and Claude Code

claude-3-7-sonnet-system-card.pdf

This post is licensed under CC BY 4.0 by the author.