Anthropic推出最强推理模型Claude 3.7 Sonnet，编程能力碾压Deepseek

作者： CashCat
2025年02月28日
人工智能

在人工智能领域，Anthropic公司近日发布了其最新的AI模型——Claude 3.7 Sonnet。这款被称为“混合推理模型”的产品，旨在为用户提供前所未有的控制权，允许他们根据任务的复杂程度，调整AI的“思考”时间，从而优化响应速度和质量。

Claude 3.7 Sonnet的最大亮点在于其“思考模式”切换功能。用户可以根据需求，在标准模式和深度思考模式之间自由切换。在标准模式下，AI能够快速回应简单查询，例如“现在几点了？”而在深度思考模式下，AI会花更多时间进行复杂任务的处理，如规划两周的意大利旅行，考虑无麸质饮食需求等。Anthropic的产品管理负责人Dianne Penn表示：“我们认为，推理是AI的核心能力，而非需要单独付费获取的功能。”

人工智能模型对比：Claude 3.7 Sonnet 在各项任务中的表现均优于其前代产品，其扩展思维能力显著提升。（来源：Anthropic）

在性能方面，Claude 3.7 Sonnet在多项基准测试中表现出色。在扩展思考模式下，该模型在研究生水平的推理任务中达到了78.2%的准确率，挑战了OpenAI的最新模型，并超越了DeepSeek-R1。此外，该模型在零售工具使用和指令遵循等实际应用中也取得了显著提升，分别达到了81.2%和93.2%的高分。

此次发布的时机也引人注目。上个月，DeepSeek推出了一款AI模型，以更低的成本实现了与ChatGPT 4o相当的能力，震惊了科技界，并引发了对美国AI领导地位的担忧。Nvidia的股价因此下跌了17%。在此背景下，Anthropic押注于对AI推理的精确控制，而不仅仅是追求速度或成本优势。

除了Claude 3.7 Sonnet，Anthropic还推出了Claude Code，这是一款命令行AI编码助手。该工具允许开发者将复杂的工程任务直接交给AI处理，但在提交代码更改前需要人工审核，以确保负责任的AI开发。Penn指出：“用户仍需接受Claude所做的更改，扮演审阅者的角色。”

值得一提的是，Claude 3.7 Sonnet的定价保持在每百万输入token3美元，输出token15美元，即使增加了推理功能，价格也未上涨。这使得企业能够在不增加成本的情况下，利用AI处理从即时客户服务到复杂财务分析的各种任务。

Anthropic的这一系列举措，显示了其在企业AI市场中的积极布局，可能会重新定义企业构建软件和自动化工作的方式。随着AI技术的不断发展，企业需要灵活、高效的AI解决方案，以应对日益复杂的业务需求。Anthropic的混合推理模型和AI编码助手，正是为满足这一需求而生。

总的来说，Anthropic通过推出Claude 3.7 Sonnet和Claude Code，向AI行业发出了强有力的信号，展示了其在AI推理和企业应用领域的创新能力。这不仅为企业提供了更强大的工具，也为AI技术的发展指明了新的方向。


第一时间获取面向IT决策者的独家深度资讯，敬请关注IT经理网微信号：ctociocom


   除非注明，本站文章均为原创或编译，未经许可严禁转载。


相关文章：


                    Deepseek满血版API+本地知识库最好用的五个客户端软件
                                      OpenAI：只有AI侵权合法化，我们才能击败中国
                                      谷歌放大招：Gemini Code Assist免费开放，AI编程要变天？
                                      AI再次突破安全红线，留给人类不到一年治理窗口
                                      韩国下架DeepSeek的安全反思
                                      美国拒签”巴黎声明“，AI霸权挑战多边治理
                                      不到4万元组装一台在本地运行完整DeepSeek大模型的PC
                                      DeepSeek炸街美股，英伟达哭了，苹果赢麻了？
                  



标签： claude, deepseek, 软件开发