Anthropic推出最强推理模型Claude 3.7 Sonnet,编程能力碾压Deepseek
在人工智能领域,Anthropic公司近日发布了其最新的AI模型——Claude 3.7 Sonnet。这款被称为“混合推理模型”的产品,旨在为用户提供前所未有的控制权,允许他们根据任务的复杂程度,调整AI的“思考”时间,从而优化响应速度和质量。
Claude 3.7 Sonnet的最大亮点在于其“思考模式”切换功能。用户可以根据需求,在标准模式和深度思考模式之间自由切换。在标准模式下,AI能够快速回应简单查询,例如“现在几点了?”而在深度思考模式下,AI会花更多时间进行复杂任务的处理,如规划两周的意大利旅行,考虑无麸质饮食需求等。Anthropic的产品管理负责人Dianne Penn表示:“我们认为,推理是AI的核心能力,而非需要单独付费获取的功能。”

人工智能模型对比:Claude 3.7 Sonnet 在各项任务中的表现均优于其前代产品,其扩展思维能力显著提升。(来源:Anthropic)
在性能方面,Claude 3.7 Sonnet在多项基准测试中表现出色。在扩展思考模式下,该模型在研究生水平的推理任务中达到了78.2%的准确率,挑战了OpenAI的最新模型,并超越了DeepSeek-R1。此外,该模型在零售工具使用和指令遵循等实际应用中也取得了显著提升,分别达到了81.2%和93.2%的高分。
此次发布的时机也引人注目。上个月,DeepSeek推出了一款AI模型,以更低的成本实现了与ChatGPT 4o相当的能力,震惊了科技界,并引发了对美国AI领导地位的担忧。Nvidia的股价因此下跌了17%。在此背景下,Anthropic押注于对AI推理的精确控制,而不仅仅是追求速度或成本优势。
除了Claude 3.7 Sonnet,Anthropic还推出了Claude Code,这是一款命令行AI编码助手。该工具允许开发者将复杂的工程任务直接交给AI处理,但在提交代码更改前需要人工审核,以确保负责任的AI开发。Penn指出:“用户仍需接受Claude所做的更改,扮演审阅者的角色。”
值得一提的是,Claude 3.7 Sonnet的定价保持在每百万输入token3美元,输出token15美元,即使增加了推理功能,价格也未上涨。这使得企业能够在不增加成本的情况下,利用AI处理从即时客户服务到复杂财务分析的各种任务。
Anthropic的这一系列举措,显示了其在企业AI市场中的积极布局,可能会重新定义企业构建软件和自动化工作的方式。随着AI技术的不断发展,企业需要灵活、高效的AI解决方案,以应对日益复杂的业务需求。Anthropic的混合推理模型和AI编码助手,正是为满足这一需求而生。
总的来说,Anthropic通过推出Claude 3.7 Sonnet和Claude Code,向AI行业发出了强有力的信号,展示了其在AI推理和企业应用领域的创新能力。这不仅为企业提供了更强大的工具,也为AI技术的发展指明了新的方向。
第一时间获取面向IT决策者的独家深度资讯,敬请关注IT经理网微信号:ctociocom
除非注明,本站文章均为原创或编译,未经许可严禁转载。
相关文章: