热门推荐
立即入驻

Claude Sonnet 4.5来了!Claude官网介绍及如何使用与Claude 4.5国内最新使用指南

综合资讯2天前更新 admin
7 0
Claude Sonnet 4.5来了!Claude官网介绍及如何使用与Claude 4.5国内最新使用指南

Claude Sonnet 4.5:前沿智能的又一次跃升

十一假期还没开始,大模型的“卷王之战”已经打响。就在 DeepSeek 发布 V3.2-Exp 之后,Anthropic 也深夜官宣了全新一代重量级模型 —— Claude Sonnet 4.5

Claude Sonnet 4.5 是当下全球最强的编程模型,同时也是构建复杂智能体的最佳选择,以及最擅长使用计算机的模型。在推理与数学领域,它也展现出显著的提升。

代码无处不在。无论是应用程序、电子表格,还是各种软件工具,背后都依赖代码来驱动。而能熟练使用这些工具并解决复杂问题,正是现代工作方式的核心。

Claude Sonnet 4.5 让这一切成为可能。

Claude Sonnet 4.5来了!Claude官网介绍及如何使用与Claude 4.5国内最新使用指南

目录

Toggle

  • 编程领域的王者再升级
  • 全面产品升级
  • 多领域能力提升
  • 最符合对齐要求的前沿模型
  • Claude Agent SDK:智能体基础设施开放
  • 实验功能:「Imagine with Claude」
  • 定价与使用

编程领域的王者再升级

作为长期在编程领域占据优势的模型,Claude 新版本依旧强势。Anthropic 宣称,Sonnet 4.5 是目前世界上最好的编码模型

过去 GPT-5 Codex 曾以“可连续自主运行 7 小时”自豪,而 Claude Sonnet 4.5 把这个数字拉升至 30 多小时,意味着它在复杂任务中的持续性和可靠性实现了质的飞跃。

在软件工程评测 SWE-bench 中,Claude Sonnet 4.5 处于 SOTA 水平;在真实世界计算机任务测试平台 OSWorld 上,它的成绩达到了 61.4%,相比四个月前 Sonnet 4 的 42.2% 有显著提升。

Claude Sonnet 4.5来了!Claude官网介绍及如何使用与Claude 4.5国内最新使用指南

全面产品升级

这次更新,Anthropic 不仅带来了模型能力的跃升,还同步对产品体系进行了大幅升级:

  • Claude Code:新增用户呼声最高的 检查点功能,支持保存进度与即时回滚;更新终端界面并发布原生 VS Code 扩展

  • Claude API:新增上下文编辑功能与记忆工具,帮助智能体处理更长时间、更复杂的任务。

  • Claude 应用:直接整合代码执行、文件创建(文档、幻灯片、表格)能力。

  • 扩展生态:向 Max 用户开放 Claude for Chrome 扩展

  • 开发者工具:首次开放内部使用的 Claude Agent SDK,为构建智能体提供底层工具。

多领域能力提升

除了在编程上的优势,Claude Sonnet 4.5 在推理、数学和专业知识领域也展现出更高水平。金融、法律、医学及 STEM 领域的专家反馈,它在知识覆盖与逻辑推理上明显超越了此前的 Claude Opus 4.1 等旧版本。

Claude Sonnet 4.5 在真实世界软件编程评测 SWE-bench Verified 中达到 SOTA 水平,在复杂的多步骤任务中能够专注运行超过 30 小时

在真实计算机任务基准 OSWorld 上,Sonnet 4.5 以 61.4% 的成绩领先,仅四个月前,Sonnet 4 的成绩还停留在 42.2%。

不仅如此,它在推理、数学等广泛评估中也表现出更强实力。来自金融、法律、医学和 STEM 领域的专家普遍反馈:与包括 Opus 4.1 在内的旧模型相比,Sonnet 4.5 在专业知识与逻辑推理方面有了质的飞跃。

Claude Sonnet 4.5来了!Claude官网介绍及如何使用与Claude 4.5国内最新使用指南Claude Sonnet 4.5来了!Claude官网介绍及如何使用与Claude 4.5国内最新使用指南Claude Sonnet 4.5来了!Claude官网介绍及如何使用与Claude 4.5国内最新使用指南Claude Sonnet 4.5来了!Claude官网介绍及如何使用与Claude 4.5国内最新使用指南

 

最符合对齐要求的前沿模型

Anthropic 表示,Claude Sonnet 4.5 不仅是性能最强的模型,也是迄今为止 对齐度最高的前沿模型

通过更广泛的安全训练,它有效减少了谄媚、欺骗、权力攫取以及鼓励妄想等风险行为。

在智能体与计算机使用场景下,Claude 也在抵御 提示注入攻击(prompt injection)方面取得显著进展。

Claude Sonnet 4.5 在 AI 安全等级 3(ASL-3) 保护措施下发布,配备了可检测潜在危险输入输出的 分类器,特别针对化学、生物、放射性等高风险内容。Anthropic 已在减少误报方面取得十倍以上的改进,并将继续优化。

更详细的安全与一致性评估可在系统卡中查阅,其中首次包含基于「机制可解释性」技术的测试。

Claude Sonnet 4.5来了!Claude官网介绍及如何使用与Claude 4.5国内最新使用指南

Claude Agent SDK:智能体基础设施开放

经过半年以上的迭代,Anthropic 将其用于构建 Claude Code 的底层基础设施向开发者开放,称为 Claude Agent SDK

它不仅适用于编程,还能支持各种智能体任务,帮助开发者解决 长任务记忆管理、权限控制、子智能体协作等核心难题。

换句话说,开发者现在拥有与 Anthropic 相同的工具,可以自由搭建属于自己的强大智能体。


实验功能:「Imagine with Claude」

作为额外惊喜,Anthropic 同步推出临时研究预览 —— Imagine with Claude

在这一实验中,Claude 可以 实时生成软件,无需预先设定功能或代码,完全根据用户的请求即时创造与调整。

这一功能目前对 Max 订阅用户开放五天,可在 claude.ai/imagine 体验。

定价与使用

Claude Sonnet 4.5 已全面上线。开发者可以通过 Claude API 直接调用 claude-sonnet-4-5,定价与 Sonnet 4 保持一致,也可以使用神马中转API(api.whatai.cc)国内使用:

  • 输入:3 美元 / 百万 token

  • 输出:15 美元 / 百万 token


总结:

Claude Sonnet 4.5 不只是 Anthropic 的新模型,它代表了 编程能力、智能体构建与计算机使用的全面跃升,并在对齐与安全性上树立了新标准。

从长时间自主任务,到多领域知识与推理,再到对开发者的 SDK 开放,Claude Sonnet 4.5 展示了下一代 AI 的潜力。

© 版权声明

相关文章

暂无评论

none
暂无评论...