智东西
智东西8月6日音讯,今天,Anthropic精采发布Claude Opus 4.1。
据Anthropic公告,新模子在智能体器用调用、智能体编程与多言语问答材干上全面阑珊OpenAI o3,Anthropic还规划在往时数周内为模子推出更大幅度的校正。
▲Anthropic推文截图(着手:X)
Opus 4.1现已面向付费Claude用户及Claude Code提供,该版块同期登陆API、Amazon Bedrock和Google Cloud的Vertex AI平台,诞生者可通过API使用claude-opus-4-1-20250805版块。
在订价上,Opus 4.1与Opus 4保握一致,输入15好意思元(约合东说念主民币107.8元)/百万token,输出75好意思元(约合东说念主民币538.8元)/百万token。
性能方面,Opus 4.1在SWE-bench Verified上的顶级编码性能升迁至74.5%,该版块还增强了Claude的深度商酌与数据分析材干,阑珊是在细节跟踪和智能体搜索方面。
在GitHub上,相较于Opus 4,Claude Opus 4.1在无数材干维度均有升迁,其中多文献代码重构的性能高出尤为显赫。
Opus 4.1在智能体器用调用与多言语问答材干上阑珊OpenAI o3,在智能体编程方面的分数为74.5%和43.3%,大幅阑珊OpenAI o3和Gemini 2.5 Pro,但其在视觉推理和数学材干上与OpenAI o3和Gemini 2.5 Pro还有一定的差距。
Anthropic的公告中显露,Rakuten Group发现Opus 4.1擅长在大型代码库中精笃定位修正点,且不会进行无用要的退换或引入失误,其团队更倾向在平素调试任务中使用这种精确性。
Windsurf阐昭彰示,在其低级诞生者基准测试中,Opus 4.1比较Opus 4已毕了1个法子差的升迁,性能跃升幅度相配于从Sonnet 3.7升级至Sonnet 4。
结语:大模子竞赛插足“智能体期间”从基准测试成果不错看出,Anthropic此次推出的Claude Opus 4.1,主要在大模子的智能体干系材干上,举例智能体编程和智能体器用调用等方面,进行了升级侧重。
也从侧面反应出,如今的大模子运转朝着“给智能体提供更智能的大脑”的地点升级迭代开云体育(中国)官方网站,为智能体的进一步发展夯实地基。