超碰av在线短片|中文字幕第一页日本|亚洲国产精品Va|亚洲一区二区中文字幕在线观看|日本青青草一级片|亚洲 福利 AV|中文字幕日版第一页|免费视频一区|五月丁香在线视.|黄色在线观看aa

Claude「最香」模型發(fā)布,速度翻倍價(jià)格大砍,編程能力直逼 GPT-5

Claude「最香」模型發(fā)布,速度翻倍價(jià)格大砍,編程能力直逼 GPT-5-有駕

就在剛剛,Anthropic 發(fā)布了 Claude Haiku 4.5。

先簡(jiǎn)單科普一下,Claude 家族有三個(gè)不同參數(shù)量級(jí)的模型:Claude Opus(大杯)、Sonnet(中杯)和 Haiku(小杯)。

這次更新最大的看點(diǎn)是,小杯 Claude Haiku 4.5 在模型性能保持高水準(zhǔn)的同時(shí),速度更快、價(jià)格更便宜了。

五個(gè)月前,Claude Sonnet 4 還是最先進(jìn)的模型之一?,F(xiàn)在新出的 Haiku 4.5 在編碼性能上幾乎和它打平手,但價(jià)格只要三分之一,速度還翻了兩倍多。

Claude「最香」模型發(fā)布,速度翻倍價(jià)格大砍,編程能力直逼 GPT-5-有駕

▲Chart comparing frontier models on SWE-bench Verified which measures performance on real-world coding tasks

具體來說,在用于衡量 AI 編碼能力的測(cè)試集 SWE-bench Verified 上,Haiku 4.5 取得了 73% 的成績(jī),什么概念?直接跟 Claude Sonnet 4 以及 OpenAI 最新的 GPT-5 站在同一水平線上。

在某些任務(wù)比如操控電腦方面,Haiku 4.5 甚至反殺了老大哥 Sonnet 4。

對(duì)于需要 AI 處理實(shí)時(shí)、低延遲任務(wù)的場(chǎng)景——比如聊天助手、客服代理或結(jié)對(duì)編程助手,Haiku 4.5 兼具高智能和出色速度,能帶來更好的體驗(yàn)。

使用 Claude Code 的開發(fā)者也會(huì)發(fā)現(xiàn),Haiku 4.5 讓整個(gè)編程過程——從多智能體協(xié)作到快速原型開發(fā)——都變得更靈敏高效。

Claude「最香」模型發(fā)布,速度翻倍價(jià)格大砍,編程能力直逼 GPT-5-有駕

當(dāng)然,兩周前發(fā)的 Sonnet 4.5 依然是 Anthropic 的旗艦?zāi)P?,歸屬全球編程模型第一檔次。但 Haiku 4.5 提供了另一個(gè)選項(xiàng):性能接近頂配,價(jià)格卻親民得多。

而且模型玩法更野了,Sonnet 4.5 可以把復(fù)雜問題拆成 N 個(gè)小任務(wù),然后指揮一堆 Haiku 4.5 并行開工,這配合相當(dāng)默契。

Anthropic 對(duì) Haiku 4.5 進(jìn)行了詳細(xì)的安全性和對(duì)齊性測(cè)試。

結(jié)果顯示,該模型的不良行為發(fā)生率較低,且比前代 Haiku 3.5 的對(duì)齊性顯著提高。在自動(dòng)化對(duì)齊評(píng)估中,Haiku 4.5 的總體偏離行為比 Sonnet 4.5 和 Opus 4.1 都更少。

也就是說,它目前是 Anthropic 家最安全的模型。

Claude「最香」模型發(fā)布,速度翻倍價(jià)格大砍,編程能力直逼 GPT-5-有駕

▲Comparison table of frontier models across popular benchmarks

至于價(jià)格嘛…Haiku 4.5 的定價(jià)為:每百萬輸入 token 1 美元,每百萬輸出 token 5 美元。

對(duì)比來看,GPT-5 mini 約為每百萬輸入 0.25 美元、輸出 2.5 美元,Google 的 Gemini 2.5 Flash 價(jià)格差不多。也就是說,Haiku 4.5 的價(jià)格大約是 GPT-5 mini 或 Flash 的 4 倍。

不過跟 Sonnet 4.5 比,它便宜了約三倍,性能卻幾乎沒差,這對(duì)開發(fā)者來說算是降本增效了。

但有一說一,數(shù)學(xué)不是它的強(qiáng)項(xiàng)。

知名博主 Dan Shipper 試用后發(fā)現(xiàn),Haiku 在算術(shù)上有點(diǎn)… 迷糊。

比如在測(cè)試 Uber 賬單的例子里,Haiku 雖然完美找出了所有相關(guān)郵件,但算總額時(shí)直接翻車。更尷尬的是,指出錯(cuò)誤后它承認(rèn)了——然后轉(zhuǎn)頭又犯了同樣的錯(cuò)

Dan Shipper 給出的中肯評(píng)價(jià)是:

如果你是開發(fā)者或創(chuàng)業(yè)者,正在用 Sonnet 4.5 構(gòu)建復(fù)雜的智能代理應(yīng)用,現(xiàn)在可以考慮切換到 Haiku。你能節(jié)省大量成本,而性能損失幾乎可以忽略。

如果你目前使用的是 Gemini 2.5 Flash 或 GPT-5 mini,建議試試 Haiku。雖然價(jià)格更高一些,但在需要調(diào)用工具和保持自主性的場(chǎng)景中,它的表現(xiàn)更好。

Claude「最香」模型發(fā)布,速度翻倍價(jià)格大砍,編程能力直逼 GPT-5-有駕

▲附上博客地址:
https://every.to/vibe-check/vibe-check-claude-haiku-4-5-anthropic-cooked

目前,Claude Haiku 4.5 現(xiàn)已在 Claude Code 和各類應(yīng)用中上線了。

開發(fā)者可以通過 Claude API、Amazon Bedrock 和 Google Cloud 的 Vertex AI 使用 Haiku 4.5,直接替代 Haiku 3.5 和 Sonnet 4,而且價(jià)格是 Anthropic 最香的那檔。

Claude「最香」模型發(fā)布,速度翻倍價(jià)格大砍,編程能力直逼 GPT-5-有駕

我們參考@zb1992 的提示詞,讓 Claude 4.5 Haiku 跑了一個(gè)鐘表 Demo,整體體驗(yàn)下來,代碼生成速度確實(shí)更快了,最終成品也令人滿意。

在下文這個(gè)經(jīng)典的推理計(jì)算題, Claude 4.5 Haiku 響應(yīng)速度優(yōu)勢(shì)就更明顯了,當(dāng)然,這也正是輕量級(jí)模型在實(shí)際應(yīng)用中的核心競(jìng)爭(zhēng)力所在。

Claude「最香」模型發(fā)布,速度翻倍價(jià)格大砍,編程能力直逼 GPT-5-有駕

另外,據(jù) The Information 報(bào)道,估值高達(dá) 1700 億美元的 Anthropic 近幾周已告訴投行顧問,計(jì)劃通過收購引入更多技術(shù)人才,同時(shí)拓展除編程助手之外的能力——畢竟目前編程這塊還是營(yíng)收大頭。

Claude「最香」模型發(fā)布,速度翻倍價(jià)格大砍,編程能力直逼 GPT-5-有駕

知情人士表示,鑒于 Anthropic 在向開發(fā)者提供編程類 AI 產(chǎn)品方面取得的成功,公司下一步可能會(huì)擴(kuò)展至其他開發(fā)者常用的軟件工具,比如自動(dòng)測(cè)試代碼漏洞的工具,或輔助軟件設(shè)計(jì)的工具。

另有消息稱,Anthropic 也可能通過收購開發(fā)面向特定行業(yè)的產(chǎn)品,例如金融服務(wù)、醫(yī)療保健或網(wǎng)絡(luò)安全,不過他們更傾向于交易金額在 5 億美元以下的小型收購項(xiàng)目。

目前看起來,在提升模型能力的同時(shí),Anthropic 也在積極布局生態(tài)。AI 圈的你追我趕,最終受益的還是開發(fā)者和用戶——更強(qiáng)的模型、更低的價(jià)格、更多的選擇。

作者:莫崇宇

#歡迎關(guān)注愛范兒官方微信公眾號(hào):愛范兒(微信號(hào):ifanr),更多精彩內(nèi)容第一時(shí)間為您奉上。

愛范兒|原文鏈接·查看評(píng)論·新浪微博
0

全部評(píng)論 (0)

暫無評(píng)論