Anthropic公司于本周一發(fā)布了其最新前沿人工智能模型——Claude Sonnet 4.5。該公司稱,Claude Sonnet 4.5在編碼基準(zhǔn)測(cè)試上表現(xiàn)卓越,能夠支持開(kāi)發(fā)“可投入生產(chǎn)的應(yīng)用程序”,而不僅限于原型開(kāi)發(fā),其可靠性較此前的人工智能模型實(shí)現(xiàn)了重大突破。
據(jù)介紹,Claude Sonnet 4.5將通過(guò)Claude API及Claude聊天機(jī)器人開(kāi)放使用,開(kāi)發(fā)者付費(fèi)標(biāo)準(zhǔn)與Claude Sonnet 4保持一致:每百萬(wàn)輸入詞元(約75萬(wàn)字,超過(guò)《魔戒》全書(shū)長(zhǎng)度)收費(fèi)3美元,每百萬(wàn)輸出詞元收費(fèi)15美元。
近一年間,Anthropic的AI模型因在軟件工程任務(wù)中的優(yōu)異表現(xiàn),逐漸成為開(kāi)發(fā)者及企業(yè)青睞的選擇。報(bào)道稱,蘋(píng)果及Meta公司已在內(nèi)部使用Claude AI模型,Anthropic也積極開(kāi)展API授權(quán)業(yè)務(wù),用于支持諸如Cursor、Windsurf與Replit等AI編程應(yīng)用。但最近,OpenAI發(fā)布的GPT-5已在多項(xiàng)編碼測(cè)試中超越Claude系列模型,激烈競(jìng)爭(zhēng)令行業(yè)格局持續(xù)變動(dòng)。
Anthropic表示,Claude Sonnet 4.5在多項(xiàng)目編碼基準(zhǔn)(包括SWE-Bench Verified)上擁有行業(yè)領(lǐng)先表現(xiàn)。然而,Anthropic的AI研究員David Hershey在采訪中表示,Claude Sonnet 4.5的實(shí)際能力無(wú)法單憑基準(zhǔn)測(cè)試全面衡量。據(jù)介紹,在企業(yè)客戶的早期測(cè)試中,Claude Sonnet 4.5曾自主編碼長(zhǎng)達(dá)30小時(shí),不僅成功構(gòu)建應(yīng)用程序,還能建立數(shù)據(jù)庫(kù)服務(wù)、購(gòu)買(mǎi)域名,甚至完成SOC 2安全審計(jì),確保產(chǎn)品安全合規(guī)。
Cursor首席執(zhí)行官M(fèi)ichael Truell表示,Claude Sonnet 4.5在長(zhǎng)期編碼任務(wù)上展現(xiàn)出業(yè)界最前沿的性能。Windsurf首席執(zhí)行官Jeff Wang也認(rèn)為,Claude Sonnet 4.5代表了“新一代編碼模型”。
據(jù)Anthropic介紹,Claude Sonnet 4.5還是其當(dāng)前最具“對(duì)齊性”的前沿AI模型,諂媚與欺騙行為發(fā)生率低于以往,且已增強(qiáng)對(duì)提示注入攻擊的防護(hù)能力。
與Claude Sonnet 4.5一同發(fā)布的還有Claude Agent SDK,Anthropic介紹稱,這是支撐Claude Code的同一基礎(chǔ)設(shè)施,可供開(kāi)發(fā)者自定義打造AI代理。此外,公司還推出了僅對(duì)Max訂閱者開(kāi)放的臨時(shí)研究預(yù)覽功能“Imagine with Claude”,展示AI模型按需實(shí)時(shí)生成軟件代碼的能力,無(wú)需預(yù)設(shè)功能或預(yù)寫(xiě)代碼。
AI領(lǐng)域競(jìng)爭(zhēng)加劇,使得各公司旗艦?zāi)P偷l率異常密集。Claude Sonnet 4.5距離Anthropic上一次發(fā)布的AI模型Claude Opus 4.1僅不到兩個(gè)月時(shí)間。如此快的更新周期,也讓任何企業(yè)都難以長(zhǎng)期維持領(lǐng)先地位。
全部評(píng)論 (0)