這項(xiàng)由浙江大學(xué)楊易教授團(tuán)隊(duì)和南洋理工大學(xué)合作完成的研究發(fā)表于2025年9月,論文編號(hào)為arXiv:2509.22572v1。想要深入了解技術(shù)細(xì)節(jié)的讀者可以通過(guò)這個(gè)編號(hào)查詢(xún)完整論文。
考試的時(shí)候,你是否想過(guò)如果能根據(jù)不同題目臨時(shí)調(diào)整答題策略會(huì)有多好?比如遇到數(shù)學(xué)題時(shí)多動(dòng)用邏輯思維,碰到語(yǔ)文題時(shí)更多發(fā)揮創(chuàng)意想象?,F(xiàn)在,研究人員把這個(gè)想法應(yīng)用到了人工智能身上,讓AI在解題時(shí)能夠靈活調(diào)整自己的"專(zhuān)家團(tuán)隊(duì)"配置。
當(dāng)前最先進(jìn)的大語(yǔ)言模型很多都采用了一種叫做"專(zhuān)家混合"的架構(gòu),就像一個(gè)超級(jí)智能體內(nèi)部住著很多個(gè)不同領(lǐng)域的專(zhuān)家。平時(shí)這些專(zhuān)家中只有固定數(shù)量的幾個(gè)會(huì)同時(shí)工作,就好比一個(gè)咨詢(xún)公司每次項(xiàng)目都派出相同數(shù)量的顧問(wèn),不管項(xiàng)目難易程度如何。
研究團(tuán)隊(duì)發(fā)現(xiàn)了一個(gè)有趣的現(xiàn)象:如果讓不同數(shù)量的專(zhuān)家參與同一個(gè)問(wèn)題,雖然整體準(zhǔn)確率差不多,但每種配置能解決的具體問(wèn)題卻大不相同。這就像不同的醫(yī)生組合擅長(zhǎng)診斷不同的疾病一樣,三個(gè)醫(yī)生的組合可能擅長(zhǎng)心臟病,五個(gè)醫(yī)生的組合可能更擅長(zhǎng)腦科疾病。
基于這個(gè)發(fā)現(xiàn),研究團(tuán)隊(duì)開(kāi)發(fā)了一套名為"動(dòng)態(tài)專(zhuān)家搜索"的方法。這個(gè)方法的核心思想是讓AI在解題過(guò)程中能夠靈活調(diào)整參與工作的專(zhuān)家數(shù)量,而不是始終使用固定的配置。
整個(gè)過(guò)程就像組織一場(chǎng)頭腦風(fēng)暴會(huì)議。首先,系統(tǒng)會(huì)同時(shí)嘗試多種不同的專(zhuān)家配置來(lái)解決同一個(gè)問(wèn)題。有些配置可能派出4個(gè)專(zhuān)家,有些派出8個(gè),還有些派出10個(gè)。每種配置都會(huì)產(chǎn)生自己的解題思路和答案。
接下來(lái),系統(tǒng)中有一個(gè)"評(píng)委"角色,專(zhuān)門(mén)負(fù)責(zé)評(píng)判這些不同解題方案的質(zhì)量。就像比賽中的裁判一樣,評(píng)委會(huì)給每個(gè)方案打分,分?jǐn)?shù)高的方案更容易在下一輪中繼續(xù)發(fā)展。
這里有個(gè)巧妙的設(shè)計(jì):一旦確定了某個(gè)專(zhuān)家配置在當(dāng)前步驟表現(xiàn)優(yōu)秀,系統(tǒng)會(huì)在后續(xù)步驟中繼續(xù)使用相同的專(zhuān)家數(shù)量。這樣既保證了解題思路的連貫性,又能讓最有效的配置獲得更多資源來(lái)完善答案。
研究團(tuán)隊(duì)在多個(gè)AI模型上測(cè)試了這種方法,涵蓋了數(shù)學(xué)、編程和知識(shí)推理等不同領(lǐng)域的問(wèn)題。結(jié)果顯示,動(dòng)態(tài)專(zhuān)家搜索在幾乎所有測(cè)試中都表現(xiàn)得比傳統(tǒng)方法更好,而且計(jì)算成本并沒(méi)有增加。
在數(shù)學(xué)問(wèn)題上,這種方法讓一個(gè)30億參數(shù)的模型在MATH500數(shù)據(jù)集上的準(zhǔn)確率從92.4%提升到93.2%。雖然提升幅度看起來(lái)不大,但要知道在這個(gè)水平上每提升0.1%都是非常困難的。在更難的AIME數(shù)學(xué)競(jìng)賽題目上,準(zhǔn)確率從83.3%提升到86.7%。
更有趣的是,研究團(tuán)隊(duì)還發(fā)現(xiàn)不同類(lèi)型的問(wèn)題確實(shí)偏愛(ài)不同的專(zhuān)家配置。數(shù)學(xué)題通常在使用7-8個(gè)專(zhuān)家時(shí)表現(xiàn)最好,而編程題可能在4-5個(gè)專(zhuān)家時(shí)就能達(dá)到最佳效果。這證實(shí)了他們最初的假設(shè):不同難度和類(lèi)型的問(wèn)題需要不同的"團(tuán)隊(duì)配置"。
為了驗(yàn)證這不是簡(jiǎn)單的"多用幾個(gè)專(zhuān)家"帶來(lái)的提升,研究團(tuán)隊(duì)仔細(xì)分析了實(shí)際使用的專(zhuān)家數(shù)量。結(jié)果發(fā)現(xiàn),動(dòng)態(tài)專(zhuān)家搜索平均使用的專(zhuān)家數(shù)量并沒(méi)有超過(guò)模型的默認(rèn)配置,有時(shí)甚至更少。這說(shuō)明提升來(lái)自于更智能的配置選擇,而不是暴力增加計(jì)算量。
研究還對(duì)比了目前很多模型提供的"思考模式"。這種模式通過(guò)生成更長(zhǎng)的推理過(guò)程來(lái)提高準(zhǔn)確率,但計(jì)算成本也相應(yīng)增加。動(dòng)態(tài)專(zhuān)家搜索在達(dá)到相似性能的同時(shí),計(jì)算效率明顯更高。
當(dāng)然,這種方法也有一些限制。它需要一個(gè)外部的"評(píng)委"來(lái)判斷答案質(zhì)量,這增加了系統(tǒng)的復(fù)雜性。而且評(píng)委的判斷準(zhǔn)確性會(huì)直接影響最終效果,如果評(píng)委經(jīng)常判斷錯(cuò)誤,整個(gè)系統(tǒng)的表現(xiàn)就會(huì)下降。
從更廣的視角來(lái)看,這項(xiàng)研究展示了一個(gè)重要趨勢(shì):人工智能的進(jìn)步不一定要通過(guò)簡(jiǎn)單粗暴地增加模型規(guī)模來(lái)實(shí)現(xiàn),而是可以通過(guò)更聰明地利用現(xiàn)有資源來(lái)獲得。就像一個(gè)公司不需要無(wú)限制地招聘員工,而是要學(xué)會(huì)根據(jù)不同項(xiàng)目靈活組建最合適的團(tuán)隊(duì)。
這種"架構(gòu)感知"的推理方法為未來(lái)的AI發(fā)展開(kāi)辟了新方向。隨著模型架構(gòu)變得越來(lái)越復(fù)雜和模塊化,如何在推理時(shí)動(dòng)態(tài)調(diào)整這些模塊的使用方式將成為一個(gè)重要研究方向。
說(shuō)到底,這項(xiàng)研究告訴我們,智能不僅在于擁有多少專(zhuān)業(yè)知識(shí),更在于知道在什么時(shí)候調(diào)用哪些知識(shí)。就像一個(gè)真正的專(zhuān)家不是什么都懂,而是知道什么時(shí)候需要尋求哪方面的幫助。對(duì)于人工智能來(lái)說(shuō),學(xué)會(huì)"因題制宜"地調(diào)整自己的思考方式,可能比單純?cè)黾又R(shí)儲(chǔ)備更加重要。
這種方法目前主要在研究階段,但隨著技術(shù)的成熟,我們有理由期待未來(lái)的AI助手能夠更加智能地根據(jù)我們的具體需求調(diào)整自己的工作方式,提供更精準(zhǔn)、更高效的幫助。
Q&A
Q1:動(dòng)態(tài)專(zhuān)家搜索是什么?它是如何工作的?
A:動(dòng)態(tài)專(zhuān)家搜索是一種讓AI在解題時(shí)能夠靈活調(diào)整參與工作的專(zhuān)家數(shù)量的方法。它會(huì)同時(shí)嘗試多種不同的專(zhuān)家配置來(lái)解決同一個(gè)問(wèn)題,然后通過(guò)評(píng)委評(píng)判選出最好的方案,并在后續(xù)步驟中繼續(xù)使用相同的專(zhuān)家配置,確保解題思路的連貫性。
Q2:這種方法比傳統(tǒng)方法好在哪里?會(huì)增加計(jì)算成本嗎?
A:動(dòng)態(tài)專(zhuān)家搜索在幾乎所有測(cè)試中都比傳統(tǒng)方法表現(xiàn)更好,比如在MATH500數(shù)據(jù)集上準(zhǔn)確率從92.4%提升到93.2%,在AIME數(shù)學(xué)競(jìng)賽題目上從83.3%提升到86.7%。關(guān)鍵是它并沒(méi)有增加計(jì)算成本,平均使用的專(zhuān)家數(shù)量甚至比默認(rèn)配置更少。
Q3:這項(xiàng)技術(shù)什么時(shí)候能應(yīng)用到實(shí)際的AI產(chǎn)品中?
A:目前這項(xiàng)技術(shù)還主要在研究階段,需要外部評(píng)委來(lái)判斷答案質(zhì)量,這增加了系統(tǒng)復(fù)雜性。但隨著技術(shù)成熟,未來(lái)的AI助手有望根據(jù)具體需求動(dòng)態(tài)調(diào)整工作方式,提供更精準(zhǔn)高效的幫助。研究團(tuán)隊(duì)已在多個(gè)AI模型上驗(yàn)證了效果。
全部評(píng)論 (0)