11月6日,2025世界互聯(lián)網(wǎng)大會領(lǐng)先科技獎?wù)浇視裕俣取皠”掘?qū)動多模協(xié)同的高擬真數(shù)字人技術(shù)”獲獎,這也是百度大模型繼2023年“知識增強(qiáng)大語言模型關(guān)鍵技術(shù)”和2024年“文心智能體技術(shù)”之后,連續(xù)三年獲得該獎項(xiàng),百度也成為唯一連續(xù)三年獲獎的人工智能公司。
百度首席技術(shù)官王海峰現(xiàn)場發(fā)布
世界互聯(lián)網(wǎng)大會領(lǐng)先科技獎是面向全球互聯(lián)網(wǎng)領(lǐng)域的國際性科技獎項(xiàng),旨在評選全球互聯(lián)網(wǎng)領(lǐng)域最具前瞻性的科技成果,倡導(dǎo)技術(shù)交流合作。本屆大會共收到來自34個國家和地區(qū)的424項(xiàng)科技成果申報,最終經(jīng)專家評審選出17項(xiàng)年度領(lǐng)先科技獎。
會上,百度首席技術(shù)官王海峰作為發(fā)布人出席頒獎典禮。他介紹,百度劇本驅(qū)動多模協(xié)同的高擬真數(shù)字人技術(shù),包括融合多模規(guī)劃與深度思考的劇本生成、動態(tài)決策的實(shí)時交互、文本自控的語音合成、高一致性超擬真數(shù)字人長視頻生成等技術(shù)創(chuàng)新。該技術(shù)突破了多模態(tài)實(shí)時協(xié)同、復(fù)雜動態(tài)交互等技術(shù)難題,實(shí)現(xiàn)了數(shù)字人語言、聲音和形象的協(xié)調(diào)一致,提升了數(shù)字人直播內(nèi)容的質(zhì)量和交互能力,具有“高情商、強(qiáng)互動、長續(xù)航、更專業(yè)”的特色,效果超過真人。
基于百度數(shù)字人技術(shù)已生產(chǎn)超過10萬個數(shù)字人,應(yīng)用于電商、教育、法律等各行各業(yè),幫助降低開播成本達(dá)80%,提升直播轉(zhuǎn)化率31%。在6月15日百度優(yōu)選羅永浩數(shù)字人首場直播中,運(yùn)用該技術(shù)打造的羅永浩與朱蕭木數(shù)字人,成功完成長達(dá)6小時的超擬真直播,觀播人數(shù)達(dá)1300萬,GMV 突破5500萬。
目前,該技術(shù)已在百度電商場景的明星、圖書和健康直播上落地應(yīng)用,幫助眾多商家拓寬了銷售渠道,降低直播成本,提高運(yùn)營效率。數(shù)字人可以24小時不間斷直播,增加了商品的曝光時間和銷售機(jī)會,進(jìn)一步提升了經(jīng)濟(jì)效益。
自2016年以來,百度已憑借百度大腦、小度助手(DuerOS)、Apollo、飛槳、知識增強(qiáng)大語言模型、文心智能體技術(shù)、劇本驅(qū)動多模協(xié)同的高擬真數(shù)字人技術(shù)等創(chuàng)新成果七次獲得世界互聯(lián)網(wǎng)大會領(lǐng)先科技獎。

全部評論 (0)