國(guó)內(nèi)首個(gè)!文心X1 Turbo獲信通院“4+級(jí)”最高評(píng)級(jí)

      發(fā)布日期:2025-05-21 09:46:05

      5月20日,百度AI Day活動(dòng)在北京舉辦,百度集團(tuán)副總裁吳甜、中國(guó)信息通信研究院人工智能研究所平臺(tái)與工程化部主任曹峰及文心一言用戶代表陳君航現(xiàn)場(chǎng)分享了文心大模型最新技術(shù)、全球大模型發(fā)展及大模型能力測(cè)評(píng)、文心一言使用體驗(yàn)等。活動(dòng)現(xiàn)場(chǎng),中國(guó)信通院發(fā)布大模型推理能力評(píng)估結(jié)果。結(jié)果顯示,百度文心X1 Turbo24項(xiàng)能力評(píng)估中,16項(xiàng)達(dá)5分、7項(xiàng)達(dá)4分、1項(xiàng)達(dá)3分,綜合評(píng)級(jí)獲當(dāng)前最高級(jí)“4+級(jí),成為國(guó)內(nèi)首款通過該測(cè)評(píng)的大模型。文心X1 Turbo邏輯推理、代碼推理、推理效果優(yōu)化等技術(shù)能力及工具支持度、安全可靠度等應(yīng)用能力均獲得滿分。


      文心大模型新版本技術(shù)詳解

      活動(dòng)現(xiàn)場(chǎng),吳甜對(duì)文心大模型最新版本的技術(shù)創(chuàng)新進(jìn)行了系統(tǒng)性的講解。她介紹,文心大模型4.5是多模態(tài)基礎(chǔ)大模型,文心4.5 Turbo源自文心4.5,效果更好、成本更低;基于文心4.5 Turbo,文心X1升級(jí)到X1 Turbo,性能提升的同時(shí),具備更先進(jìn)的思維鏈,問答、創(chuàng)作、邏輯推理、工具調(diào)用和多模態(tài)能力進(jìn)一步增強(qiáng)。


      百度集團(tuán)副總裁吳甜


      文心4.54.5 Turbo實(shí)現(xiàn)了文本、圖像和視頻的混合訓(xùn)練。針對(duì)不同模態(tài)數(shù)據(jù)在結(jié)構(gòu)、規(guī)模、知識(shí)密度上的差異,通過多模態(tài)異構(gòu)專家建模、自適應(yīng)分辨率視覺編碼、時(shí)空重排列的三維旋轉(zhuǎn)位置編碼、自適應(yīng)模態(tài)感知損失計(jì)算等技術(shù),大幅提升跨模態(tài)學(xué)習(xí)效率和多模態(tài)融合效果,學(xué)習(xí)效率提高近2倍,多模態(tài)理解效果提升超過30%


      后訓(xùn)練方面,百度研制了自反饋增強(qiáng)的技術(shù)框架,基于大模型自身的生成和評(píng)估反饋能力,實(shí)現(xiàn)了訓(xùn)練-生成-反饋-增強(qiáng)的模型迭代閉環(huán),讓大模型擁有了自我迭代的“最強(qiáng)大腦”,不僅解決了大模型對(duì)齊過程中,數(shù)據(jù)生產(chǎn)難度大、成本高、速度慢等問題,而且顯著降低了模型幻覺,模型理解和處理復(fù)雜任務(wù)的能力大幅提升。


      在訓(xùn)練階段,通過融合偏好學(xué)習(xí)的強(qiáng)化學(xué)習(xí)技術(shù),實(shí)現(xiàn)多元統(tǒng)一獎(jiǎng)勵(lì)機(jī)制,提升了對(duì)結(jié)果質(zhì)量判別的準(zhǔn)確率。通過離線偏好學(xué)習(xí)和在線強(qiáng)化學(xué)習(xí)統(tǒng)一優(yōu)化,進(jìn)一步提升了數(shù)據(jù)利用效率和訓(xùn)練穩(wěn)定性,并增強(qiáng)了模型對(duì)高質(zhì)量結(jié)果的感知。此外,通過偏好信號(hào)與獎(jiǎng)勵(lì)信號(hào)的融合運(yùn)用,模型的理解、生成、邏輯和記憶等能力全面提升。


      深度思考方面,突破了僅基于思維鏈優(yōu)化的范式,在思考路徑中結(jié)合工具調(diào)用,構(gòu)建了融合思考和行動(dòng)的復(fù)合思維鏈,模型解決問題能力得到顯著提升,模型輸出結(jié)果思路清晰、邏輯嚴(yán)密,表達(dá)自然。同時(shí),結(jié)合多元統(tǒng)一的獎(jiǎng)勵(lì)機(jī)制,實(shí)現(xiàn)了思考和行動(dòng)鏈的端到端優(yōu)化,大幅提升了跨領(lǐng)域的問題解決能力。


      數(shù)據(jù)方面,打造了數(shù)據(jù)挖掘與合成 - 數(shù)據(jù)分析與評(píng)估 - 模型能力反饋的數(shù)據(jù)建設(shè)閉環(huán),為模型訓(xùn)練源源不斷地生產(chǎn)知識(shí)密度高、類型多樣、領(lǐng)域覆蓋廣的大規(guī)模數(shù)據(jù)。同時(shí),數(shù)據(jù)建設(shè)流程具備良好的可擴(kuò)展性,能夠輕松遷移到全新的數(shù)據(jù)類型,實(shí)現(xiàn)快速、高效的數(shù)據(jù)生產(chǎn)。


      此外,吳甜也指出,大模型的能力進(jìn)一步拓展、效率進(jìn)一步提升之后,可以探索更前瞻、更有想象力的創(chuàng)新應(yīng)用。


      以數(shù)字人為例,超擬真數(shù)字人需要具備出色的表現(xiàn)力、吸引人的內(nèi)容、數(shù)字人與場(chǎng)景、物品的互動(dòng)等,需要綜合運(yùn)用多模態(tài)AI技術(shù)。百度研制了劇本驅(qū)動(dòng)多模協(xié)同的超擬真數(shù)字人技術(shù),實(shí)現(xiàn)了語(yǔ)言、聲音、形象的協(xié)調(diào)一致。目前這套技術(shù)已經(jīng)支持超過10萬數(shù)字人主播,直播轉(zhuǎn)化率達(dá)31%,降低80%直播開播成本。在代碼場(chǎng)景上,基于文心大模型的語(yǔ)言和代碼能力,百度研制了代碼智能體和智能代碼助手——文心快碼。百度每天新增的代碼中,文心快碼生成的代碼占比已超過40%。截至目前,文心快碼向全社會(huì)開放,累計(jì)服務(wù)760萬開發(fā)者。


      文心大模型的能力拓展和效率提升,得益于飛槳文心的聯(lián)合優(yōu)化,包括框架模型的聯(lián)合優(yōu)化,也包括框架算力的聯(lián)合優(yōu)化。通過訓(xùn)練和推理的技術(shù)創(chuàng)新,文心4.5 Turbo訓(xùn)練吞吐達(dá)到文心4.55.4倍,推理吞吐達(dá)到8倍。公開數(shù)據(jù)顯示,飛槳文心開發(fā)者數(shù)量已超過2185萬,服務(wù)超過67萬家企業(yè),創(chuàng)建的模型達(dá)到110萬。基于飛槳深度學(xué)習(xí)平臺(tái)和文心大模型,百度在上海、廣州、南京、武漢、廈門、寧波、南昌、無錫等多地落地產(chǎn)業(yè)賦能中心、數(shù)據(jù)生態(tài)中心和教育創(chuàng)新中心,以科技+人才+創(chuàng)新的模式打造區(qū)域人工智能公共技術(shù)服務(wù)平臺(tái),匯聚行業(yè)高價(jià)值數(shù)據(jù)集、培養(yǎng)新型復(fù)合型人才、賦能本地AI產(chǎn)品研發(fā),構(gòu)建圍繞人工智能核心能力的政產(chǎn)學(xué)研用協(xié)同發(fā)展機(jī)制,加快區(qū)域產(chǎn)業(yè)智能化升級(jí)。


      國(guó)內(nèi)首個(gè)!文心X1 Turbo獲信通院“4+級(jí)最高評(píng)級(jí)

      中國(guó)信息通信研究院人工智能研究所平臺(tái)與工程化部主任曹峰從全球大模型發(fā)展、從測(cè)評(píng)看大模型能力演進(jìn)以及文心大模型推理能力評(píng)測(cè)解讀等行業(yè)視角在現(xiàn)場(chǎng)進(jìn)行了趨勢(shì)解讀。他指出,2024年人工智能能力持續(xù)進(jìn)化,在多任務(wù)語(yǔ)言理解、競(jìng)賽級(jí)數(shù)學(xué)、博士級(jí)科學(xué)問題等之前具有挑戰(zhàn)性的基準(zhǔn)測(cè)試中超越了人類的表現(xiàn)。


      中國(guó)信息通信研究院人工智能研究所平臺(tái)與工程化部主任曹峰現(xiàn)場(chǎng)分享


      現(xiàn)場(chǎng),曹峰公布了信通院大模型推理能力評(píng)估結(jié)果。百度文心X1 Turbo24項(xiàng)能力評(píng)估中,16項(xiàng)達(dá)5分、7項(xiàng)達(dá)4分、1項(xiàng)達(dá)3分,綜合評(píng)級(jí)獲當(dāng)前最高級(jí)“4+級(jí),成為國(guó)內(nèi)首款通過該測(cè)評(píng)的大模型。


      他進(jìn)一步表示,評(píng)估結(jié)果表明,文心X1 Turbo擅長(zhǎng)結(jié)構(gòu)化的邏輯思考,并具備平衡模型能力與效率的優(yōu)化技術(shù),其有效的數(shù)據(jù)機(jī)制保障了模型的可信及可用程度,其推理服務(wù)能廣泛支持各類應(yīng)用。文心X1 Turbo強(qiáng)化推理泛化能力,拓寬工具鏈應(yīng)用生態(tài),加強(qiáng)安全機(jī)制建設(shè),構(gòu)筑可信應(yīng)用保障壁壘。


      16歲高中生:打開文心一言,就像打開新華字典一樣

      活動(dòng)現(xiàn)場(chǎng),一位16歲高中學(xué)生陳君航分享了他使用文心一言的經(jīng)歷。他從2023年開始接觸文心一言,自那以后,文心一言幾乎陪伴了他整個(gè)中考備考過程。


      君航回憶,初次接觸文心一言時(shí),他正為語(yǔ)文作文的修改發(fā)愁,于是就把作文和老師點(diǎn)評(píng)發(fā)給文心一言,讓它逐句分析給出修改建議。他坦言,我打開文心一言,就像打開新華字典一樣頻繁。在它的陪伴下,我的寫作能力得到很大提升。


      君航表示,文心一言不僅幫他量身定制過階段性的學(xué)習(xí)規(guī)劃,還能解析搜題軟件無法解析的原創(chuàng)題目。在學(xué)習(xí)方面,文心一言就像我 24 小時(shí)在線的全能老師。


      陳君航現(xiàn)場(chǎng)分享與文心一言的故事


      這位高一學(xué)生不僅自己愛用文心一言,還把他帶給了母親、同學(xué)、老師們。也讓大家對(duì)AI有了新的認(rèn)知。


      “我從小學(xué)時(shí)就開始對(duì)編程產(chǎn)生興趣,但家人一直認(rèn)為學(xué)編程只夠作為一項(xiàng)興趣愛好,反對(duì)我投入過多的時(shí)間在編程研究上。因此,到了晚上規(guī)定的時(shí)間,爸媽都會(huì)準(zhǔn)時(shí)關(guān)閉電腦,要求我去學(xué)習(xí)或者休息。


      但后來發(fā)生的事,讓君航媽媽對(duì)他在編程上花時(shí)間的態(tài)度發(fā)生了轉(zhuǎn)變。君航的媽媽是一位小學(xué)老師,平時(shí)在繁重的教學(xué)任務(wù)中,還要抽時(shí)間做很多案頭工作。我經(jīng)常看到她一邊批卷子一邊熬夜寫點(diǎn)評(píng),五十幾份,一句句手打。所以君航想:我能不能做點(diǎn)什么?于是他開始嘗試用文心一言,為媽媽設(shè)計(jì)了一個(gè)智能文案生成器,原本三天的工作僅需幾小時(shí)就可以完成。這讓君航的媽媽對(duì)編程有了新的認(rèn)知,也激發(fā)了她自己對(duì)大模型的使用興趣。


      當(dāng)大模型學(xué)會(huì)像人類一樣感知世界,像人類一樣思考和行動(dòng)并自我進(jìn)化,技術(shù)進(jìn)步便真正轉(zhuǎn)化為普惠的社會(huì)紅利。正如陳君航同學(xué)所說:“技術(shù)真正的魅力不是驚艷誰(shuí),而是真正解決一個(gè)又一個(gè)真實(shí)的問題”。

      久久国产欧美日韩精品_日日碰夜夜爽亚洲欧美_欧美自慰精品一区二区_久久SE精品一区二区三区
        
        

          五月天久久久噜噜噜久久 | 亚洲一区精品在线影视 | 亚洲熟女少妇精品 | 午夜视频网址在线 | 亚洲精品国产精品乱码不卡√ | 亚洲中文字幕五码专区 |