要聞

騰訊混元大模型公布新進展：已接入180個內部業(yè)務，開放“文生圖”功能

每日經濟新聞 2023-10-27 14:43:49

◎騰訊機器學習平臺算法負責人康戰(zhàn)輝表示，目前騰訊研發(fā)大模型有兩個方向：在通用大模型上，相比于成本投入而言，騰訊更重視效果，強調長期投入；在小型模型上，希望能更加精細化，將不同的模型應用到不同場景，同時更加考慮投入和產出的性價比和效益。

◎在能力提升方面，混元大模型一大亮點是開放“文生圖”功能?！拔纳鷪D”能夠實現(xiàn)輸入對圖片的描述文字后，AI（人工智能）平臺根據(jù)文字描述生成對應的圖片，是AIGC（生成式人工智能）具有廣泛應用前景的場景之一，也是全球大模型競速下的“主戰(zhàn)場”之一。

每經記者｜王帆每經編輯｜魏官紅

10月26日，《每日經濟新聞》記者從騰訊方面獲悉，騰訊混元大模型迎來全新升級，升級后的騰訊混元中文能力整體超過GPT3.5，代碼能力大幅提升20%。此外，騰訊宣布正式對外開放混元大模型“文生圖”功能。

本次升級距離騰訊正式發(fā)布混元大模型不到兩個月。據(jù)騰訊透露，目前超過180個騰訊內部業(yè)務已接入騰訊混元，已有來自零售、教育、金融、醫(yī)療、傳媒、交通、政務等多個行業(yè)的客戶通過騰訊云調用騰訊混元大模型API。

對于混元大模型前期訓練成本投入的問題，騰訊機器學習平臺算法負責人康戰(zhàn)輝在接受采訪時表示，混元作為千億級參數(shù)規(guī)模的大模型，目前訓練成本較高。對于適用于復雜場景的通用大模型，相比于成本投入而言，騰訊更重視效果；而一些細化場景可以使用小模型，更強調成本投入的高性價比。

已接入超180個內部業(yè)務

9月7日，在2023騰訊全球數(shù)字生態(tài)大會上，騰訊混元大模型正式亮相，并宣布通過騰訊云對外開放。如今，騰訊公布了最新進展。

在內部應用上，超過180個騰訊內部業(yè)務已接入騰訊混元，包括騰訊會議、騰訊文檔、企業(yè)微信、騰訊廣告和微信搜一搜等。最近，QQ瀏覽器還基于騰訊混元推出了“PDF閱讀助手”，具備智能摘要、智能問答和多輪提問等功能。記者注意到，實際上，騰訊混元通過自家應用，也間接面向外部C端用戶。

外部用戶方面，已有來自零售、教育、金融、醫(yī)療、傳媒、交通、政務等多個行業(yè)的客戶，通過騰訊云調用騰訊混元大模型API，應用領域涉及智能問答、內容創(chuàng)作、數(shù)據(jù)分析、代碼助手等多個場景。今年9月首批通過備案后，騰訊混元大模型也已經面向C端用戶陸續(xù)開放體驗，用戶通過小程序或網頁端，就能與騰訊混元對話。

在能力提升方面，一大亮點是開放混元大模型“文生圖”功能。“文生圖”能夠實現(xiàn)輸入對圖片的描述文字后，AI（人工智能）平臺根據(jù)文字描述生成對應的圖片，是AIGC（生成式人工智能）具有廣泛應用前景的場景之一，也是全球大模型競速下的“主戰(zhàn)場”之一。

10月26日，騰訊混元大模型“文生圖”技術負責人蘆清林在接受包括每日經濟新聞在內的媒體采訪時表示，大模型“文生圖”的難點體現(xiàn)在對提示詞的語義理解、生成內容的合理性以及生成圖片的效果。針對這三個技術難點，騰訊進行了專項的技術研究，提出了一系列原創(chuàng)算法來保證生成圖片的可用性和畫質。目前騰訊混元“文生圖”能力，已經被用于素材創(chuàng)作、商品合成、游戲出圖等多項業(yè)務中。

此外，騰訊也升級了混元的代碼、數(shù)學能力。記者了解到，混元大模型經過對32種主流語言代碼文件、各類計算機書籍和博客的學習增訓，代碼處理水平提升超過20%，騰訊內部目前已經有多個開發(fā)平臺接入了騰訊混元大模型，工程師們可以使用騰訊混元來進行代碼生成、代碼補全、代碼漏洞檢測和修復、表格數(shù)據(jù)處理、數(shù)據(jù)庫查詢等工作。

大模型看效果，小模型看效益

混元大模型擁有超千億參數(shù)規(guī)模，預訓練語料超2萬億tokens，相比于同行十億、百億級別的參數(shù)規(guī)模，研發(fā)與訓練成本較高。

談到大模型的研發(fā)成本，騰訊機器學習平臺算法負責人康戰(zhàn)輝在接受媒體群訪時表示，目前騰訊研發(fā)大模型有兩個方向：在通用大模型上，相比于成本投入而言，騰訊更重視效果，強調長期投入；在小型模型上，希望能更加精細化，將不同的模型應用到不同場景，同時更加考慮投入和產出的性價比和效益。通俗來說，就是“大模大做，小模小做”。

出于上述邏輯，騰訊超180個內部業(yè)務接入混元大模型的參數(shù)量規(guī)模也有所差別。“模型的選擇關鍵還要看場景，要結合業(yè)務場景給出靈活的方案，例如現(xiàn)在騰訊的業(yè)務部門有的用千億模型，有的用中小模型，有的用混合模型，我們不斷根據(jù)業(yè)務流量和商業(yè)模式去調整出我們自己的技術底座。”康戰(zhàn)輝說道。

《每日經濟新聞》記者注意到，就在本月，多個廠商陸續(xù)發(fā)布大模型商業(yè)應用：百度發(fā)布文心一言大模型4.0版本，并推出十余款AI原生應用全面賦能業(yè)務生態(tài)。在垂直領域，美圖發(fā)布了自研AI視覺大模型MiracleVision（奇想智能）3.0版本，通過“提示詞智能聯(lián)想”“提示詞精準控制”等功能，可以讓用戶的各種奇思妙想實現(xiàn)所想即所得；宇信科技推出了首批金融行業(yè)大模型應用產品和解決方案，包括4個應用級產品和1個開發(fā)平臺。

大模型商業(yè)化進程正持續(xù)推進，騰訊對此也有一些思考。蘆清林以“文生圖”為例，闡述對未來應用路徑的展望。“‘文生圖’的應用價值在廣告場景是非常明確的，第一是能夠幫助廣告主更快地提升投放廣告的效率，第二是騰訊擁有豐富的廣告經驗和知識，知道如何針對廣告主投放廣告的人群，生成更符合人群特點的廣告，因此廣告主愿意在這個產品上投入。”他說道。

據(jù)騰訊透露，目前在廣告業(yè)務下的多輪測評中，騰訊混元“文生圖”的案例優(yōu)秀率和廣告主采納率分別達到86%和26%。

封面圖片來源：每經記者張涵攝

如需轉載請與《每日經濟新聞》報社聯(lián)系。
未經《每日經濟新聞》報社授權，嚴禁轉載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

騰訊模型大模型

上一篇文章

10月27日韓國KOSPI指數(shù)收盤上漲0.16%

返回每經網首頁

下一篇文章

美的集團在浙江成立制冷科技公司，經營范圍含AI軟件開發(fā)