每日經濟新聞 2023-10-27 14:43:49
◎騰訊機器學習平臺算法負責人康戰(zhàn)輝表示,目前騰訊研發(fā)大模型有兩個方向:在通用大模型上,相比于成本投入而言,騰訊更重視效果,強調長期投入;在小型模型上,希望能更加精細化,將不同的模型應用到不同場景,同時更加考慮投入和產出的性價比和效益。
◎在能力提升方面,混元大模型一大亮點是開放“文生圖”功能?!拔纳鷪D”能夠實現(xiàn)輸入對圖片的描述文字后,AI(人工智能)平臺根據(jù)文字描述生成對應的圖片,是AIGC(生成式人工智能)具有廣泛應用前景的場景之一,也是全球大模型競速下的“主戰(zhàn)場”之一。
每經記者|王帆 每經編輯|魏官紅
10月26日,《每日經濟新聞》記者從騰訊方面獲悉,騰訊混元大模型迎來全新升級,升級后的騰訊混元中文能力整體超過GPT3.5,代碼能力大幅提升20%。此外,騰訊宣布正式對外開放混元大模型“文生圖”功能。
本次升級距離騰訊正式發(fā)布混元大模型不到兩個月。據(jù)騰訊透露,目前超過180個騰訊內部業(yè)務已接入騰訊混元,已有來自零售、教育、金融、醫(yī)療、傳媒、交通、政務等多個行業(yè)的客戶通過騰訊云調用騰訊混元大模型API。
對于混元大模型前期訓練成本投入的問題,騰訊機器學習平臺算法負責人康戰(zhàn)輝在接受采訪時表示,混元作為千億級參數(shù)規(guī)模的大模型,目前訓練成本較高。對于適用于復雜場景的通用大模型,相比于成本投入而言,騰訊更重視效果;而一些細化場景可以使用小模型,更強調成本投入的高性價比。
9月7日,在2023騰訊全球數(shù)字生態(tài)大會上,騰訊混元大模型正式亮相,并宣布通過騰訊云對外開放。如今,騰訊公布了最新進展。
在內部應用上,超過180個騰訊內部業(yè)務已接入騰訊混元,包括騰訊會議、騰訊文檔、企業(yè)微信、騰訊廣告和微信搜一搜等。最近,QQ瀏覽器還基于騰訊混元推出了“PDF閱讀助手”,具備智能摘要、智能問答和多輪提問等功能。記者注意到,實際上,騰訊混元通過自家應用,也間接面向外部C端用戶。
外部用戶方面,已有來自零售、教育、金融、醫(yī)療、傳媒、交通、政務等多個行業(yè)的客戶,通過騰訊云調用騰訊混元大模型API,應用領域涉及智能問答、內容創(chuàng)作、數(shù)據(jù)分析、代碼助手等多個場景。今年9月首批通過備案后,騰訊混元大模型也已經面向C端用戶陸續(xù)開放體驗,用戶通過小程序或網頁端,就能與騰訊混元對話。
在能力提升方面,一大亮點是開放混元大模型“文生圖”功能。“文生圖”能夠實現(xiàn)輸入對圖片的描述文字后,AI(人工智能)平臺根據(jù)文字描述生成對應的圖片,是AIGC(生成式人工智能)具有廣泛應用前景的場景之一,也是全球大模型競速下的“主戰(zhàn)場”之一。
10月26日,騰訊混元大模型“文生圖”技術負責人蘆清林在接受包括每日經濟新聞在內的媒體采訪時表示,大模型“文生圖”的難點體現(xiàn)在對提示詞的語義理解、生成內容的合理性以及生成圖片的效果。針對這三個技術難點,騰訊進行了專項的技術研究,提出了一系列原創(chuàng)算法來保證生成圖片的可用性和畫質。目前騰訊混元“文生圖”能力,已經被用于素材創(chuàng)作、商品合成、游戲出圖等多項業(yè)務中。
此外,騰訊也升級了混元的代碼、數(shù)學能力。記者了解到,混元大模型經過對32種主流語言代碼文件、各類計算機書籍和博客的學習增訓,代碼處理水平提升超過20%,騰訊內部目前已經有多個開發(fā)平臺接入了騰訊混元大模型,工程師們可以使用騰訊混元來進行代碼生成、代碼補全、代碼漏洞檢測和修復、表格數(shù)據(jù)處理、數(shù)據(jù)庫查詢等工作。
混元大模型擁有超千億參數(shù)規(guī)模,預訓練語料超2萬億tokens,相比于同行十億、百億級別的參數(shù)規(guī)模,研發(fā)與訓練成本較高。
談到大模型的研發(fā)成本,騰訊機器學習平臺算法負責人康戰(zhàn)輝在接受媒體群訪時表示,目前騰訊研發(fā)大模型有兩個方向:在通用大模型上,相比于成本投入而言,騰訊更重視效果,強調長期投入;在小型模型上,希望能更加精細化,將不同的模型應用到不同場景,同時更加考慮投入和產出的性價比和效益。通俗來說,就是“大模大做,小模小做”。
出于上述邏輯,騰訊超180個內部業(yè)務接入混元大模型的參數(shù)量規(guī)模也有所差別。“模型的選擇關鍵還要看場景,要結合業(yè)務場景給出靈活的方案,例如現(xiàn)在騰訊的業(yè)務部門有的用千億模型,有的用中小模型,有的用混合模型,我們不斷根據(jù)業(yè)務流量和商業(yè)模式去調整出我們自己的技術底座。”康戰(zhàn)輝說道。
《每日經濟新聞》記者注意到,就在本月,多個廠商陸續(xù)發(fā)布大模型商業(yè)應用:百度發(fā)布文心一言大模型4.0版本,并推出十余款AI原生應用全面賦能業(yè)務生態(tài)。在垂直領域,美圖發(fā)布了自研AI視覺大模型MiracleVision(奇想智能)3.0版本,通過“提示詞智能聯(lián)想”“提示詞精準控制”等功能,可以讓用戶的各種奇思妙想實現(xiàn)所想即所得;宇信科技推出了首批金融行業(yè)大模型應用產品和解決方案,包括4個應用級產品和1個開發(fā)平臺。
大模型商業(yè)化進程正持續(xù)推進,騰訊對此也有一些思考。蘆清林以“文生圖”為例,闡述對未來應用路徑的展望。“‘文生圖’的應用價值在廣告場景是非常明確的,第一是能夠幫助廣告主更快地提升投放廣告的效率,第二是騰訊擁有豐富的廣告經驗和知識,知道如何針對廣告主投放廣告的人群,生成更符合人群特點的廣告,因此廣告主愿意在這個產品上投入。”他說道。
據(jù)騰訊透露,目前在廣告業(yè)務下的多輪測評中,騰訊混元“文生圖”的案例優(yōu)秀率和廣告主采納率分別達到86%和26%。
封面圖片來源:每經記者 張涵 攝
如需轉載請與《每日經濟新聞》報社聯(lián)系。
未經《每日經濟新聞》報社授權,嚴禁轉載或鏡像,違者必究。
讀者熱線:4008890008
特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。
歡迎關注每日經濟新聞APP