国产在线高清无码|欧美日韩国sss|久久51.com|超碰在线公开97|曰夲AV一区二区|成人免费AV网站|成人97在线观看

每日經(jīng)濟新聞
要聞

每經(jīng)網(wǎng)首頁 > 要聞 > 正文

直擊WAIC 2025丨對話安永陳劍光:衡量AI Agent “好用”的關鍵指標需兼顧技術效能與業(yè)務價值

2025-07-28 20:39:15

每經(jīng)記者|張梓桐    每經(jīng)編輯|裴健如    

OpenAI發(fā)布具備自主思考能力的ChatGPT智能體;零一萬物發(fā)布企業(yè)級Agent智能體“萬仔”??一時之間,AI Agent(智能體)正從概念加速落地,國內(nèi)外科技巨頭紛紛布局。

7月28日,在2025世界人工智能大會暨人工智能全球治理高級別會議(WAIC 2025)上,安永大中華區(qū)發(fā)布AI Agent產(chǎn)品——安永智能問答3.0。安永大中華區(qū)人工智能與數(shù)據(jù)咨詢服務聯(lián)席主管合伙人陳劍光在接受《每日經(jīng)濟新聞》(以下簡稱NBD)記者采訪時表示,衡量AI Agent“好用”的關鍵指標需兼顧技術效能與業(yè)務價值。

圖片來源:企業(yè)供圖

陳劍光強調(diào),AI Agent是否“好用”,技術上需關注準確性、響應速度等指標,業(yè)務上則需關注效率提升、成本優(yōu)化、風控增強等實際價值,需體現(xiàn)對業(yè)務目標的支撐度。

除此之外,不同行業(yè)的Agent需求差異顯著。

金融業(yè)聚焦風控合規(guī),如投資組合合規(guī)助手、實時交易監(jiān)控;零售業(yè)側(cè)重供應鏈優(yōu)化與精準營銷,如消費者行為分析推薦Agent;制造業(yè)則深耕設備維護與生產(chǎn)優(yōu)化,典型如預測性維護Agent、質(zhì)量檢測Agent。不過,各行業(yè)在人事、行政等職能部門存在共性需求,核心是提升運營效率。

以下為對話實錄:

Agent應用兩大核心痛點:系統(tǒng)集成障礙與垂直領域適配度不足

NBD:目前企業(yè)在落地Agent應用時,最常遇到的痛點是什么?從您的實踐經(jīng)驗來看,這些痛點背后的核心原因是什么?

陳劍光:目前,企業(yè)在部署Agent應用時,普遍面臨的兩大核心痛點是系統(tǒng)集成障礙與垂直領域適配度不足。

Agent與企業(yè)現(xiàn)有的核心業(yè)務系統(tǒng)(如ERP、CRM、財務系統(tǒng)等)的協(xié)同困難是一個高頻挑戰(zhàn)。實踐中經(jīng)??吹剑捎诮涌趨f(xié)議不一致、數(shù)據(jù)格式不兼容等問題,Agent難以順暢地與這些系統(tǒng)進行數(shù)據(jù)交換和指令執(zhí)行,從而造成任務中斷、效率低下。比如,一個負責費用報銷的財務Agent,可能因無法正確解析不同格式的票據(jù)信息而導致流程停滯。

在面對特定行業(yè)的專業(yè)場景時,通用Agent模型常常顯得“力不從心”,關鍵在于缺乏深度融入行業(yè)的知識庫和數(shù)據(jù)來做支撐。例如,在金融風控領域,模型需要整合瞬息萬變的監(jiān)管規(guī)則和市場數(shù)據(jù);在醫(yī)療診斷領域,則需要模型具備理解并融合影像和文本病歷的能力。通用模型在這些高度專業(yè)化的環(huán)境中,精度往往難以達到業(yè)務要求。

這些痛點的背后,核心原因在于雙重壁壘。一是技術整合壁壘。打通異構(gòu)系統(tǒng)的“最后一公里”,需要解決復雜的技術接口、數(shù)據(jù)映射和流程銜接問題,工程實施復雜度高。二是領域知識與數(shù)據(jù)治理壁壘。構(gòu)建真正有效的垂直領域Agent,不僅需要引入深厚的行業(yè)專業(yè)知識,還需要高質(zhì)量、結(jié)構(gòu)化的領域數(shù)據(jù)進行持續(xù)訓練與調(diào)優(yōu)。然而,高質(zhì)量數(shù)據(jù)的獲取、清洗、標注及其所涉及的治理成本,構(gòu)成了顯著的障礙。這不僅是技術門檻,更是知識工程和數(shù)據(jù)資產(chǎn)管理的系統(tǒng)性挑戰(zhàn)。

NBD:不同行業(yè)(比如金融、零售、制造業(yè))的企業(yè)在使用Agent時,需求和應用場景會有明顯差異嗎?能否舉例說說典型行業(yè)的特色應用?

陳劍光:行業(yè)間的差異化需求非常顯著,主要體現(xiàn)在核心業(yè)務流程的差異和數(shù)據(jù)屬性的專業(yè)性要求上。

例如,金融業(yè)高度關注風險控制和合規(guī)管理,典型Agent的應用場景如面向客戶經(jīng)理的投資組合分析助手,提供合規(guī)建議,或者類似于提供自動化的實時交易監(jiān)控Agent,用于識別交易異常模式。

零售業(yè)的核心痛點圍繞供應鏈優(yōu)化、庫存管理、精準營銷與客戶體驗提升。典型場景如分析消費者行為數(shù)據(jù)的個性化推薦Agent;優(yōu)化物流路線的動態(tài)規(guī)劃Agent等。

制造業(yè)的應用場景可能更關于設備維護管理、生產(chǎn)流程優(yōu)化與質(zhì)量控制等。典型應用包括預測性維護Agent,通過分析設備傳感器數(shù)據(jù)提前預警故障;生產(chǎn)排程優(yōu)化Agent,實時調(diào)整產(chǎn)線資源分配;整合視覺識別技術的質(zhì)量檢測Agent,自動化識別產(chǎn)品缺陷等。

行業(yè)差異決定了Agent的核心使命:解決各自領域最關鍵的效率瓶頸或風險點。另外,各個企業(yè)也都存在一些共性場景,例如對于人事、行政、法務、通用IT支持等職能部門,需求通常集中于提升內(nèi)部運營效率,如自動化查詢政策信息、標準化審批流程、提供IT支持等。這類Agent應用追求的核心價值是流程自動化與執(zhí)行效率提升。

業(yè)務價值指標是證明Agent投入產(chǎn)出比的核心

NBD:企業(yè)Agent的“智能化”程度往往是關注焦點,您認為衡量一個企業(yè)Agent“好用”的關鍵指標有哪些?

陳劍光:衡量企業(yè)Agent是否真正好用,需要從技術效能與業(yè)務價值雙維度綜合評估,考量其對業(yè)務目標的支撐度。

技術效能指標是Agent基礎能力的量化體現(xiàn),依據(jù)其具體目標設定,包括準確性、魯棒性、響應速度、吞吐量等。以一個面向內(nèi)部的客戶服務查詢Agent為例,技術指標包括用戶咨詢的意圖識別準確度、后臺信息查詢的響應時間、調(diào)用客服系統(tǒng)接口的成功率等。

業(yè)務價值指標則是證明Agent投入產(chǎn)出比的核心,體現(xiàn)實際落地效果,包括效率提升(是否縮短業(yè)務流程時長、節(jié)省人力操作時長)、成本優(yōu)化(優(yōu)化運營成本、識別潛在客戶)、風控提升(降低合規(guī)風險/操作風險)、質(zhì)量提升(提升產(chǎn)品/服務質(zhì)量)等。

在技術指標滿足的基礎上,能清晰量化其對實際業(yè)務的影響,是Agent價值的體現(xiàn)。

NBD:隨著大模型技術的發(fā)展,企業(yè)Agent在功能迭代上有哪些新趨勢?比如,是否會更注重多模態(tài)交互或自主決策能力?

陳劍光:確實,企業(yè)Agent的能力邊界正在被大模型技術不斷拓寬。Agent正從單一的文本交互,向融合視覺、聽覺等多模態(tài)信號的方向發(fā)展,這使得Agent能處理和應對更復雜的企業(yè)場景。例如,通過圖像識別解析掃描文檔、表單、儀表盤截圖等非結(jié)構(gòu)化信息;結(jié)合語音識別與合成技術,構(gòu)建更自然、可提供多感官交互體驗的數(shù)字人(虛擬客服、培訓助手);在工業(yè)質(zhì)檢中,整合視覺識別實現(xiàn)對產(chǎn)品缺陷或生產(chǎn)線異常的自動化檢測等。

隨著大模型理解、推理和規(guī)劃能力的提升,Agent在預設規(guī)則和安全邊界內(nèi)的自主決策能力正在增強,能處理更復雜的規(guī)則組合,逐步從純“執(zhí)行者”向具有一定分析能力的“輔助決策者”角色演進。通過學習和掌握更廣泛、更復雜的工具調(diào)用能力,將更深度地嵌入現(xiàn)有業(yè)務流程,自動觸發(fā)并協(xié)調(diào)后端系統(tǒng)的多項操作,形成更強的端到端自動化鏈條。

除了“多模態(tài)”“多功能”“多協(xié)作”,即由多個具備不同技能的Agent組成“團隊”,通過明確的任務分配和協(xié)作機制,共同完成更復雜的、需要多步推理或跨系統(tǒng)協(xié)作的任務鏈,提升整體解決問題的能力上限。

NBD:對于還未嘗試Agent應用的中小企業(yè),您認為它們可以從哪些低成本、易落地的場景入手,逐步感受其價值?

陳劍光:對于初次嘗試的企業(yè),我們建議采取“小步快跑”策略,可以先從輕量場景切入,即需求明確、技術輕量、能快速體現(xiàn)價值的“試點場景”。例如,文檔摘要與信息檢索,可以通過智能信息助手,針對企業(yè)內(nèi)部政策/知識庫問答,包括HR福利查詢、IT常見問題解答;輕度的業(yè)務流程自動化,包括簡單表單數(shù)據(jù)的自動化審核(如檢查必填項、格式合規(guī))、標準化通知的定時發(fā)送等;以及協(xié)同增強工具,包括編程助手提升、智能文檔翻譯等。

對中小企業(yè)而言,初期應當利用成熟的外部服務API(應用程序編程接口)來快速擴展Agent的功能,或選擇提供Agent能力的SaaS(軟件運營服務)產(chǎn)品或按需付費的模型服務(如大模型服務商的Agent平臺),也可基于低代碼/零代碼平臺構(gòu)建屬于自己的Agent應用,以降低硬件投入和初始維護成本。

通過這些試點,企業(yè)能低成本驗證技術價值,積累運營經(jīng)驗,培養(yǎng)團隊信心,為后續(xù)更復雜、深度的應用打下基礎。

最重要的是深刻理解——Agent的核心價值,絕非簡單地“替代人力”,而是通過承擔規(guī)則性、重復性的流程執(zhí)行任務,釋放員工的時間和精力,使其能夠投入到更富創(chuàng)造力的工作、更復雜的判斷決策和更高價值的創(chuàng)新活動中。其終極目標是實現(xiàn)“人機協(xié)同、人智增強”,推動組織效能升級。

封面圖片來源:每日經(jīng)濟新聞 資料圖

如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán),嚴禁轉(zhuǎn)載或鏡像,違者必究。

讀者熱線:4008890008

特別提醒:如果我們使用了您的圖片,請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站,可聯(lián)系我們要求撤下您的作品。

歡迎關注每日經(jīng)濟新聞APP

每經(jīng)經(jīng)濟新聞官方APP

0

0