要聞

直擊WAIC 2025丨對話安永陳劍光：衡量AI Agent “好用”的關鍵指標需兼顧技術效能與業(yè)務價值

2025-07-28 20:39:15

每經(jīng)記者｜張梓桐每經(jīng)編輯｜裴健如

OpenAI發(fā)布具備自主思考能力的ChatGPT智能體；零一萬物發(fā)布企業(yè)級Agent智能體“萬仔”??一時之間，AI Agent（智能體）正從概念加速落地，國內(nèi)外科技巨頭紛紛布局。

7月28日，在2025世界人工智能大會暨人工智能全球治理高級別會議（WAIC 2025）上，安永大中華區(qū)發(fā)布AI Agent產(chǎn)品——安永智能問答3.0。安永大中華區(qū)人工智能與數(shù)據(jù)咨詢服務聯(lián)席主管合伙人陳劍光在接受《每日經(jīng)濟新聞》（以下簡稱NBD）記者采訪時表示，衡量AI Agent“好用”的關鍵指標需兼顧技術效能與業(yè)務價值。

圖片來源：企業(yè)供圖

陳劍光強調(diào)，AI Agent是否“好用”，技術上需關注準確性、響應速度等指標，業(yè)務上則需關注效率提升、成本優(yōu)化、風控增強等實際價值，需體現(xiàn)對業(yè)務目標的支撐度。

除此之外，不同行業(yè)的Agent需求差異顯著。

金融業(yè)聚焦風控合規(guī)，如投資組合合規(guī)助手、實時交易監(jiān)控；零售業(yè)側(cè)重供應鏈優(yōu)化與精準營銷，如消費者行為分析推薦Agent；制造業(yè)則深耕設備維護與生產(chǎn)優(yōu)化，典型如預測性維護Agent、質(zhì)量檢測Agent。不過，各行業(yè)在人事、行政等職能部門存在共性需求，核心是提升運營效率。

以下為對話實錄：

Agent應用兩大核心痛點：系統(tǒng)集成障礙與垂直領域適配度不足

NBD：目前企業(yè)在落地Agent應用時，最常遇到的痛點是什么？從您的實踐經(jīng)驗來看，這些痛點背后的核心原因是什么？

陳劍光：目前，企業(yè)在部署Agent應用時，普遍面臨的兩大核心痛點是系統(tǒng)集成障礙與垂直領域適配度不足。

Agent與企業(yè)現(xiàn)有的核心業(yè)務系統(tǒng)（如ERP、CRM、財務系統(tǒng)等）的協(xié)同困難是一個高頻挑戰(zhàn)。實踐中經(jīng)?？吹剑捎诮涌趨f(xié)議不一致、數(shù)據(jù)格式不兼容等問題，Agent難以順暢地與這些系統(tǒng)進行數(shù)據(jù)交換和指令執(zhí)行，從而造成任務中斷、效率低下。比如，一個負責費用報銷的財務Agent，可能因無法正確解析不同格式的票據(jù)信息而導致流程停滯。

在面對特定行業(yè)的專業(yè)場景時，通用Agent模型常常顯得“力不從心”，關鍵在于缺乏深度融入行業(yè)的知識庫和數(shù)據(jù)來做支撐。例如，在金融風控領域，模型需要整合瞬息萬變的監(jiān)管規(guī)則和市場數(shù)據(jù)；在醫(yī)療診斷領域，則需要模型具備理解并融合影像和文本病歷的能力。通用模型在這些高度專業(yè)化的環(huán)境中，精度往往難以達到業(yè)務要求。

這些痛點的背后，核心原因在于雙重壁壘。一是技術整合壁壘。打通異構(gòu)系統(tǒng)的“最后一公里”，需要解決復雜的技術接口、數(shù)據(jù)映射和流程銜接問題，工程實施復雜度高。二是領域知識與數(shù)據(jù)治理壁壘。構(gòu)建真正有效的垂直領域Agent，不僅需要引入深厚的行業(yè)專業(yè)知識，還需要高質(zhì)量、結(jié)構(gòu)化的領域數(shù)據(jù)進行持續(xù)訓練與調(diào)優(yōu)。然而，高質(zhì)量數(shù)據(jù)的獲取、清洗、標注及其所涉及的治理成本，構(gòu)成了顯著的障礙。這不僅是技術門檻，更是知識工程和數(shù)據(jù)資產(chǎn)管理的系統(tǒng)性挑戰(zhàn)。

NBD：不同行業(yè)（比如金融、零售、制造業(yè)）的企業(yè)在使用Agent時，需求和應用場景會有明顯差異嗎？能否舉例說說典型行業(yè)的特色應用？

陳劍光：行業(yè)間的差異化需求非常顯著，主要體現(xiàn)在核心業(yè)務流程的差異和數(shù)據(jù)屬性的專業(yè)性要求上。

例如，金融業(yè)高度關注風險控制和合規(guī)管理，典型Agent的應用場景如面向客戶經(jīng)理的投資組合分析助手，提供合規(guī)建議，或者類似于提供自動化的實時交易監(jiān)控Agent，用于識別交易異常模式。

零售業(yè)的核心痛點圍繞供應鏈優(yōu)化、庫存管理、精準營銷與客戶體驗提升。典型場景如分析消費者行為數(shù)據(jù)的個性化推薦Agent；優(yōu)化物流路線的動態(tài)規(guī)劃Agent等。

制造業(yè)的應用場景可能更關于設備維護管理、生產(chǎn)流程優(yōu)化與質(zhì)量控制等。典型應用包括預測性維護Agent，通過分析設備傳感器數(shù)據(jù)提前預警故障；生產(chǎn)排程優(yōu)化Agent，實時調(diào)整產(chǎn)線資源分配；整合視覺識別技術的質(zhì)量檢測Agent，自動化識別產(chǎn)品缺陷等。

行業(yè)差異決定了Agent的核心使命：解決各自領域最關鍵的效率瓶頸或風險點。另外，各個企業(yè)也都存在一些共性場景，例如對于人事、行政、法務、通用IT支持等職能部門，需求通常集中于提升內(nèi)部運營效率，如自動化查詢政策信息、標準化審批流程、提供IT支持等。這類Agent應用追求的核心價值是流程自動化與執(zhí)行效率提升。

業(yè)務價值指標是證明Agent投入產(chǎn)出比的核心

NBD：企業(yè)Agent的“智能化”程度往往是關注焦點，您認為衡量一個企業(yè)Agent“好用”的關鍵指標有哪些？

陳劍光：衡量企業(yè)Agent是否真正好用，需要從技術效能與業(yè)務價值雙維度綜合評估，考量其對業(yè)務目標的支撐度。

技術效能指標是Agent基礎能力的量化體現(xiàn)，依據(jù)其具體目標設定，包括準確性、魯棒性、響應速度、吞吐量等。以一個面向內(nèi)部的客戶服務查詢Agent為例，技術指標包括用戶咨詢的意圖識別準確度、后臺信息查詢的響應時間、調(diào)用客服系統(tǒng)接口的成功率等。

業(yè)務價值指標則是證明Agent投入產(chǎn)出比的核心，體現(xiàn)實際落地效果，包括效率提升（是否縮短業(yè)務流程時長、節(jié)省人力操作時長）、成本優(yōu)化（優(yōu)化運營成本、識別潛在客戶）、風控提升（降低合規(guī)風險/操作風險）、質(zhì)量提升（提升產(chǎn)品/服務質(zhì)量）等。

在技術指標滿足的基礎上，能清晰量化其對實際業(yè)務的影響，是Agent價值的體現(xiàn)。

NBD：隨著大模型技術的發(fā)展，企業(yè)Agent在功能迭代上有哪些新趨勢？比如，是否會更注重多模態(tài)交互或自主決策能力？

陳劍光：確實，企業(yè)Agent的能力邊界正在被大模型技術不斷拓寬。Agent正從單一的文本交互，向融合視覺、聽覺等多模態(tài)信號的方向發(fā)展，這使得Agent能處理和應對更復雜的企業(yè)場景。例如，通過圖像識別解析掃描文檔、表單、儀表盤截圖等非結(jié)構(gòu)化信息；結(jié)合語音識別與合成技術，構(gòu)建更自然、可提供多感官交互體驗的數(shù)字人（虛擬客服、培訓助手）；在工業(yè)質(zhì)檢中，整合視覺識別實現(xiàn)對產(chǎn)品缺陷或生產(chǎn)線異常的自動化檢測等。

隨著大模型理解、推理和規(guī)劃能力的提升，Agent在預設規(guī)則和安全邊界內(nèi)的自主決策能力正在增強，能處理更復雜的規(guī)則組合，逐步從純“執(zhí)行者”向具有一定分析能力的“輔助決策者”角色演進。通過學習和掌握更廣泛、更復雜的工具調(diào)用能力，將更深度地嵌入現(xiàn)有業(yè)務流程，自動觸發(fā)并協(xié)調(diào)后端系統(tǒng)的多項操作，形成更強的端到端自動化鏈條。

除了“多模態(tài)”“多功能”“多協(xié)作”，即由多個具備不同技能的Agent組成“團隊”，通過明確的任務分配和協(xié)作機制，共同完成更復雜的、需要多步推理或跨系統(tǒng)協(xié)作的任務鏈，提升整體解決問題的能力上限。

NBD：對于還未嘗試Agent應用的中小企業(yè)，您認為它們可以從哪些低成本、易落地的場景入手，逐步感受其價值？

陳劍光：對于初次嘗試的企業(yè)，我們建議采取“小步快跑”策略，可以先從輕量場景切入，即需求明確、技術輕量、能快速體現(xiàn)價值的“試點場景”。例如，文檔摘要與信息檢索，可以通過智能信息助手，針對企業(yè)內(nèi)部政策/知識庫問答，包括HR福利查詢、IT常見問題解答；輕度的業(yè)務流程自動化，包括簡單表單數(shù)據(jù)的自動化審核（如檢查必填項、格式合規(guī)）、標準化通知的定時發(fā)送等；以及協(xié)同增強工具，包括編程助手提升、智能文檔翻譯等。

對中小企業(yè)而言，初期應當利用成熟的外部服務API（應用程序編程接口）來快速擴展Agent的功能，或選擇提供Agent能力的SaaS（軟件運營服務）產(chǎn)品或按需付費的模型服務（如大模型服務商的Agent平臺），也可基于低代碼/零代碼平臺構(gòu)建屬于自己的Agent應用，以降低硬件投入和初始維護成本。

通過這些試點，企業(yè)能低成本驗證技術價值，積累運營經(jīng)驗，培養(yǎng)團隊信心，為后續(xù)更復雜、深度的應用打下基礎。

最重要的是深刻理解——Agent的核心價值，絕非簡單地“替代人力”，而是通過承擔規(guī)則性、重復性的流程執(zhí)行任務，釋放員工的時間和精力，使其能夠投入到更富創(chuàng)造力的工作、更復雜的判斷決策和更高價值的創(chuàng)新活動中。其終極目標是實現(xiàn)“人機協(xié)同、人智增強”，推動組織效能升級。

封面圖片來源：每日經(jīng)濟新聞資料圖

如需轉(zhuǎn)載請與《每日經(jīng)濟新聞》報社聯(lián)系。
未經(jīng)《每日經(jīng)濟新聞》報社授權(quán)，嚴禁轉(zhuǎn)載或鏡像，違者必究。

讀者熱線：4008890008

特別提醒：如果我們使用了您的圖片，請作者與本站聯(lián)系索取稿酬。如您不希望作品出現(xiàn)在本站，可聯(lián)系我們要求撤下您的作品。

上一篇文章

雪峰科技：收購青島盛世普天科技有限公司51%股權(quán)

返回每經(jīng)網(wǎng)首頁

下一篇文章

*ST東晶：本次擬計提存貨跌價準備金額1333.17萬元