AI會和人類談判了？Meta AI新研究登Science，LeCun稱里程碑成果

2026-05-06 生活百科 meta

AI會和人類談判了？Meta AI新研究登Science，LeCun稱里程碑成果

文章插圖

AI會和人類談判了？Meta AI新研究登Science，LeCun稱里程碑成果

文章插圖

AI都學會和人類談判了？還能成功說服人類聽它安排？
話術一流到人類完全分辨不出它是AI 。

AI會和人類談判了？Meta AI新研究登Science，LeCun稱里程碑成果

文章插圖

這就是Meta AI的最新成果——AI模型CICERO（西塞羅），現已登上Science 。

AI會和人類談判了？Meta AI新研究登Science，LeCun稱里程碑成果

文章插圖

嗯，就是和古羅馬著名政治家、演說家西塞羅同名。
研究人員讓這個AI西塞羅隱藏身份加入到一個外交游戲里，82名人類玩家在40場游戲中，都沒有懷疑過它其實是個AI 。
而且還戰績斐然，全程平均分達到25.8%，是人類玩家平均分的2倍，并且最終排名為前10% 。
成果一經發布，就在網上引發熱議。
有人評價：這意味著AI在最具人類特點的游戲里戰勝人類，超乎想象…

AI會和人類談判了？Meta AI新研究登Science，LeCun稱里程碑成果

文章插圖

LeCun都稱它為：里程碑式的研究！

AI會和人類談判了？Meta AI新研究登Science，LeCun稱里程碑成果

文章插圖

目前，模型代碼已在GitHub上開源。
真有AI縱橫家那感覺了
AI嘮嗑其實一直都引人詬病，更別提外交這種需要超高話術的場景了。
它需要理解對方的語言、動機，制定自己的話術策略，并調整好措辭。
有時甚至還需要“耍心眼”，故意說一些假話給對方設套。

AI會和人類談判了？Meta AI新研究登Science，LeCun稱里程碑成果

文章插圖

這種超高難度任務，怎么挑戰？
俗話說一口吃不成胖子。
Meta AI就想到了先從游戲場景來切入（畢竟AI在玩游戲上是老手了）。
不過和之前棋類或競技游戲不同，外交游戲并沒有那么強的規則性，運籌帷幄、隨機應變的環節不少。
實驗中用到的游戲是webDiplomacy（以下用“外交游戲”指代它）。

AI會和人類談判了？Meta AI新研究登Science，LeCun稱里程碑成果

文章插圖

這款游戲的背景是1901年的歐洲，7位玩家每人控制一個大國，通過相互合作、協商，盡可能地占領更多領土。
西塞羅的核心是由一個對話引擎和一個戰略推理引擎共同驅動的。
簡單理解，這里的對話引擎和GPT-3、LaMDA類似，戰略推理引擎和AlphaGo相近。

AI會和人類談判了？Meta AI新研究登Science，LeCun稱里程碑成果

文章插圖

用到的對話模型，是從一個類似于2.7億參數的BART模型訓練而來。
BART吸收了GPT和BERT各自的特點，它比BERT更適合文本生成的場景，還能雙向理解上下文語境信息。
【AI會和人類談判了？Meta AI新研究登Science，LeCun稱里程碑成果】具體來看，研究人員先從互聯網上獲取文本訓練對話模型，然后再在實際的外交游戲場景中微調。
戰略推理引擎用到的是一個規劃算法（planning algorithm）。
該算法能夠基于現況計算出一個最優選擇。再通過強化學習訓練，懲罰模型做出的“不像人”的策略，以此讓模型給出的策略更合理。
畢竟，在外交游戲中是和人打交道，讓AI更像人也是最基本的要求之一。
而且強化學習這種迭代式的訓練，可以不斷改進AI做出的策略預測。比傳統方法中常用的監督學習（即打標簽的方式）效果更好。
實操中，西塞羅首先會根據目前為止的游戲狀態和對話，對每個人的會采取的動作做一個初步預判。

相關經驗推薦

上一篇：“一個月的VIP”撐得起愛奇藝們嗎？

下一篇：豪婿韓三千最新結局完整版贅婿韓三千大結局