AI會和人類談判了?Meta AI新研究登Science,LeCun稱里程碑成果


AI會和人類談判了?Meta AI新研究登Science,LeCun稱里程碑成果

文章插圖

AI會和人類談判了?Meta AI新研究登Science,LeCun稱里程碑成果

文章插圖

AI都學會和人類談判了?還能成功說服人類聽它安排?
話術一流到人類完全分辨不出它是AI 。
AI會和人類談判了?Meta AI新研究登Science,LeCun稱里程碑成果

文章插圖


這就是Meta AI的最新成果——AI模型CICERO(西塞羅),現已登上Science 。
AI會和人類談判了?Meta AI新研究登Science,LeCun稱里程碑成果

文章插圖


嗯 , 就是和古羅馬著名政治家、演說家西塞羅同名 。
研究人員讓這個AI西塞羅隱藏身份加入到一個外交游戲里,82名人類玩家在40場游戲中,都沒有懷疑過它其實是個AI 。
而且還戰績斐然,全程平均分達到25.8%,是人類玩家平均分的2倍,并且最終排名為前10% 。
成果一經發布,就在網上引發熱議 。
有人評價:這意味著AI在最具人類特點的游戲里戰勝人類,超乎想象…
AI會和人類談判了?Meta AI新研究登Science,LeCun稱里程碑成果

文章插圖


LeCun都稱它為:里程碑式的研究!
AI會和人類談判了?Meta AI新研究登Science,LeCun稱里程碑成果

文章插圖


目前,模型代碼已在GitHub上開源 。
真有AI縱橫家那感覺了
AI嘮嗑其實一直都引人詬病 , 更別提外交這種需要超高話術的場景了 。
它需要理解對方的語言、動機,制定自己的話術策略 , 并調整好措辭 。
有時甚至還需要“耍心眼”,故意說一些假話給對方設套 。
AI會和人類談判了?Meta AI新研究登Science,LeCun稱里程碑成果

文章插圖


這種超高難度任務,怎么挑戰?
俗話說一口吃不成胖子 。
Meta AI就想到了先從游戲場景來切入(畢竟AI在玩游戲上是老手了) 。
不過和之前棋類或競技游戲不同,外交游戲并沒有那么強的規則性,運籌帷幄、隨機應變的環節不少 。
實驗中用到的游戲是webDiplomacy(以下用“外交游戲”指代它) 。
AI會和人類談判了?Meta AI新研究登Science,LeCun稱里程碑成果

文章插圖


這款游戲的背景是1901年的歐洲,7位玩家每人控制一個大國,通過相互合作、協商,盡可能地占領更多領土 。
西塞羅的核心是由一個對話引擎和一個戰略推理引擎共同驅動的 。
簡單理解 , 這里的對話引擎和GPT-3、LaMDA類似,戰略推理引擎和AlphaGo相近 。
AI會和人類談判了?Meta AI新研究登Science,LeCun稱里程碑成果

文章插圖


用到的對話模型,是從一個類似于2.7億參數的BART模型訓練而來 。
BART吸收了GPT和BERT各自的特點,它比BERT更適合文本生成的場景,還能雙向理解上下文語境信息 。
【AI會和人類談判了?Meta AI新研究登Science,LeCun稱里程碑成果】具體來看,研究人員先從互聯網上獲取文本訓練對話模型,然后再在實際的外交游戲場景中微調 。
戰略推理引擎用到的是一個規劃算法(planning algorithm) 。
該算法能夠基于現況計算出一個最優選擇 。再通過強化學習訓練,懲罰模型做出的“不像人”的策略,以此讓模型給出的策略更合理 。
畢竟,在外交游戲中是和人打交道,讓AI更像人也是最基本的要求之一 。
而且強化學習這種迭代式的訓練,可以不斷改進AI做出的策略預測 。比傳統方法中常用的監督學習(即打標簽的方式)效果更好 。
實操中,西塞羅首先會根據目前為止的游戲狀態和對話,對每個人的會采取的動作做一個初步預判 。

相關經驗推薦