彩神想象未來(lái)某天,你的保姆機(jī)器人接到下樓買咖啡的指令,自主完成開(kāi)門、乘坐電梯、尋找便利店、取咖啡、付錢等一連串動(dòng)作,最后將咖啡遞到你手里。
這不是科幻電影,而是具有自主進(jìn)化能力的AI智能體帶來(lái)的可能——不再局限于在固定場(chǎng)景里完成特定動(dòng)作,而是能像人類一樣在陌生環(huán)境里“自主學(xué)習(xí)”,并根據(jù)場(chǎng)景變化做出相應(yīng)的動(dòng)作。
作為人工智能最主要的載體,智能體由硬件、軟件等多種要素組成,能夠感知周圍環(huán)境,并根據(jù)自身所處環(huán)境做出判斷和決策。在我們的日常生活中,一輛輔助駕駛的汽車是智能體,可以根據(jù)路況自主地踩油門或者剎車;家里的掃地機(jī)器人也是智能體,能識(shí)別地板上是紙屑果皮還是灰塵,并選擇合適的清潔方式。
實(shí)際上,智能體并非向來(lái)智能,它們的進(jìn)化史就像一個(gè)人的成長(zhǎng)史。早期,智能體只會(huì)“死記硬背”。例如,1997年擊敗國(guó)際象棋冠軍的超級(jí)電腦“深藍(lán)”,其實(shí)是存儲(chǔ)了幾十萬(wàn)局棋譜的“復(fù)讀機(jī)”,遇到規(guī)則外的招式就會(huì)卡殼。2014年,谷歌研發(fā)的AlphaGo開(kāi)啟了“思維訓(xùn)練”的模式,智能體開(kāi)始通過(guò)自我學(xué)習(xí)提升自身能力,并逐漸進(jìn)階為某個(gè)專項(xiàng)領(lǐng)域的高手。2022年,以ChatGPT為代表的大語(yǔ)言模型橫空出世,標(biāo)志著智能體發(fā)展出較高的智能水平。例如,借助AI大模型破譯甲骨文時(shí),它會(huì)自主調(diào)取青銅器紋樣數(shù)據(jù)庫(kù)來(lái)“腦補(bǔ)”生僻字的字義,甚至根據(jù)上下文的意思“創(chuàng)造”新字符。
AI大模型依賴于人工收集的數(shù)據(jù)進(jìn)行訓(xùn)練。“投喂”給它們什么訓(xùn)練數(shù)據(jù),就學(xué)習(xí)什么知識(shí)。例如,給它們提供100萬(wàn)張貓和狗的圖像,并且標(biāo)注清楚哪些是貓、哪些是狗,經(jīng)過(guò)長(zhǎng)時(shí)間的訓(xùn)練,它們就能很好地分辨貓和狗,但對(duì)于沒(méi)見(jiàn)過(guò)的動(dòng)物依然無(wú)法識(shí)別。
而下一代智能體將具備自主學(xué)習(xí)的能力——通過(guò)觀察這個(gè)世界、和周圍的環(huán)境互動(dòng),來(lái)學(xué)習(xí)各種技能。不需要收集和標(biāo)注好100萬(wàn)張圖像,只用幾張圖像教會(huì)它們最基本的知識(shí),它們就可以自己學(xué)習(xí)更豐富的知識(shí)。例如,如果想教智能體騎自行車,只需要示范一次,它就會(huì)自己嘗試不同的騎行動(dòng)作,并不斷試錯(cuò),最終學(xué)會(huì)騎行的技巧。這意味著下一代智能體將在自主性和適應(yīng)性方面更上一個(gè)臺(tái)階,能夠主動(dòng)獲取信息,進(jìn)行信息加工,然后分解任務(wù)、完成任務(wù)。
基于這種方式,若干年后的智能體或?qū)氐兹谌胛覀兊纳睿簭N房里,智能灶臺(tái)不僅能烹飪美味佳肴,還能記住你的口味偏好;醫(yī)院里,AI醫(yī)生為病人診斷出病癥,帶著“定制方案”找主刀醫(yī)生討論……
不過(guò)眼下,智能體的發(fā)展還遠(yuǎn)未達(dá)到人們所期望的“耳聰目明、心靈手巧”,它們只能在固定場(chǎng)景中完成特定任務(wù),并不具備跨場(chǎng)景完成任務(wù)的能力:一個(gè)智能體可以為汽車擰螺絲,但換成輪船可能就做不到了;可以在平地上翩翩起舞,但換成山路也許就“四肢不協(xié)調(diào)”了。因此,“跨任務(wù)、跨場(chǎng)景、跨本體”是下一代智能體的發(fā)展目標(biāo)。
隨著人工智能從數(shù)字世界走向物理世界,智能體的可信性變得愈發(fā)重要。在智能體技術(shù)不斷發(fā)展的過(guò)程中,我們始終需要守護(hù)“技術(shù)進(jìn)步須服務(wù)于人性溫暖”的文明底線,從源頭上界定其行為邊界與倫理規(guī)范。
想象未來(lái)某天,你的保姆機(jī)器人接到下樓買咖啡的指令,自主完成開(kāi)門、乘坐電梯、尋找便利店、取咖啡、付錢等一連串動(dòng)作,最后將咖啡遞到你手里。