【浦東康信】視角-當人工智能擁有好奇心,結果可能…
好奇心,是人和人工智能最顯著的差異之一。從我們睜開雙眼看這個世界開始,我們就在努力的了解著周圍的一切,我們了解世界的方式很多樣;一開始是試圖把所有東西放進嘴巴里,到后來我們走遍了這世界的每一個角落。
這是生命中最美妙的東西,在滿足好奇心的過程中,我們獲得了快樂。人類了解一切,不是為了完成某一個目標,而僅僅是一種來自本能的沖動。
電影畫面
可人工智能所做的,只有根據既定目標進行學習、搜索和計算。掃地機器人會探索周圍環(huán)境,可這不是因為好奇,而是為了建立房間中的SLAM以完成工作。這也是強人工智能不會出現的證據之一:人類自己都沒弄明白“意識”為何會存在,更沒法將“本能”加在人工智能頭上。
不過在現有技術下,我們能否讓人工智能做出類似好奇的行為呢?比如給予無意義的探索行為一些獎勵,或者是把探索行為和完成工作相結合進行評分。
答案是可以。
好奇心幫助人工智能成為更棒的水管工
還記得我們第一次玩超級瑪麗的時候嗎?或許我們中很多人玩的都是小霸王學習機里的超級瑪麗式英語學習軟件。不管是什么,進入游戲的第一時間,我們通常都是試一試手柄上的每一個按鍵是做什么的,然后跳來跳去,嘗試觸碰游戲里的每一個小方塊。這就是好奇心最基本的表現。
那么人工智能在玩超級瑪麗時是怎樣的呢?通常情況下是應用了增強學習算法,用正負反饋機制幫助人工智能快速通關。踩死一只烏龜,獲得正向反饋,掉入懸崖,獲得反向反饋。問題時,只要能夠繼續(xù)過關,人工智能很難學會新的動作,這也就造成了遇到新的關卡時,人工智能常常需要耗費很大力氣才能通過。
超級瑪麗
在一篇關于人工智能好奇心的論文中提到,人工智能利用傳統(tǒng)的增強學習方法訓練,在超級瑪麗的游戲過程中,人工智能卡在了游戲的30%處,因為人工智能需要越過一個坑,而想要越過那個坑,需要15到20個特定順序的按鍵操作。由于在墜落進坑里時已經獲得了反向反饋,人工智能常常在坑的位置止步不前。
上述論文的作者,來自UC Berkeley的研究團隊提出了一種新的思路,為人工智能加入了內部好奇心構型。以自監(jiān)督的方式,預測自身行動會造成何種結果,并將這種算法稱作自監(jiān)督預測算法。
當外部反饋減少時,內部好奇心構型會激勵人工智能通過探索環(huán)境去檢驗自我對于行動的預測。結果是,采取內部好奇心構型的人工智能不會盲目重復那些有正向反饋的動作,而是開始了解游戲環(huán)境,把握整體游戲進程。最終戰(zhàn)勝了那個坑。
好奇心不僅會害死貓,還會讓人工智能得多動癥
當人類表現出過度好奇時,會有怎樣的結果?最常見的,注意力無法集中,常常將手頭的工作半途而廢。同樣,人工智能擁有好奇心后也會有同樣的表現。搭載TEXPLORE-VANIR算法的機器人在一項給門開鎖的任務上表現較差,就是常常因為好奇而去探索環(huán)境,導致任務完成的延遲。甚至有學者稱,這是人工智能的“多動癥”。
這樣看來,如何平衡內部和外部的反饋將是如何讓人工智能好奇心發(fā)揮作用的最大問題。
但我們相信,不管以何種形式,未來的人工智能一定會出現類似好奇心的機制,在更了解這個世界的前提下,更好的服務人類。
來源:虎嗅網