圖靈測試與人工智慧 10 17

Pexels/Google Deepmind, CC BY-SA

1950年,英國電腦科學家阿蘭·圖靈提出了一種實驗方法來回答這個問題:機器能思考嗎? 他建議,如果一個人在五分鐘的詢問後無法分辨自己是在與人工智慧(AI)機器還是另一個人交談,這將證明人工智慧具有類似人類的智慧。

儘管人工智慧系統在圖靈生前還遠遠​​沒有通過他的測試,但他推測:

「[…] 大約 70 年後,將有可能對電腦進行程式設計 […] 使它們能夠很好地玩模仿遊戲,以至於詢問者在 XNUMX 分鐘後做出正確識別的機會不會超過 XNUMX%質疑。

如今,在圖靈提出這項提議 70 多年後,還沒有任何人工智慧能夠成功通過滿足他概述的具體條件的測試。 儘管如此,作為 一些頭條新聞 反映,一些系統已經非常接近了。

最近的一項實驗 測試了三種大型語言模型,包括 GPT-4(ChatGPT 背後的人工智慧技術)。 參與者花了兩分鐘與另一個人或人工智慧系統聊天。 人工智慧會被提示犯一些小的拼字錯誤,如果測試者變得太激進,人工智慧就會退出。


內在自我訂閱圖形


在這個提示下,人工智慧很好地欺騙了測試人員。 當與 AI 機器人配對時,測試人員只能在 60% 的時間內正確猜測他們是否正在與 AI 系統交談。

鑑於自然語言處理系統設計的快速進展,我們可能會在未來幾年內看到人工智慧通過圖靈的原始測試。

但模仿人類真的是對智力的有效測試嗎? 如果沒有,我們可以使用哪些替代基準來衡量人工智慧的能力?

圖靈測試的局限性

雖然通過圖靈測試的系統給了我們 一些 證明它是聰明的,這個測驗不是對智力的決定性測驗。 一個問題是它可能會產生“假陰性”。

當今的大型語言模型通常被設計為立即聲明它們不是人類。 例如,當你問 ChatGPT 一個問題時,它通常會在答案前面加上「作為人工智慧語言模型」這個短語。 即使人工智慧系統具有通過圖靈測試的潛在能力,這種程式設計也會涵蓋這種能力。

該測試還存在某些「誤報」的風險。 正如哲學家內德·布洛克 指出: 在 1981 年的一篇文章中,可以想像,一個系統只需進行硬編碼,對任何可能的輸入做出類似人類的回應,就可以通過圖靈測試。

除此之外,圖靈測試特別關注人類認知。 如果人工智慧認知與人類認知不同,專家詢問者將能夠找到人工智慧和人類表現不同的任務。

對於這個問題,圖靈寫道:

這種反對意見是非常強烈的,但至少我們可以說,如果能夠構造出一台機器來令人滿意地玩模仿遊戲,我們就不必為這種反對意見所困擾。

換句話說,雖然通過圖靈測試是系統智慧的好證據,但失敗並不是系統智慧的好證據。 任何監管機構都不批准 智能。

此外,該測試並不能很好地衡量人工智慧是否有意識,是否能感受到痛苦和快樂,或是否具有道德意義。 許多認知科學家認為,意識涉及一組特定的心理能力,包括工作記憶、高階思維、感知環境和模擬身體圍繞環境移動的能力。

圖靈測試並沒有回答人工智慧系統是否有效的問題 有這些能力.

人工智慧不斷增長的能力

圖靈測試是基於一定的邏輯的。 即:人類是有智慧的,所以任何能有效模仿人類的東西都可能是智慧的。

但這個想法並沒有告訴我們任何有關智力本質的資訊。 衡量人工智慧智能的另一種方法是更批判性地思考智能是什麼。

目前還沒有任何單一測試可以權威地衡量人工智慧或人類智慧。

在最廣泛的層面上,我們可以將智力視為 能力 在不同的環境中實現一系列的目標。 更智慧的系統是那些能夠在更廣泛的環境中實現更廣泛的目標的系統。

因此,追蹤通用人工智慧系統設計進展的最佳方法是評估其在各種任務中的表現。 機器學習研究人員開發了一系列基準來實現這一點。

例如,GPT-4 是 能夠正確回答 86% 的問題涉及大規模多任務語言理解——衡量一系列大學程度學術科目多項選擇測驗表現的基準。

也取得了不錯的成績 代理工作台,一種工具,可以衡量大型語言模型作為代理的能力,例如瀏覽網頁、在線購買產品和參加遊戲競爭。

圖靈測試還有意義嗎?

圖靈測試是模仿的衡量標準,即人工智慧模擬人類行為的能力。 大型語言模型是模仿專家,這現在體現在它們通過圖靈測試的潛力上。 但智力並不等於模仿。

有多少種需要實現的目標,就有多少種智力。 了解人工智慧智慧的最佳方法是監控其在開發一系列重要功能方面的進展。

同時,在談到人工智慧是否智慧的問題時,重要的是我們不要不斷地「改變目標」。 由於人工智慧的能力正在迅速提高,人工智慧概念的批評者不斷發現人工智慧系統可能難以完成的新任務——結果卻發現它們已經跳過了 還有另一個障礙.

在這種情況下,相關的問題不是人工智慧系統是否智能,而是更準確地說,什麼是智能? 他們可能擁有的智力。談話

西蒙‧戈德斯坦,澳洲天主教大學迪亞諾亞哲學研究所副教授, 澳洲天主教大學卡梅倫·多梅尼科·柯克-賈尼尼,哲學助理教授, Πανεπιστήμιο Rutgers

本文重新發表 談話 根據知識共享許可。 閱讀 原創文章.