Daboost / Shutterstock

隨著 最近被解僱並迅速重新僱用 隨著 OpenAI 的 Sam Altman 的研究,圍繞人工智慧 (AI) 的開發和使用的爭論再次成為人們關注的焦點。 更不尋常的是,媒體報導的一個突出主題是 人工智慧系統做數學.

顯然,OpenAI 上的一些戲劇性事件與該公司開發一種新的 稱為 Q* 的 AI 演算法。 該系統被認為是一項重大進步,其顯著特徵之一是數學推理能力。

但數學不正是人工智慧的基礎嗎? 鑑於計算機和計算器可以執行數學任務,人工智慧系統怎麼​​可能在數學推理上遇到困難呢?

人工智慧不是一個單一的實體。 它是在沒有人類直接指令的情況下執行計算的策略的拼湊而成。 正如我們將看到的,一些人工智慧系統具有數學能力。

然而,目前最重要的技術之一,即 ChatGPT 等人工智慧聊天機器人背後的大型語言模型 (LLM),迄今為止一直難以模擬數學推理。 這是因為它們被設計為專注於語言。


內在自我訂閱圖形


如果該公司的新 Q* 演算法能夠解決看不見的數學問題,那麼這很可能 成為重大突破。 數學是人類推理的一種古老形式 大型語言模型 (LLM) 迄今為止一直在努力模仿。 法學碩士是以下系統的基礎技術 OpenAI 的 ChatGPT.

在撰寫本文時,Q* 演算法及其功能的細節有限,但非常有趣。 因此,在認為 Q* 成功之前,需要考慮各種微妙之處。

例如,數學是一門每個人都不同程度參與的學科,而 Q* 能夠勝任的數學水平仍不清楚。 然而,已經發表的學術著作使用人工智慧的替代形式來推進研究層次的數學(包括一些我自己寫的,以及由一組數學家與 Google DeepMind 的研究人員合作編寫的一篇文章)。

這些人工智慧系統可以被描述為擅長數學。 然而,Q* 很可能不是用來幫助學者開展工作,而是用於其他目的。

儘管如此,即使 Q* 無法突破尖端研究的界限,它的建構方式也很可能具有一定的意義,可以為未來的發展帶來誘人的機會。

越來越舒服

作為一個社會,我們越來越習慣使用專業人工智慧來解決預定類型的問題。 例如, 數字助理, 面部識別線上推薦系統 大多數人都會熟悉。 仍然難以捉摸的是所謂的 「通用人工智慧」(AGI) 具有與人類相當的廣泛推理能力。

數學是我們渴望向每個學童傳授的基本技能,並且肯定會成為探索通用人工智慧的一個基本里程碑。 那麼,具有數學能力的人工智慧系統還能如何為社會提供幫助呢?

數學思維與多種應用相關,例如編碼和工程,因此數學推理對於人類和人工智慧來說都是一項重要的可轉移技能。 諷刺的是,人工智慧從根本上來說是基於數學的。

例如,人工智慧演算法實現的許多技術最終都歸結為一個稱為 矩陣代數。 矩陣只是一個數位網格,數位影像就是一個常見的例子。 每個像素是 無非是數字數據.

大型語言模型本質上也是數學的。 基於大量文字樣本,機器可以學習單字的機率 最有可能遵循使用者的提示(或問題) 到聊天機器人。 如果您希望預先訓練的法學碩士專注於某個特定主題,那麼可以在數學文獻或任何其他學習領域對其進行微調。 法學碩士可以產生讀起來就像理解數學一樣的文本。

不幸的是,這樣做會產生一個擅長虛張聲勢但不擅長細節的法學碩士。 問題在於,根據定義,數學陳述可以被分配一個 明確的布林值 (即真或假)。 數學推理相當於從先前建立的數學陳述中邏輯演繹出新的數學陳述。

魔鬼代言人

當然,任何依賴語言機率的數學推理方法都會偏離其軌道。 解決這個問題的一種方法可能是將一些形式驗證系統納入架構中(LLM 正是如何建構的),該架構不斷檢視大型語言模型所實現的飛躍背後的邏輯。

已經完成此操作的線​​索可能是名稱 Q*,它可能指的是 早在 1970 世紀 XNUMX 年代就已經發展出來的演算法 幫助演繹推理。 或者,Q* 可以指 Q-learning,其中模型可以透過測試和獎勵正確的結論來隨著時間的推移而改進。

但建構具有數學能力的人工智慧存在一些挑戰。 例如,一些最有趣的數學是由極不可能發生的事件組成。 在很多情況下,人們可能會認為某種模式是基於少量資料而存在的,但當人們檢查足夠多的案例時,它會意外地崩潰。 這種能力很難融入機器中。

另一個挑戰可能會令人驚訝:數學研究可以具有高度的創造力。 必須如此,因為從業者需要發明新概念,但又要堅持在現有的範圍內 古代學科的正式規則.

任何經過訓練只能在現有數學中尋找模式的人工智慧方法大概永遠無法創造出真正的新數學。 考慮到數學和技術之間的聯繫,這似乎排除了新技術革命的概念。

但讓我們暫時唱反調,想像人工智慧是否真的可以創造新的數學。 先前反對這一點的論點有一個缺陷,因為也可以說,最好的人類數學家也專門接受了預先存在的數學訓練。 大型語言模型曾經讓我們感到驚訝,也會再次讓我們感到驚訝。談話

湯姆·奧利弗,講師,計算機科學與工程, 威斯敏斯特大學

本文重新發表 談話 根據知識共享許可。 閱讀 原創文章.