ディスカッション (11件)
OpenAIのモデルが、離散幾何学における長年の主要な未解決問題(予想)を否定的に証明しました。これはAIが単なる計算機を超え、高度な数学的推論を行えるようになった画期的な瞬間と言えるでしょう。
前にも言ったけど、AIはマクドナルドの店舗運営ができるようになるよりも先に、フィールズ賞を受賞すると思う。数学をプレイするためのチェス盤(Lean)を作るのが難しかっただけで、今はパターン認識と計算の問題になった。LLMは始まりに過ぎない。StockFishのような、数学に特化したAIがもっと出てくるはずだよ。
なぜエルデシュ(Erdős)に関連する問題が解かれたという話しか聞かないんだろう?他にも未解決問題は山ほどあるはずなのに、r/singularityやr/accelerateで目にするChatGPTの「数学的ブレイクスルー」は全部エルデシュ関連の問題ばかりな気がする。
今回のタスクの「要約された」思考プロセス(ブログ記事にリンクがある)が125ページもあるんだ。これは狂気じみた推論の規模で、AnthropicがMythosでほのめかしていたものに近いよ。
「LLMは学習データを補間しているだけ」という人たちへ。
エイヤーや、初期のウィトゲンシュタインは、数学的真理は世界に関する新しい事実を報告するものではないと考えた。証明とは、公理、定義、記号、ルールの中にすでに含まれているものを展開する作業だ。
その考え方はすごく面白いし、だからといって数学者が「発見」をしたという評価を下すことに何の問題もないと思う。
つまり、「既存の素材を再構成しているだけ」という理屈は批判の理由にならないか、さもなければ過去のフィールズ賞受賞者も大量に賞を返上しなきゃいけなくなるね。
LLMをコーディングで使い込んでいる人にとっては、驚くようなことじゃないし、時間の問題だったよね。
数学者は新しいツールを構築し、それを新しい方法で応用することで発見をする。試行錯誤の連続だし、勘を頼りに繋がりを探す作業だ。確かにLLMには「発見」という言葉の意味を理解する能力はないかもしれないけど、狭い目標に対してモンテカルロ法で手当たり次第にツールを試して、うまくいったものを積み上げたり組み合わせたりすることはできる。
記事を読む限り、まさにその方法で発見がなされたようだ。LLMが「驚くような繋がり」を使って期待以上の成果を出したんだ。ただ、その成果も、目標の背後にある人間の意図や、AIが見つけた新しい道筋を評価する人間ならではの理解、そして(人間が構築した)数学という言語がなければ意味をなさない。AIが結果そのものよりも、その道筋を見つけたことのほうがずっと価値があるんだ。
面白い指摘だと思うけど、今回の証明(反証)はエルデシュの元の予想に対する反例を見つけることで行われたんだよね。リンク先のPDFにある数学者の一人のコメントにもある通り、これは予想が真であると証明するよりも少し面白みに欠けるという意見に同意する。
僕の考えでは、予想が正しいと証明するには、より深い理論構築が必要だ。予想がなぜ正しいのかをより大きな理論に根ざして説明しなければならない。それに対して反例の場合、モデルは正しい構成を見つけるために、より高度な探索を行えばいいだけだから。
もちろん、この探索は素朴なものではなく非常に印象的だ。反例に至る繋がりを証明するために多くのステップを要するだろうけど、新しい深い数学を開発するのではなく、既存のアイデアを繋ぎ合わせている段階ということに変わりはない。
もちろん、この功績を過小評価するつもりはない。着実に前進しているよ!個人的な感覚だけど、モデルは新しい数学を開発するような理論構築ができるようになるまで、あと少しだと思う。あとは、より長い時間軸で思考できるようになればいいだけじゃないかな。
この証明は、初等幾何学の問題に対して、代数的整数論の予期せぬ洗練されたアイデアをもたらした。
こうした成果について読めば読むほど、これらのモデルの力の源泉は、あらゆる分野の知識を事前に持っていて、新しい領域への転換に全く苦労しないことにある気がしてくる。
個人的にこれが素晴らしいと思うのは、現代の科学者が直面している過度な専門化という壁を突破する助けになるかもしれない点だ。専門化は重要だけど、一方で使える道具やインスピレーションの幅を狭めてしまう側面もあるからね。
OpenAIが「PhDレベルの知能がある」と言ったときにみんなが笑っていたのに、今やAIが新しい数学を作れるかどうか(つまりPhDレベルではなく、ライプニッツやオイラー、ガロアレベルか?)という話にゴールポストが動かされているのが面白いね。
付属論文から引用:
この議論は、少なくとも振り返ってみればEllenberg-Venkatesh、Golod-Shafarevich、Hajir-Maire-Ramakrishnaの功績に帰せられるアイデアに決定的に依存している。
これについて誰か詳しく説明してくれない?
このHNのスレッドを見て少し沈んだ気分になった。なぜそう感じるのか考えている。
OpenAIのプレスリリース的な大げさな表現の裏には、数学研究におけるLLMの役割という、興味深く繊細な問題がたくさんある。結果と併せて公開されている数学者たちのコメントをぜひクリックして読んでみてほしい。本当に面白い議論が行われている。特にTim Gowersのコメントはおすすめだよ。本当に興味深い内容だから!
それなのに、ここのコメント欄は2023年から繰り返されているLLMに対する使い古された議論の応酬や、反論、怒りの返信といった戦場になっている。
3年前の論争がそのまま残っていて、同じ喧嘩を何度も繰り返しているように見えることに、悲しくならない?
2年後もまだこんなことをしているんだろうか。