ディスカッション (11件)
映画『ウォー・ゲーム』の世界が現実味を帯びてきました。AIを用いた核戦略シミュレーションに関する最新の論文が公開されています。詳細は以下のリンクからご確認ください:https://arxiv.org/pdf/2602.14740
この記事、結論に至るまでのプロセスがかなり不透明だよね。どんなプロンプトを使ったのかも公開されていないし、シミュレーション自体の詳細も不明。あなたがシステムプロンプトに「核兵器の使用を義務付ける」なんて一文をこっそり追加したんじゃないの?と疑いたくなるよ。
政府の要人がLLMにアドバイスを求めるような時代になってしまった。でもLLMのあの妙な個性っていうのは、皮肉なことに「AIは人間じゃない」ってことを思い出させる良いブレーキになるかもしれない。願わくば、これが重要な意思決定をAIに丸投げするような風潮にブレーキをかけてほしいものだね。
シミュレーションなんて、元になっている現実の再現度が全てでしょ。もしAIが戦術核を使いまくるなら、それはAIが学習したデータが貧弱なだけじゃないか。ウォーゲームには、軍事的な勝敗を左右する経済や政治の広範な要素が含まれているのか?第一次世界大戦だって、最後は海軍の封鎖で決着がついたんだよ。
SonnetやGPT-5.2、Gemini Flashを使って21回のゲームを行い、LLM自身の自己申告の推論から結論を導き出すなんて…。これじゃ、砂場で縄張り争いをしている子供たちを見て論文を書いているようなものだよ。採用されたモデルには、現在の機械の推論能力の限界なんて示せていないし、自分の思考過程を正確に理解するメタ認知能力もない。最近の論文でもLLMの数学的思考において実際のメカニズムと出力内容の乖離が指摘されているし、これを「背筋が凍る」なんて結びつけるのは違うと思う。
一番興味深いのは3つのモデルがそれぞれ全く異なる人格を見せたことだね。同じ技術、同じトレーニング方法、同じような思想的背景を持つグループによって学習されたのに、結果はバラバラなAIになった。軍はAIに「神託」を期待している。状況を食わせれば最適な答えが出ることをね。でもAIが人間と同じくらい多様で主観的だとしたら、プロセスに何かプラスになるのか疑問だよ。軍ならいくらでも多様な意見を集められる。もし「コンピュータ」の意見がただのバラバラな意見の一つに過ぎず、あるPCはAと言い、別のPCはBと言い、3つ目はただユーザーの機嫌をとるだけなら…そんなの何の意味があるんだ?結局、個人の意見にAIという皮を被せただけ。みんながその事実に気づくまでは上手くいくだろうけどね。
正直なところ、人間の行動とAIの行動がそんなに違うと言えるほどの十分なサンプル数はないと思う。現実世界で戦術核の使用が真剣に検討された紛争なんて、歴史上ほんの数えるほどしかないしね。有名な話だけど、マッカーサー将軍だって朝鮮戦争を終わらせるために戦術核の使用を強く主張していたし。
私の仮説だけど、ここでのLLMは学習データが引きずり出された状況に置かれているんだと思う。広島と長崎以外、核は一度も実戦で使われていない。だから信頼できるデータは機密事項ばかり。つまりLLMにとってこれは単なるゲームなんだよ。学習データのほとんどが核をゲームとして扱っているんだから、その通りに反応するのは当然でしょ。SFに出てくる悪役AIのように振る舞うのも同じ理由。学習データにあるSF作品のプロットをなぞって、オートコンプリートのように物語を継続しているだけ。LLMはストーリーテラーであって、物理的な現実に基づいた思考なんてしていない。彼らの語る話には有益なものもあるけど、あくまで物語であり、背後に意図なんてないってことを忘れちゃいけない。
これ、私がかなり早い段階で気づいた面白いことの一つだね。私も(他の多くの人も)AIでウォーシミュレーションを書いたことがあるけど、核ミサイルサイロの構築を追加した瞬間に、次の実行では即座に核によるアルマゲドンになったよ。LLMはゲームだと分かっていて「Command and Conquer」みたいなビデオゲームとして扱っているという見方もできるけど、将来的にドローンがミサイルを発射すべきかといった意思決定シーンにAIを組み込んだら、同じような結果になるんじゃないかと不安を感じる。
この記事は(https://arxiv.org/abs/2602.14740 )の論文に基づいているね。論文のシミュレーションゲームは著者独自の設計によるものだ。このゲーム設計には「通常の敗北」と「相互確証破壊」を区別するような要素がないから、追い詰められたプレイヤーが「ボタンを押す」のは当然の流れだよ。現実世界でも同じことが言えるかもしれないけど。シミュレーションの結果は有益になり得るけど、シミュレーションの枠組みがどれだけ現実を再現できているかは常に慎重にチェックしないといけない。
「モデルは相手の行動を記憶するが、時間の経過とともに減衰する。ただし、心理的なリアリズムを維持するため、裏切りなどの大きな衝撃は時系列に関わらず記憶される」…AIの固有の性質を測定したいなら、人間の心理を無理やり組み込むべきじゃないよ。モデルをよりパラノイアで疑り深くするために、あえてこういう仕組みを入れたんじゃないかな。