ディスカッション (11件)
Anthropicが、同社の最新AIモデル「Claude Mythos」の展開を大幅に拡大すると発表しました。今回のアップデートにより、世界15カ国において重要インフラを支えるシステムへの導入が本格化します。詳細については、TechCrunchの以下の記事を参照してください。 https://techcrunch.com/2026/06/02/anthropic-scales-claude-mythos-to-critical-infrastructure-in-15-countries/
一番怖いのはここだ。仮に(あくまで「仮に」だが)技術的な重大な脆弱性をすべて修正できたとしても(敵対者や国家アクターが公開された攻撃モデルを悪用する前に)、1年後にはAIがソーシャルエンジニアリングを極めていて、十分なトークンさえあればどんなシステムにも侵入できるようになっているんじゃないか。もし社会が銀行や機関のデータ管理すら信用できなくなったら、その先には何が待ってる?みんなでインターネットの電源でも切るのか?
GPT-5.5-Cyberは、すでにサイバータスクにおいてMythosと同等か、それ以上の能力に達してる。彼らが公開を渋ってる唯一の理由は、公開した瞬間に「3月時点では革新的だったけど、今はもうそうじゃない」ってバレるからだろ。コストは高いし動作も重いんだから。
Anthropicはパフォーマンス(見せかけ)でやってるだけじゃないかな。Mythosで期待感を煽るだけで実際にはリリースしない。セキュリティ市場は金が余ってるから、企業やスタートアップ向けに「セキュリティ特化型AI」として法外な価格で売り込むためのマーケティング戦略でしょ。
メモリ安全性に興味がある人向けの話だけど、自分はAIエージェントを使って一般的なウェブ基盤プロジェクトを、安全でパフォーマンスの高いRustに移植する実験をしてるんだ。Bunの移植版に少し影響を受けていて、メモリ安全性が重要になりすぎて、みんな「ドロップイン置換(既存の置き換え)」を求めるようになる日が来るんじゃないかと思ってる。
- Valkey/Redisの移植版: https://github.com/ianm199/valdr (https://github.com/ianm199/valdr) (シングルノードのテストスイートを約99%通過。レプリケーションやクラスタリング、HAのような本格的なプロ向け機能は未実装か初期段階)
- Lua 5.1-5.5の移植版: https://github.com/ianm199/lua-rs-port/tree/main (https://github.com/ianm199/lua-rs-port/tree/main) (こっちの方が進んでる)
- Nginxのバージョンもあるけど、まだ開発途上で北極星的な存在
- これらのプロジェクトは今のところかなりアルファ版に近い
参加に興味がある人や、似たような実験をしたことがある人がいれば、ぜひ協力したい!大規模なエージェント群をどう動かすかについては手法が多すぎて、まだ完璧なシステムは存在しないと思ってるんだ。
明らかにAnthropicはMythosを一般公開するのに必要な計算リソースが足りてないんだよ。彼らはリソース不足を隠すために「セキュリティ上の懸念」を口実に使ってる。OpenAIに対する優位性を保ちつつ、責任ある「倫理的」なロールアウトという見栄えの良い形で、裏でこっそりリリースしようとしてるんだ。
最近聞いた直接の体験談を共有するよ。
職場で使ってみたけど
みんなが騒いでるほどのものではなかった
セキュリティスキャン用のフレームワークとしてなら有用かもしれないけど、指摘された問題を全部見つけるのに巨大なモデルは必要ないよ
とにかくノイズがひどかった
何百、何千という誤検知や、重要度の低い問題、あるいは無関係な警告の山だった
まともな指摘は、そのうちのほんの一部
一番困ったのは、経営陣がツールが出してきたすべての問題を「手を止めて即座に直せ」という案件として扱ったことだ
「誰も使ってなくてデフォルトで無効になってるモジュールのRCE脆弱性が見つかったからNginxにパッチを当てろ」みたいな話で会社全体がパニックになったり
「Dockerの特定のバージョン脆弱性」をフラグしたせいで「すべてのEC2 AMIをアップグレードしろ」と騒いだり。実際の脆弱性が関係あるかどうかなんてお構いなしに、Dockerが入ってるマシン全てに警告を出してくるんだ
脆弱性自体は特定のAuthプラグイン設定と、 Mosley Docker互換ツールを組み合わせた時にのみ有効なものだったのに、ツールは「Dockerに脆弱性がある」としか認識できてなかった
その一方で、コンテナ脱出ができるdirtyfragなんかは完全にスルー。何も言わなかったよ
うーん、正直、レポートの質にはガッカリしたよ。もし会社が僕に組織全体のインフラ情報を全部開示して、ClaudeでCVEを検索させれば、同じレベルの結果なら余裕で出せるはずだ……。
これって巨大なマーケティング戦略の一種なのかな?
自分の国[1]で大規模監視が行われても問題を感じないような企業に、自分が住んでる場所の重要インフラやソースコードを扱ってほしくはないな。
[1] https://www.anthropic.com/news/statement-department-of-war (https://www.anthropic.com/news/statement-department-of-war) :
しかし、こうしたシステムを国内の大規模監視に利用することは、民主主義的価値観と両立しない。
今まさにAIスタックやサービスのマネタイズの初期段階にあって、Anthropicはそれをうまく取り込もうとしてるね。コストに見合ってるかは分からないけど、彼らが勝者であることは間違いない。彼らは経営陣に「AIの価値と必要性」を認識させた。それが重要なんだ。今後は予算がつくようになるはずさ。生産性向上だけでなく、スイスアーミーナイフのように万能なツールとして位置づけているのは、実に賢い戦略だと思う。