HN🔥 254
💬 279

【Muse Spark】自分専用の「超知能」を手に入れる時代へ。Meta AIが目指すスケーリングの極致

chabons
1日前

ディスカッション (11件)

0
chabonsOP🔥 254
1日前

今回の投稿は、Meta AI (https://meta.ai/) へのリンクのみという非常にシンプルな内容です。タイトルにある「Muse Spark」は、個人の能力を拡張する『パーソナル超知能(Personal Superintelligence)』への到達を掲げており、MetaがどのようにAIをスケールさせ、私たちの日常に統合しようとしているのか、その大きな野心が感じられます。

1
daft_pink
1日前

AI競争と19世紀の鉄道狂時代がマジで似てるって実感を強める内容だね。どこの会社も似たような性能のAIを持つようになるから、参入障壁(堀)なんてなくなるし、価格も安くなる。投資した分を回収できる日は来ないんじゃないかな。

2
creddit
1日前

自前のベンチマークをいくつか回してみたけど、正直微妙。OpenAI vs Anthropic vs Geminiのトップ争いに食い込めるとは到底思えないな。技術的な質問をいくつか投げたけど、回答に重大な分析ミスがいくつもあったし。

3
tty456
1日前

これを叩いてるコメントの意味がわからないな。Opus 4.6に僅差で勝つか、あるいは並ぶだけでも、Metaがトップ層のAI企業と戦えるモデルを作れるって証明になる。確かに大金つぎ込んでるし運用コストもかかるけど、ClaudeやCodexみたいに課金してでも使いたいコーディングエージェントに仕上げるまで、あとどれくらいの手間がかかる?それにMetaが自社製品(インスタ、WhatsApp、VRとか)でSOTAモデルを使うのに他社に金を払わなくて済むようになるのは、長期的なバランスシートで見ればかなりデカいはず(R&D費用がずっとかかるとはいえ)。

4
hackrmn
1日前

リンク先のヒーロー画像、落ち着いたティール色の背景に「Introducing Muse Spark」って書いてあるだけのやつ、容量が3.5MBもあるんだけど。さすがにちょっと…。

5
glerk
1日前

「パーソナル(個人用)」ってのは、Metaが個人のデータを手に入れてもっと広告を売りつけられるようになるって意味だろうね。

6
granzymes
約23時間前

GPT 5.4やGemini 3.1 Pro、Opus 4.6にめちゃくちゃ肉薄してるね!コーディングやエージェント性能のベンチマークではOpenAIに負けてるし、テキスト推論ではGoogleに、ツールのHumanity's Last ExamではAnthropicに一歩譲ってる(意外にも今Anthropicがリードしてるのはそこだけなんだけど)。Metaはまだ完全には追いついてないけど、かなり近づいたし、またフロンティア級のラボだって胸を張って言えると思う。今は「3.5強」の争いって感じかな。次のモデルでさらに良くなることを期待。競合が増えるのは良いことだ!哀れなGrok 4.2はもう比較表から外していいかもね。

7
TobTobXX
約22時間前

Muse Sparkはネイティブなマルチモーダル推論モデルで、[...] visual chain of thought [...] をサポートしている。

これって「思考プロセス(CoT)がユーザーに見える」って意味なのか(ChatGPTみたいに隠されてない)、それとも「CoTの媒体がテキストじゃなくて視覚情報」って意味(画像で思考する)なのかどっちだろう? 推論のためだけに一時的な画像を生成するのはコストに合わないだろうから前者だと思うけど、だとしたら何でわざわざそこを強調するのかが謎。もし後者だとしたら、めちゃくちゃ面白いよね。テキストで思考しない初のモデルになるわけだし。

8
zmmmmm
約20時間前

個人的な一番の疑問は、Metaが再び競争力のあるフロンティアモデルを手にしたとして、それが今のMetaの戦略にとって何を意味するのかってこと。特に、これまで追求してきたオープンなエコシステムとかオープンモデルの哲学は捨てちゃったの? 確かにllama4はイマイチだったけど、あの戦略を続けていた場合と比べると、今のMetaは後退してる感じが否めない。llamaのおかげで他のフロンティアモデル提供者と肩を並べる存在だと思われていたのに、今はもう話題にすら登らない。今回の新モデルを使う気になるには、相当な性能向上を見せてもらわないとね。Metaにモデルはあっても、他社はその技術を中心にエコシステム全体を作り上げるのに忙しくて、Metaにはそれがない。例えば10億ドルくらいOpenCodeか何かに突っ込んで、オープンなツール群でエコシステム戦略を再点火させるとか。もし議論の中心に戻りたいなら、「何か」が必要だよ。そうじゃなければ、ただのMeta製アプリの裏で動く、誰も気に留めないクローズドな独自モデルで終わっちゃう。

10
laser
約19時間前

まず試したのは、仕事で直接必要だった間取り図の視覚的推論テスト。昨日ChatGPT、Claude、Gemini、Grok(全部一番安い有料プラン)に投げたやつなんだけど、Geminiだけが正解して、他はハルシネーションを起こしたり、部屋の相対的な位置関係を間違えたりしたんだ。そこでMuse Sparkに全く同じプロンプトとドキュメントを投げてみたら、完璧にこなしたよ。複数ページのPDFから該当するページをチャット内に抽出して表示しつつ、正確な回答を出してきた。たまたまかもしれないし、運が良かっただけかもしれないけど、この出だしの素晴らしい結果を見ると期待しちゃうな。コーディング(これにはまだClaude CodeやCodexが必要だけど、Metaからも何か出ることを期待しつつ)以外は、メインで使うツールをこれに切り替えるか検討するために、他のモデルと並行してテストを続けてみるつもり。とはいえ、Metaのデータ利用ポリシーはLLMプロバイダーの中でも最悪レベルだから、機密情報を扱うには向かないのが残念。でも、あれだけ膨大な独自データを持ってるのは長期的に見れば強みなんだろうね。無料サービスで自分の利用データが別の形で収益化されるよりは、他社みたいにデータを学習に使わせない有料プランを用意してほしいな。