ディスカッション (11件)
最近、アジア圏のAIスタートアップたちが「Mythos」のような高性能AIモデルの開発・発表を加速させています。今後、LLM市場の勢力図が大きく塗り替えられるかもしれません。要注目のトレンドです。
ここの投資家ラインナップは圧巻だね [1]。あと、先日立ったHNのヘッドライン [2] でも100件以上のコメントがついてたよ。
これもう一日に何度も言ってる気がするけど:
https://news.ycombinator.com/item?id=48697258 (https://news.ycombinator.com/item?id=48697258)
SOTAだろうとなかろうと、IPOを目指すトークン提供企業は今後どんどん厳しくなるだろうな。
SOTAモデルだって売れないし、売れるモデルもオープンソースより少しマシな程度。なのにコストは20倍から50倍。TAM(獲得可能な最大市場規模)はほぼ開発者だけで、AI導入で実際に利益が増えたなんて話は顧客からは皆無……。
IPOのタイミングはもう逃したんじゃないかな。
AnthropicやOpenAIは今から一体何にピボットしろっていうんだ?
第一印象:第三者機関によるベンチマーク結果を出してくれ、話はそれからだ。正直、どちらの会社も聞いたことがないんだけど。市場トップのモデルに匹敵するっていう彼らの言葉をそのまま信じろってこと?
Sakanaは自社モデルを「オーケストレーションモデル」と呼んでるけど、要は複数のモデルをくっつけただけってことなのかな?
信頼できるベンチマークがない以上、「テキストを入力してテキストを出力する」っていう一点においてのみMythosに似ていると言えるレベルじゃないか。
C#とUnityでmcpとopen codeを使って、現実的なタスクでFuguモデルを試してみたよ。テーマシステムのレビューとカラー変更の計画だけで、20ドルプランの5時間枠を使い切っちゃった。だから100ドルプランにアップグレードして実装と結果を確認したんだけど、結果はOpusより劣るし、めちゃくちゃ遅い。結局新しい5時間枠も使い果たして、週間の割り当ての35%も消費したのに、Opusならもっと短時間かつ低コストでできることすらろくにこなせなかった。
この情報をどう判断するかは任せるけど、金ドブ感がすごいよ。
年内に「安全上の懸念」を理由に「外国製」LLMが禁止されると予想してる。
実際の性能なんて関係ないさ。ただAnthropicがMythos系システムの基準を作っちゃったから、その曖昧な基準に合致するものは何であれ「大衆には危険」ってことになるんだろう。
「Mythosに似ている」っていう話、もううんざりだ。一般人にはベンチマークを見る以外に比較する方法なんてないんだから。
ひねくれた見方をすれば、モデルがある程度の性能を持っていれば、Mythosはもう手に入らないんだから「Mythos並みだ」という彼らの主張を覆すのは難しいだろうね。
Fugu Ultra [0] は実際には単一のモデルじゃなくて、クラウド上のハーネスのようなシステムで、複数のモデルにルーティングするものみたいだね。OpenRouterのFusion [1] に近い感じかな。
「単一のモノリシックなモデルではなく、Fuguは学習済みのマルチエージェントオーケストレーションシステムである。これは、交換可能なモデルプール全体でタスクをルーティングし、自身を再帰的に呼び出すように訓練された言語モデルだ。」- https://openrouter.ai/sakana/fugu-ultra
[0] https://sakana.ai/fugu/ (https://sakana.ai/fugu/)
[1] https://openrouter.ai/openrouter/fusion (https://openrouter.ai/openrouter/fusion)
Mythosや今後登場するSolに対抗できるとは思えないし、重みが公開されていないなら大きな流れの中では大した問題じゃない。それでも、アジア発のLLMの取り組みは称賛するし、アメリカ勢にプレッシャーを与え続けてほしいね。