ディスカッション (11件)
「MiMo-v2.5-Pro-UltraSpeed」という新たなモデルが発表されました。驚くべきことに、1兆パラメータという巨大な規模でありながら、秒間1000トークンという圧倒的な推論速度を実現しています。
MiMoがDeepseekと同程度に安いことを考えると(前回の議論: https://news.ycombinator.com/item?id=48282814 )、超高速化のために3倍のコストを払ったとしても、依然として驚くほど安いよ。
回し者みたいに聞こえるかもしれないけど、指数関数的な成長ってすごいよね。プロンプトからほぼ瞬時にソフトウェアが生成されて、いくつか作成した中からベストなものを選ぶ、みたいな未来が来るよ。一番書きやすい構文のライブラリを選ぶとかで議論するなんて、今さらアセンブリでプログラムを書こうと言ってるくらい馬鹿げたことになりそう。
中国のプロバイダーによる価格とスピードの最適化と、アメリカ勢の価格高騰を組み合わせれば、予想より早く状況が一変するはず。多くの企業がすでにAI利用料の問題に頭を悩ませてるしね。
CerebrasがKimi K2.6を3000t/sでテスト運用(招待制)してるね。フロンティアモデルに向けて高速なハードウェアがもっと普及するのが楽しみだよ。Nvidia上で高速に動作するように設計されたモデルは、そのギャップを埋める素晴らしい選択肢になるはず。
いいね。フロンティアモデルはかなり印象的になったけど、人間が介在するインタラクティブなコーディングにはどれも少し遅すぎるんだよね。結局、雰囲気だけでコードを書く「バイブコーディング(vibecoding)」や複数のエージェントを並列実行することに頼らざるを得ない。でも高速なエージェントなら、もっとパートナーらしく感じられるはず。しばらくの間、タスク処理でCerebrasのGLM 4.7を使っていたけど、賢いモデルとは言えないまでも、サイトのライブプロトタイプを動かしながら「フォントを大きくして。いや、そんなに大きくなくていい」と指示してリアルタイムに変更を反映できるのは最高だった。MiMo 2.5なら、GLM 4.7より遥かに高い能力を発揮してくれるはずだよ。
1k TPSはすごいけど、このスレッドのAI生成コメントの多さの方が興味深いわ!
高速なAIは純粋にワクワクする反面、少し不安にもなるな。今のところClaudeは特定のタスクでは自分より速いけど、まだなんとか張り合えるレベルだ。今、プルリクを修正するプロンプトを走らせてるんだけど、もう1時間もかかってて、あと数時間はかかりそう。これがもし一瞬で終わるようになったら、ワークフローがどう変わるのか想像もつかないよ。集中しやすくなる面はあるかもしれない。プロンプトに時間がかかりすぎてマルチタスクしてしまい、後で後悔することもあるし。でも、何時間も、何日もかかっていた作業を数秒から数分でこなすAIなんて、ゲームチェンジャーすぎる。僕らの居場所がどこになるのかさえ分からないよ。
これは音声AIにとってかなり強力だね。推論能力があることでLLMは劇的に賢くなるけど、音声だとレイテンシの許容範囲が厳しすぎて、これまでは時間をかける余裕なんてなかったから。
MiMo V2.5 Pro(通常スピード版)は、僕らがテストしたオープンウェイトのコーディング用エージェントモデルの中で依然として最強だね。もっと性能の低いモデルが話題になってるのに、こっちがほとんど注目されていないのは不思議だよ。「ファストモード」の価格設定もかなり競争力があるし。
データはこちら:https://gertlabs.com/rankings (https://gertlabs.com/rankings)
生産性の議論についてだけど、いまいちピンとこないんだよね。2日かかっていた作業が2時間で終わるようになったとしても、(普通の従業員にとっては)あまり意味がないんだよ。なぜって、残りの時間が自由に使えるわけじゃないからね。結局、いつも通り1日8時間働かなきゃいけないんだ。ただ、働き方のパターンが変わるだけ。2日間かけてじっくりと課題を深掘りする「職人的な楽しみ」は消えて、今はひたすらプロンプトを投げ続けて、正解が出てくることを祈るスロットマシンを回しているような状況だよ。
だから、むしろ僕らにとっては状況が悪化しているとさえ言える。もちろん、企業や経営層にとっては話は別で、彼らはこのAIの現状をめちゃくちゃ気に入っているだろうけどね!