ディスカッション (11件)
「GLM-5.1」が発表されました。本作は、従来のモデルが苦手としていた長期間・長尺のタスク(Long-Horizon Tasks)を効率的にこなすことを目標に設計されています。複雑な推論や連続的なアクションが必要なタスクにおいて、AIがどこまで進化できるのか、今後の動向から目が離せません。
リリースと同時にUnslothの量子化版も利用できるね。[0] IQ4_XSは754Bパラメータで361GBという巨大さ。これ、一般的なローカルLLM愛好家ならハイエンドなハードウェアを使っていても動かせない代物だよ。
[0] https://huggingface.co/unsloth/GLM-5.1-GGUF (https://huggingface.co/unsloth/GLM-5.1-GGUF)
正直ちょっと悲しいな。TypeScriptに関してはopusやcodexよりglm5.1の方がずっと上手く書ける気がするんだけど、長いコンテキストになるとどうしても時々支離滅裂なモードになっちゃうんだよね。まあ、200kを超えても問題ないセッションも何度もあったから、常にってわけじゃないんだけど。
ここのコメント、みんな数時間以上このモデルを使ってるような話し方だけど、本当?それとも単に現時点での最初の感想をシェアしてるだけ?
GLM-5.0はオープンソースモデルの中では本物だよ。社内のベンチマークでは一貫して他のオープンソースモデルを凌駕していて、GPT-5.2のようなものと同等だった。ただ、コーディングには使ってなくて、もっと曖昧なタスクに使ってる。
エージェントが生成したコードの「速度」をモデルの質の指標にするっていうのは珍しくて面白いね。自分はエージェント系プロジェクトのベンチマーク最適化(「ベンチマークを作成してベースラインを出し、ズルや出力品質の低下なしに1.4倍速くする」といったこと)に注力してるんだけど、Opus 4.6はそれがすごく上手いよ。Rustなら、既存の高速なコードに対しても低レベルな最適化を見つけて、全てのテストをパスしたまま最大6倍も高速化できるんだ。
モデル間の実用的なパフォーマンスを定量化する、実用的でアクションにつなげやすい面白い方法だよね。
これのフラッシュ版がリリースされることを切に願ってる。GLM 4.7 Flashは、自分のローカルでのエージェントコーディング作業のメインモデルで、本当に素晴らしいから。リリース情報には何もなかったけど、今後出てくれると嬉しいな。
これは素晴らしいペリカンを描いてくれただけじゃなく……アニメーションまでしてくれたよ! https://simonwillison.net/2026/Apr/7/glm-51/ (https://simonwillison.net/2026/Apr/7/glm-51/)
毎日、次の3つのことがますます明確になってきている:
(1) OpenAIとAnthropicは完全に終わった。強力な参入障壁(Moat)がないのは明らかだ
(2) ローカル/プライベートな推論こそがAIの未来
(3) 「キラープロダクト」はまだ存在しない(だから、みんな取り組もうぜ!)
自分のテスト0では、GLM 5.1はGLM 5より性能が低いよ(推論あり・なし両方で)。
このモデルは汎用的な知能というより、エージェント利用やコーディングに寄せてチューニングされている気がする。
Claude Mythosの投稿を見たところ。いつ公開されるかは不明だけど、これは単なる段階的な進歩じゃなくて、本当の飛躍を感じさせるね。次のGLMのリリースも待ってる、スペックがとんでもないことになってるから。