ディスカッション (11件)
Qwen3.6-Plusが登場しました。今回のアップデートは、単なる性能向上にとどまらず、実社会で自律的にタスクをこなす「リアルワールド・エージェント」としての実用性を追求しています。
ほとんどのQwenモデルと違って、このモデルはオープンウェイトじゃないし、パラメータ数も公開されてない。あと、Opus 4.6が2ヶ月も前に出てるのに4.5と比較してるのも変だよね。
これはホスト限定のモデルで、彼らが有名になったきっかけのオープンウェイトじゃない。オープンモデルを出して良い宣伝になったんだろうけど、そこからClaudeやChatGPTの競合として見てもらうように方向転換するのは大変そう。最初の方は、オープンモデルを配ってたのは単なる広告で、太っ腹だったわけじゃないって気づいた人たちから怒りの声が上がってるね。最新の4.6じゃなくてOpus 4.5とか一世代前のモデルと比較してるのは、明らかに誤解を招こうとしてる感じがして、印象も良くない。SOTAレベルじゃなくても安く提供できるモデルの需要はそこそこあると思うけど、このニッチな市場での価格競争で勝てるかは微妙かな。格安APIのユーザーはブランドへの忠誠心なんてなくて、少しでもいいモデルが出ればすぐ乗り換えちゃうから。
エージェントのベンチマークは面白いけど、Qwen3.6-Plusが自分のミスからリカバリーしなきゃいけないような長期的なタスクをどうこなすか見てみたいな。大抵のエージェント評価はハッピーパスしかテストしないから。難しいのは、ステップ3で間違ったアクションをしたときに、ステップ15でそれに気づいて修正できるかどうか。誰か実際の開発ワークフローでストレステストした人いる?
みんなが驚いてることに驚いた。Qwenはもう結構前から非公開のPlusとかMaxのバリアントをホストしてるしね。
他のコメントとは意見が分かれるけど、Opus 4.5と比較するのはそんなに紛らわしいとは思わないな。Opus 4.5がどれくらい優秀だったかは覚えてるし。これを使おうか検討してるときは、自分が慣れ親しんでる一番近いモデルと比較するのが一番参考になるから。最高レベルのモデルを求めてるならこれには乗り換えない。小さいバージョンがそれなりに使えるのを期待してたり、選択肢を増やしたかったり、品質以外に理由がある場合に乗り換える感じかな。
Opus 4.5とかGemini Pro 3.0と比較してることにみんなが反応するのはわかる。でも「誤解を招く」とまで言うのはちょっと言い過ぎな気がするな。新しいのが出たからって、前の世代がどれくらいだったかすぐ忘れるわけじゃないし。この分野は進歩がめちゃくちゃ早くて、四半期ごとに新モデルが出るから、今の批判は少し過剰だと思う。ベンチマークは今でも十分良く見えるしね。GLM-5とかKimi K2.5も使ったことあるけど、普通に使えるレベルだったから、Qwenのこのモデルがそれらとどう戦えるかは結構楽しみ。あと、なんでみんな今回初めて非公開モデルを出したみたいに言ってるの?Qwen-3.5-plusもQwen-3-Maxもクローズドだったし、今に始まったことじゃないよね。QwenがSOTAモデルに追いつこうとするのは消費者にとっては良いことだよ。クローズドウェイトなのは残念だけど、彼らの進歩は評価すべきだと思う。
かなりいい感じのペリカンができた:https://gist.github.com/simonw/ca081b679734bc0e5997a43d29fad... 。Alibaba CloudのAPIを使って生成したんだけど、アカウント登録とPayPalの設定が必要だった。でもOpenRouterで今無料で提供されてるみたいだから、そっちを使えばよかったな:https://openrouter.ai/qwen/qwen3.6-plus:free
AIベンダーは競合他社の型落ちモデルと比較して発表するのをやめてほしいな。印象がすごく悪いし、誰も騙されないよ。Qwenのモデル自体は素晴らしいし、こんな怪しいマーケティング手法のせいで評判を落とすのはもったいない。
中国のラボがオープンソース化をやめると思ってる人がいたら、そうはならない理由を教えるよ。まず、Z.aiのコーディングプランに登録してみて。自分はやり方を知ってるけど、君たちには無理だと思う。Z.aiのネットでの存在感のなさは致命的で、こういう小規模なラボには自分たちでマーケティングして直接販売する能力がない。知名度を維持するにはオープンモデルを出すしかないんだ。販売面でもOpenRouterやOpenCode経由の流通に頼ってるし、ユーザーの関心はオープンモデルの性能にかかってる。中国のラボにとってオープンソース化は国家的な戦略とかじゃなくて、単にそれが唯一の商用化の道だからなんだよ。
SOTAって言ってるけど、あらゆる指標で旧世代のOpusに負けてない?これ、なんか変だよね。