ディスカッション (11件)
ついに「Qwen3.7-Max」が姿を現しました。このモデルは単なるアップデートに留まらず、AIエージェント開発の最前線を塗り替える可能性を秘めています。次世代の推論能力と自律的なタスク遂行能力を兼ね備えたこのモデルが、今後の開発シーンにどのようなインパクトをもたらすのか、今まさに注目が集まっています。
かなりいい数字だね。でも、なぜ最新の競合バージョンと比較しないのかがどうしても分からない。どうせみんな気づくんだからさ。
Qwenからのオープンウェイトモデルのリリース、もっと期待してる。特に122Bと397Bには注目してるよ。
独自モデルのリリースが増えてきたからこそ、米国の主要なハイパースケーラーと提携して、米国拠点のサービス経由でモデルを使えるようになればいいのにって強く思う。理にかなっていないとか、彼らの利益にならない理由があるのは理解できるよ(米国だって同じことを反射的にやってるわけじゃないしね)。でも、実運用環境で本気で試せるようになったら最高なんだけどな。
AA-omniscienceのハルシネーション抑制率はSOTA(最高水準)だね。Opus 4.7やGemini 3.1 Pro、GPT5.5よりも上だよ!チームのみんなおめでとう。
個人的に一番信頼してるパターンは、外部アクションを実行するたびに小さな検証用アーティファクトを追加することかな。エージェントが失敗する原因って、推論の深さが足りないことより、サイレントな状態ドリフト(意図しない状態のズレ)によるものがほとんどだし。
これって、1週間後にHuggingFaceでリリースされるタイプのもの?それとも、このままプロプライエタリ(非公開)なものとして確定なの?
昨晩Claude Codeの週制限にギリギリ引っかかりそうだったから、Claudeに指示してllama.cppとOpenCodeでQwen3.6をセットアップしたんだ。正直、Claude Codeの(無料の!)代わりとして最高だよ。小規模で複雑じゃないタスクなら十分すぎる性能だ。今回の新バージョンを試すのが楽しみ。オープンソースモデルがフロンティア(最先端)にこれほど近づいているのは、本当にすごいことだよ。
pi agentを使ってるんだけど、ホストされたQwenモデルを試してみたいんだ。おすすめの選択肢ってある?公式のプロバイダーにはAlibabaが含まれてなくて。OpenRouterなんかは十分に速いかな?(参考までに、DeepSeek v4はこういったプロキシサービスだとかなり速度制限がかかるんだよね)
ベンチマークの中にOpus 4.7もgpt5.5もGemini flash 3.5も入ってないな。
ローカルLLMを触り始めたんだけど、正直かなり感動してる。NVIDIA A1000(VRAM 6GB)とRAM 96GBを積んだワークステーションラップトップを持ってるんだけど、GPUを使う機会がほとんどなかったんだよね。たまにCADデザインやOpenCVで機械学習をするくらいで。試しにllama3:latestを動かしてみたら、かなり速くてびっくりした!Qwenが自分の環境でどう動くのか試してみたい。