ディスカッション (55件)
正直なところ、9bだろうが27bだろうが、122bだろうが、スペックなんてどうでもいい。ただ、我々ファンをまだ愛していることを見せてくれよ。追記:今後は皮肉な投稿をする時は/sを付けなきゃいけないみたいだな。気の利いた皮肉のクソ投稿なんて誰も楽しめなくなっているようだ。俺はQwenも、東側の開発チームのみんなも大好きだよ。愛があるからこそいじっているんだ。気分を害した人がいたら謝るよ。明らかに一部の人の神経を逆なでしてしまったみたいだからな。何があっても愛しているぜ。それじゃあ、続きをいこうか。
あんたがやってよ
中国に送ってくれたら、俺が片付けてくるよ。
前々から深センと広州には行ってみたいと思ってたんだ
正直、彼らだって俺らと同じくらいリリースしたいはずだよ。3.6がどれだけ盛り上がったか(当然の評価だけどね)知ってるわけだし。まあでも、俺もめちゃくちゃ楽しみだわ笑。
ああ、足止めしてるのはラボの連中じゃなくて、経営層の連中だろうね。少なくとも俺の予想では。🤷♂️
というかさ、何事も時間がかかるものじゃない?3.5が出たのって2ヶ月も前じゃないんだけど?
今の時代、TikTok脳ってやつはマジでこれをもたらすんだな。
最近また395 maxをゲットしたんだけど、俺の397bはどこにあるんだよ
こっちはデュアルSparkクラスタで運用してるけど、旧式の397bが驚くほど快適に動いてるよ。
俺のデュアルStrix Haloでもめちゃくちゃ快適に動くよ。
deepseek 4 flashみたいな安さを求む。まだローカルじゃ動かせないんだよ😭
これを書いたことを将来(できれば近いうちに)後悔することになればいいんだけど、もし彼らがこの世代をスキップして、もっと良いものを後で出すとか、次の最先端モデル、例えば次世代のGPTやAnthropicのモデルなどが出た後にリリースするとか決めてたらどうなるんだろう。
次はQwQ NEXT V2かな?QwQは最高に気に入ってたから楽しみだ。
彼らは既に3.6リリースで9Bや122Bを飛ばしちゃったからね。3.7バージョンで期待してたんだけど。
もしそうでないなら、次は4.0リリースを期待するしかないか。
それにしても、コミュニティのファインチューナーたちの勢いが昔と変わった気がする。以前は、学習の隙間があれば誰かが飛び込んで、画期的なファインチューンで埋めてくれたものだけど。推論トレースを活用したものや、例の変なチューンはあるみたいだけど、コーディング特化のチューンは見当たらないし、IFチューンもない。Qwen3.5-9Bみたいに手軽に調整できる小さなモデルですらね。
MoEの呪いか。
Fanny、このモデルにはもっとスピードが必要だな。
悪いけど、あんた相当な馬鹿だな。普段ならこんなこと言わないけど、ただの馬鹿じゃなくて、根拠のない自信に満ち溢れた無知な馬鹿だ。新しいモデルを作るプロセスを全く理解してないようだけど、笑わせるなよ。まずは最大級のモデルを作って、そこから小さいモデルへと蒸留していくんだ。今見えてるのはQwen3.7 Maxだけで、397bパラメータのPlusモデルだってAPIでさえまだリリースされてないんだぞ。それなのに、単に意地悪でモデルを隠してるとでも思ってるのか?いや、そもそも学習が終わってない可能性が高いだろう。Maxがリリースされたのなんて、1週間前だろ?モデルの学習には数日から数週間かかるんだ。数時間で終わるような作業じゃないんだよ。
ここはLLMのコミュニティだろ?それなのに、自分の不満をLLMに投げかけて「なぜ時間がかかっているのか」を尋ねる手間すら惜しむのか?
それに、これらは完全に無料で提供されているモデルだぞ。開発側がこれらのローカルモデルをリリースして得られるものなんて知名度くらいだし、それすらもモデルをリリースする見返りとして十分なのか疑問視され始めている。コミュニティや開発ラボが一番必要としていないのは、無料のSOTA級モデルのリリースが遅いと文句を垂れる感謝を知らない負け犬なんだ。少しはマシな人間になれよ。
[削除されました]
また彼を見つけて、人生の教訓を教わった方が良さそうだな。;)
指摘してくれてありがとう。自分ならもっとうまく返せなかったと思う。本当に間抜けだよね。モデルが完成した時点で完璧だとか、全量子化モデルが揃って当然だとか思ってるみたいだし。初日に何かできていないからといって、やる気がないわけじゃないのに。コミュニティに対してこれほど寛大な企業は、Alibabaくらいだよ。
ここはLLMコミュニティなのに、自分の不満をLLMに投げかけて、なぜこれほど時間がかかっているのかを聞くことさえ面倒がっているね。
それがこの投稿の皮肉なところだよね。投稿者の無知で特権意識丸出しな感じがすごい。
それはひどい意見だな。3.6が出たのも3.5からそんなに経ってないのに、もう3.7がリリースされないと文句を言うやつがいるのか?すべてのQwenモデルは記念碑的な業績だし、世界に無料で提供されているんだぞ。
もし彼らが今後何もリリースしなかったとしても、文句を言う筋合いなんて全くない。俺だって3.7をローカルで動かしてみたいけど、これほど素晴らしい贈り物を受け取っておきながら不満を言うなんてありえないよ。
このモデル群は、かつてのホームPC革命のような革命そのものだよ。
本当に、このアプローチは正気の沙汰じゃない。今の「オープンソースLLM」コミュニティの暗部が露呈してるよね。アクセシブルなテクノロジーへの貢献とは程遠い、強欲な物乞いの集団になり下がってる。
みんな一体どうやって「貢献」しろって言うんだ?俺たちのほとんどはモデルを学習させる、あるいはファインチューニングするための計算リソースなんて持ってないぞ。俺なんて8Bを動かすのが精一杯なんだ。
貢献する方法は他にもあるよ。オープンソースのツールやベンチマーク、ハーネス、オーケストレーターなんかはたくさんあるし、みんなで協力してLLMのエコシステムをより良くしていけるはず。
企業やそこで働く個人に対して、もっと無料の労働を早くやれと要求したところで何の貢献にもならない。オープンソースの世界じゃ、バグ報告ですら立派な貢献になるんだ。それくらいの小さなことすらやってないなら、エコシステムに対してあれこれ要求する権利なんてないよ。
トラブルチケットにフィードバックを送ったり(低スペックのハードウェアでの検証でもいいし)、Issueにupvoteしたり、余裕があればクラウドでモデルをホストして本格的にテストしてみたり、チームにコーヒー代を寄付したり、感謝の言葉を伝えるのもいいかもね。全員が同じ方法で貢献できるわけじゃないけど、無料コミュニティを前進させるためのどんな手助けでも、力にはなるよ。
どんな製品やサービス、そして消費者にとってもこれが本質ってもんでしょ
無料の製品に対して、ブランド物の高い製品と同じ品質じゃないからって低評価をつけるクレーマーには本当に呆れるよ。素直に「ありがとう」ってチップでも置いておけばいいのに。
ああ、よくぞクレーマーたちを見抜いたね。で、どうしたいわけ?追い出すの?繰り返しになるけど、どんな製品を使っても一定数はそういうのに出くわすのが自然の摂理だよ。
解決するのは不可能だよ。あいつらは音楽の合間に聞こえる雑音みたいなもんだからさ(笑)
このサブレがマルチソーシャルなフランチャイズ化してしまったことが、今のコミュニティの形成に大きく影響したね。ネットワーキングのハブってより、カンファレンスみたいだった頃の方がよかったな。
俺たちって、猿からそう遠く離れてないからな。大抵の奴らの本質ってのはそんなもんだよ。(マジで最低だね)
残念だけど、それはほとんどのオープンソースコミュニティに当てはまることだよ。エンシッティフィケーション(粗悪化)の語られない側面だね。
16GB勢としては、もっと小さいモデルを求めてる人もいると思うよ。
3人の兄弟と育ったからさ、お互いに茶化し合うのが当たり前なんだよね。イギリスでいう「taking the piss」ってやつ。愛があってやってることさ。もちろん俺もQwenのことは大好きだし、彼らが3.7をリリースするために全力を尽くしてるのはわかってる。でも、さっき誰かが指摘したように俺はただのバカ野郎だから、これからも茶化し続けるよ。それも開発プロセスの一部だからね。
俺を知ってる人ならわかると思うけど、これは家族に対するような軽い皮肉でしかないんだ。みんなここでは家族みたいなもんだろ。
もし気分を害した人がいたらごめんよ😬
Owenもあんたのこと大好きだよ
そのミーム、最高だね!
中国が君のジョーク文化なんて気にしてないかもしれないし、ましてやギリシャ人が何と言おうと知ったこっちゃないっていう可能性を考えたことはある?いい加減、無礼な振る舞いはやめたら。
オープンソースでいてくれる限りは、全然余裕で待てるわw
大衆が押し寄せてきてクソ投稿が増える前の方が、ここは居心地が良かったな。
今言っておくけど、ダウンボートされるかもしれないな。でも、AIは万人のためのものじゃない。自分で投稿を書けないんなら、このサブから出ていってくれ。
そもそも3.7が出るって公式発表あったの?今あるものを使えばいいじゃん。3.6モデルですら十分に優秀だし。DFLASHとMTPを追加してやれば完璧でしょ
あのさ、ClosedAIにはgpt-ossがあるし、Googleにはgemma4があるだろ。残るアメリカの大手ラボにはオープンなLLMが必要だよ、できれば20Bくらいのやつが。
どのアメリカのラボのこと?IBMは少し前にGranite 4.1を出したし、MicrosoftはPhi-5のリリースが遅れてるのは認めざるを得ないけど、LLMのトレーニングに関する裁判の結果を待ってるんじゃないかな。Anthropic?期待しないほうがいいよ ;-) Nvidiaは3週間前にNemotron-3-Nano-Omni-30B-A3B-Reasoningを出した。AllenAIもニッチな関心を集めるモデルをいくつか出してるけど、最近Olmoはないな。あそこのペースは大体半年ごとだし、Olmo-3.1が半年くらい前だったから、そろそろ何かあるかもね?Metaのことは送信ボタン押すまで忘れてたよ。忘れ去られるなんて、かつての強豪も落ちぶれたもんだ。LLM360はCerebrasがメンバーだからアメリカ系と言えるけど、リリース間隔はよく知らないな。MoEを「次は出す」とは約束してるけど、いつになるかは不明。まあ、K2-V2 (72B dense) は今のところかなり優秀だけどね。考えれば考えるほど、君が言ってたのはAnthropicのことじゃないかって気がしてきたけど、彼らがオープンウェイトのモデルを出すことは永遠にないと思う。間違ってたら喜んで謝るけどさ!
大手ラボでモデルをOSS化するのって、実際かなり複雑なプロセスなんだよ。内部用モデルをトレーニングするよりずっと面倒なんだ。念のため言っておくと、単に「ウェイトを準備する」だけじゃない。法務、ポリシー、安全性に関わってくる。中国特有の課題なんかも想像できるしね。
3.5は最初のバージョンから公開まで9日かかった。3.6は23日。ってことは、3.7は59日かかる計算だな。
Qwen、俺たちを見捨てないでくれ!
残りのアメリカ大手ラボなら、オープンウェイトをリリースするくらいなら、持ってるGPUやTPUを全部燃やしたほうがマシだって考えるだろうよ。
Gemmaのこと?それともGPTのOSS?それともNemotron?
俺たちのローカル環境でのスピードもこれと同じだな。
経営者が指を鳴らせば魔法みたいに何でも出てくるなんて、どんな間抜けが考えてるんだか。自分たちのシステムだって万全に動いてないっていうのに!
3.5で9日以内にそれを実現させたのと同じ奴だよ。
あ、待てよ、その執行役員はクビになったんだったな。
😂