ディスカッション (11件)
Nvidiaが、Windows PC向けにこれまでにないほどパワフルなCPUシステムの提案を行っています。次世代のコンピューティング体験を塗り替えるような、まさに「怪物」とも呼べるスペックが期待されており、今後のWindowsエコシステムに大きな衝撃を与えそうです。
「ローカルでAIモデルを動かす人がどれくらいいるのか疑問だね。まだニッチな用途にしか思えない。ただ、ゲームをするためのマシンとしては悪くないだろうね」
誰が勝者になるかは分からないけど、最近のGemmaのリリースなんかを見ると、ビジネス上のセキュリティ云々を抜きにしても、コスト的な観点からローカルでモデルを走らせるケースは増えていく気がするよ。ただ、このアーキテクチャがどうやってゲーミング性能に貢献するのかは謎だし、元の発言自体がちょっと怪しいよね。
「世界トップ2%の科学者に選出(スタンフォード/エルゼビア2025)、GitHubトップ1000開発者」とか書いてるけど、この人どこにでもこれを載せていて、逆に胡散臭く見えて逆効果じゃないかな。
実際の製品のプレスリリースはここだね:
https://nvidianews.nvidia.com/news/nvidia-microsoft-windows-pcs-agents-rtx-spark
Microsoftと、何よりNVIDIAが、これまで推し進めてきた「従量課金制のクラウドAIモデル」と根本的に矛盾するデバイスを投入してきたことについて、指摘するコメントが少なくて驚いてるよ。
他の発表や噂(Copilot向けのオフラインBYOK強化や、従量課金なしのAIの未来といった話)を見れば、彼らが「クラウド限定AI」は持続不可能だし、自分たちの利益にもならないと判断したのは明らかだよね。ただ、OpenAIのビジネスを食いかねない製品をあえて出してきたのは注目すべき点だと思う。
執筆者の努力を貶めるつもりはないけど、中身の薄い話に感じるな。スペックシート以上には深く調べていない印象だね。
-
確かにRTX 5070モバイルと同じコア数かもしれないけど、帯域幅とTDPのピークは3分の2に抑えられている。GPU単体での性能は専用チップの半分程度になるだろうね。
-
AppleはSVE2こそ持っていないけど、AMX(独自)とSMEがある。なぜ彼がSVE2の方がSMEより高性能だと考えているのか分からない。
-
単一のコアタイプについて触れているだけで、全体構成に言及していない。DGX SparkとAppleチップの比較については、もう1年前から分かっていることだ。CPUはM3 Proとほぼ同等、GPU演算(ラスタライゼーションではない)に関しては、帯域幅を考慮しなければM4 ProとM4 Maxの間くらいだ。
結局、こいつらの強みはCUDAが動くこと、それだけ。それがなきゃ、発売時点でAppleより2〜3世代、AMDより1世代遅れていることになる。
それと、DGX Sparkの真骨頂だった接続用のNICも今回は省かれているしね。
QualcommのSnapdragon X2 Elite Extremeは、シングルコアCPU性能でNVIDIAのチップを圧倒してるよ。IntelやAMDの最高性能モデルにも勝っている。ユニファイドメモリも積んでいるし、CPU性能と電力効率の両面でAppleのMシリーズと対等に渡り合える唯一のCPUだね。しかも今年後半ではなく、今すぐノートPCで手に入る。Qualcommはもっと注目されるべきだよ。
ユニファイドメモリプールは、データセンターの外ではこれからもシステムアーキテクチャの「ゲームチェンジャー」であり続けるだろうね。
実際、最先端のゲームやコンシューマー向けのワークロードであっても、GPUのPCIe帯域やGDDRメモリの帯域をフル活用しているわけじゃない。ローカルのAI利用ですら、平均的なユーザーにとってはメモリの高速化が劇的な恩恵をもたらすわけじゃないんだ。
ユニファイドメモリプールには二つのメリットがある:
- 特定のメモリ領域に縛られず、必要に応じてシステムの利用を最適化できる
- メモリの種類をGDDRかDDRかで分ける必要がなく、一括で同じものを大量購入できるため、コストを削減できる(SFFやポータブル機では特に重要)
メモリが高騰している今、ユニファイドプールは理にかなっている。将来的にメモリが安くなったとしても、個別に管理するより巨大なプールを確保する方が実用的だしね。
唯一の大きな欠点はセキュリティだね。GPUとCPUでメモリを共有すれば、サイドチャネル攻撃の標的になりやすい。これからはメモリセーフな設計がますます重要になってくるはずだよ(Rustユーザーには朗報かな)。
多くの人は、この種のノートPCが何をもたらすかを誤解しているんじゃないかな。
ローカルAIが普及する前に、まずはハイブリッドAIが主流になるはずだ。
巨大なモデルを完全にローカルで動かすのはコスト的に現実的じゃない。でも、クラウドで重い処理をしつつ、一部の小規模なタスクをローカルで行う「エージェントワークフロー」を考えると、すごく魅力的だと思わないか? 基本的な処理なら、Gemma4:12bやQwen-27bのようなモデルをローカルで動かせば、クラウドとの通信遅延も最小限で済むしね。
リモートの巨大モデルと、ローカルの特定のタスクに特化した5つのモデルを組み合わせるような使い方が、今すぐできたら最高だよね。例えばOpenCodeを使っている時に、どのタスクをローカルで動かすか、あるいはどの専門モデルを使うべきかを判断してくれる小さなモデルがいたら便利だろう?
ただ、一番の懸念は「このハードウェアに、ローカルモデルを瞬時に切り替えて動かすパワーがあるのか?」ということ。厳しいかもしれないけど、良い方向に裏切ってほしいな。
どこが「モンスター級」なのかさっぱり分からないな。メモリ帯域幅は300GB/sしかない。AMD Strix Halo(256GB/s)と大差ないし、128GBのRAMを積んだM5 Maxのメモリ帯域幅(614GB/s)の半分以下じゃないか。AI愛好家はメモリ帯域幅を重視するから強調してるんだろうけど、それにしてもね。あと、OSがWindowsっていうのもね。
価格がよほど高騰しない限り、ローカルLLMが広く普及する未来は見えないな。SonnetやKimiのような安価なホストモデルを使う方が理にかなっているし、ローカル環境でKimiクラスのモデルを動かすのは不可能だ。おもちゃじゃない実用的なエージェントタスクにはそれくらいの性能が必要だからね。月額20ドルのサブスクを避けるために5000ドルも払うなんて、ニッチなセキュリティ上の理由でもない限り納得できないよ。
これって、すでに購入可能で128GBのユニファイドメモリをサポートしているAMD Ryzen AI Maxみたいな製品と何が違うの?純粋に疑問なんだけど。
本筋とは関係ないけど、「Twitterか。随分と懐かしい名前を聞いたものだ」って気分だね。