ディスカッション (11件)
Intel Arc Pro B70のレビューです。現時点では詳細なベンチマークや実機テストの結果が待たれるところですが、クリエイティブワークフローやワークステーション用途において、この新しいGPUがどれほどのパフォーマンスを発揮するのか注目が集まっています。
VRAM目当てで1枚欲しいけど、最初の在庫が切れたらもう手に入らないだろうな。RAMの価格が上がる前に生産されたやつだろうし。
AIカードってゲーミングにも使えるの?それとも市場や製品ラインを分けるために、メーカー側がわざと性能を制限してる感じ?
IntelってまだGPU作ってたんだ。市場に残るのか撤退するのか、相反する情報ばかり聞こえてきてよく分からないんだけど。
Mac StudioのM3 Ultraを使ってて痛感したんだけど、Time to first token(最初のトークン生成までの時間)ってパフォーマンス指標としてめちゃくちゃ重要だよな(M3 Ultraは結構遅いし)。ただ、TDP 230Wで32GBっていうのは正直そこまで魅力的じゃないかも。複数枚積みたくなるだろうし、そうなると排熱がすごいことになりそう。暖房代わりに使えるとは言え、ヒートポンプの方が効率いいしね。
llama.cppのベンチマーク結果を置いておくね:https://www.phoronix.com/review/intel-arc-pro-b70-linux/3
Blenderユーザー向けに記事内のBlenderセクションを引用すると、「GPUレンダリングにおいてNVIDIA以外の現実的な選択肢が増えることを望む。現状、競合がほぼ存在しない分野だからだ」とのこと。実際、opendata.blender.orgを見ると、NVIDIA GeForce RTX 4080 Laptop GPUが5301.8点なのに対して、Intel Arc Pro B70は3824.64点。Intel GPUがNVIDIAに肩を並べるまでには、まだもう一歩というところかな。
LLM用にどうかなと思って調べてたけど、これ完全にグラフィック処理向けのカードだね。メモリ帯域が狭すぎて、LLM用途でこの容量を活かすのは厳しそう。手持ちの5090と同じメモリ量だけど、帯域幅が全然違うから、やっぱり5090の方が断然使い勝手がいい。
同じ品質を得るためにメモリと演算性能をどう割り振るか、DenseモデルとMoEモデルの間にはトレードオフがあるよね。例えばQwen3.5 27BとQwen3.5 122B A10Bは、ベンチマーク上の平均性能は同等。122Bの方が計算コストあたりのトークン生成数が多いから圧倒的に速い。一方で27Bは、低コンテキスト長ならVRAM消費が約4分の1で済む(高コンテキスト長だと差は縮まるけど)。今のところ、ハードウェアによって得意なバランスが分かれてる感じ。片極端にはDGX SparkやStrix Haloみたいに、演算性能や帯域に対してメモリが豊富なモデルで、これはMoEワークフローに最適。もう一方の極端にはRTX 5090みたいに、コスパは最強だけどメモリは少なめで、Denseモデルに最適。Arc Pro B70はそのどっちつかずな中間ってところか。1〜2枚あれば30BクラスのDenseモデルを動かせるけど、インタラクティブに使うには重すぎて厳しいかな(それなら5090か3090×2枚が必須)。かといってMoEを動かすには、エージェント的なワークフローをこなすための品質を確保するのが難しそう。
デコード処理は帯域幅(BW)に依存するっていう単純な理解だったんだけど、B70が4090よりデコードが速いっていう結果(帯域幅は4090の方が5割増しなのに)を見ると、知識をどうアップデートすべきなんだろう?
AIやゲームで使ってない時は、VRAMを余剰なスワップ領域として使うのもアリだよね。32GBあれば普通のPCのメインメモリより多いし、OSを丸ごと載せることだってできるし:https://www.tomshardware.com/news/lightweight-windows-11-runs-entirely-in-gpus-vram