HN🔥 55
💬 9
今さら聞けない!機械学習システムのためのモダンGPUプログラミング入門
crowwork
4日前
機械学習システム(MLSys)のパフォーマンスを最大化するために不可欠な、モダンGPUプログラミングの基礎とトレンドを解説します。ハードウェアの進化に追従し、効率的なモデル実装を行うためのベストプラクティスを網羅的にまとめました。
「Modern [NVIDIA GPU] Programming for...」ってあるけど、「Pipelining GEMM with TMA」以降の内容は完全にNVIDIA専用だね。別にそれでもいいんだけど、ガイドのタイトルが明らかにミスリーディングだよ。
すごく良さそう。独学で使えるように、練習問題(と解答)もセットでついてると最高なんだけどな。
フレームワークが乱立してるね。MLプログラミング分野における、WebでいうReactやCSSでいうTailwindみたいな、現在の「定番」って何があるんだろ?Triton、ONNX、JAX、PyTorch、cublass...とか色々あるけど、それぞれ何のためのものなのか、いつ使うべきなのかっていう指針があると助かる。