Tritonの紹介 - ニューラルネットワークのためのGPUプログラミング
以下の記事を参考にして書いてます。
・Introducing Triton: Open-Source GPU Programming for Neural Networks
1. はじめに「Triton 1.0」は、オープンソースのPythonライクなプログラミング言語で、CUDAの経験がない研究者でも、多くの場合、専門家と同等の高効率なGPUコードを書くことができます。
例えば、多くのGPUプログラマができないcuBLASの性能に匹敵するFP16行列乗算カーネルを、2