論文まとめ(第1回):AudioGPTとTransformerのトークン数拡大
皆様、お元気ですか? 私が今いる時空間上の座標はGWの初めですが、窓の外は雨模様ですので、こうして記事をしたためています。
今週の話題は、大規模言語モデル(Large Language Models; LLMs)を音声情報を扱えるように拡張した"AudioGPT: Understanding and Generating Speech, Music, Sound, and Talking Head"と、Transormerの入力トークン数を大幅に増加させた"Scalin