AI Nest
コーポレートサイト: https://ainest.co.jp/
記事一覧
【論文瞬読】大規模言語モデルのファインチューニングが変わる?LoRAの可能性に迫る
こんにちは!株式会社AI Nestです。
今回は、大規模言語モデル(Large Language Models, LLMs)のファインチューニングに革新をもたらすLoRAという手法について、最新の技術レポートをもとにご紹介します。
LoRAとは?LoRA(Low Rank Adaptation)は、LLMsをファインチューニングする際に、学習するパラメーター数とメモリ使用量を削減しつつ、通常のフ
【論文瞬読】大規模言語モデルのプロンプト圧縮に革新をもたらす新手法 LLMLingua-2
こんにちは!株式会社AI Nestです。
近年、GPT-3やGPT-4に代表される大規模言語モデル(LLM)が自然言語処理の分野で大きな注目を集めています。LLMは膨大な言語データから学習することで、質問応答や要約、翻訳など、様々なタスクで高い性能を発揮します。しかし、その一方で、LLMへの入力として与えるプロンプトが長大になると、推論の高速化や低コスト化が課題となります。
そこで登場するのが、
【論文瞬読】Lottery Ticket仮説の新展開 - 事前学習を取り入れたStrong Lottery Ticket仮説
こんにちは!株式会社AI Nestです。
みなさん。今日は、ニューラルネットワークのプルーニング(剪定)に関する興味深い研究を紹介したいと思います。
Lottery Ticket仮説とは?Lottery Ticket仮説は、過学習したニューラルネットワークから、汎化性能の高いサブネットワークを見つけ出すための枠組みとして注目を集めています。中でも、"Strong Lottery Ticket H