LINEの最新LLM(japanese-large-lm-3.6b)を使ってみた【Colab Notebook付き】

福田渉 | 日本テクノトレード CEO

2023年8月18日 21:10

こんにちは、福田です。

今回はLINEから発表された最新LLMのJapanese-large-lm-3.6bを試しに動かして遊んでみます。

Hugging Face

こちらがリソースになります。

日本語で記述されているLINE公式Techブログもあるので気になる方は一読をお勧めします。

公式Techブログがおすすめ

単なる説明だけでなく、大規模言語モデル学習Tips(パラメータの初期値・Adamのハイパーパラメータ・Cosineスケジューラなど)も紹介されているのでLLM入門者には参考になるかと思われます。

遊んでみる

まずは必要なライブラリをインストールします。

!pip install transformers xformers sentencepiece -q

公式ではseedをセットしていましたが、今回は行いません。

import torch
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline

モデル作成とトークナイザーの設定

高速化トークナイザーに対応していないようなのでuse_fast=Falseとすること

model = AutoModelForCausalLM.from_pretrained("line-corporation/japanese-large-lm-3.6b", torch_dtype=torch.float16)

tokenizer = AutoTokenizer.from_pretrained("line-corporation/japanese-large-lm-3.6b", use_fast=False)

generator = pipeline("text-generation", model=model, tokenizer=tokenizer, device=0)

それでは実際に推論します。 max_lengthについて、hugging faceでは30になっていましたが、もう少し長い文章で比較したかったので150にしておきました。

text = generator(
    "「アルジャーノンに花束を」を読んで、",
    max_length=150,
    do_sample=True,
    pad_token_id=tokenizer.pad_token_id,
    num_return_sequences=5,
)

for t in text:
  print(t)

入力: "「アルジャーノンに花束を」を読んで、"

出力①: 「アルジャーノンに花束を」を読んで、こんな感想を持っています。読書感想文中3 ネタバレ有「アルジャーノンに花束を」あらすじと感想。

出力②:「アルジャーノンに花束を」を読んで、初めて「知能」という言葉を知った時との共通項を発見しました。それ以来の感動です。今日は、この詩を読んで涙ぐみました。「涙の泉」というタイトルも、この詩から付けました。また、ある人は、「この詩を読んだ人の多くは、「この詩は、現実は、こんなものだ...と言っている詩のように読める。けれど、そうではない。

出力③:「アルジャーノンに花束を」を読んで、主人公は、「人は、どうして生まれてきたのだろうか?」「何のために、生きているのだろうか?」と、哲学者のように悩んだに違いない。しかし、彼は、苦悩から解放され、ハッピーエンドで終わる。さて、あなたは今、「人は、どうして生まれてきたのだろうか?」「何のために、生きているのだろうか?」と、考え続けているだろうか。 100% 、自分の意志だけで行動し続けているだろうか。また、「何のために、生きているのだろうか?」と、考えてみても、ピンとくる答が浮かんでこなかったら、 100% すべて自分の意志だけで行動できているだろうか。たぶん、行動に制約が掛かっていると思う。そして、自分では

出力④:「アルジャーノンに花束を」を読んで、とても感動しました。「アルジャーノンに花束を」のように素敵な人に、私もなりたいです。読書感想文を書くにあたって、参考にしたいので、ぜひ感想を聞かせてください。お願いします(T^T) 共感した 0 閲覧数:518 回答数:3 お礼: 50枚違反報告ベストアンサーに選ばれた回答 sor********さん 2012/7/14 21:14:46 感想文としては、素晴らしいものだったと思います。「アルジャーノンに花束を」は、読んだことがないのですが、作品から感じとった感動や、尊敬・畏敬の気持ち、そして、「もっと頑張らなくては」と言う気持ちを前面に出して書けばよいと思います。

出力⑤: 「アルジャーノンに花束を」を読んで、これは絶対読まないだろうと言っていた。その私が読んでいるのだ。脳に障害を抱える人の物語...しかし、そこにはいつも、障害のない人への温かいまなざしがあった。障害を抱えた人への優しいまなざしと周囲の人達への温かいまなざし... 障害への偏見や差別に対して批判しつつも、主人公の淳や、その家族たちがお互いを思い合う姿には、心を打たれた。ラストで淳が言った「本当に大切なものは目に見えないんだよ」と... そうだよな~と、思う。障害を抱えても、その家族が温かく優しく生きていく... 障害を抱えても、それを乗り越え生きていく淳の父親に、いつも敬服します。

学習リソースがわかるところ(出力④あたり)がまた面白いところです。

また他の文章も幾つか試してみましたが、日本語的な違和感を一部感じる部分があります。ただ、個人的には従来と比較しても着実に質は上がってきているなと感じます。
これからの日系企業発の言語モデルの発展が楽しみです。

最後まで読んでいただきありがとうございました。
みなさんもぜひ手を動かして遊んでみてください。

この記事が気に入ったらサポートをしてみませんか？