Google Colab で Cerebras-GPT を試す
「Google Colab」で「Cerebras-GPT」を試したので、まとめました。
1. Cerebras-GPT
「Cerebras-GPT」は、OpenAIのGPT-3をベースにChinchilla方式で学習したモデルになります。学習時間が短く、学習コストが低く、消費電力が少ないのが特徴とのことです。
2. Colabでの実行
Google Colabでの実行手順は、次のとおりです。
(1) 新規のColabのノートブックを開き、メニュー「編集 → ノートブックの設定」で「GPU」の「プレミアム」を選択。
(2) パッケージのインストール。
# パッケージのインストール
!pip install transformers
(3) トークナイザーとモデルの準備。
今回は、一番大きい「13B」を指定しました。
from transformers import AutoTokenizer, AutoModelForCausalLM
# トークナイザーとモデルの準備
tokenizer = AutoTokenizer.from_pretrained("cerebras/Cerebras-GPT-13B")
model = AutoModelForCausalLM.from_pretrained("cerebras/Cerebras-GPT-13B")
(4) パイプラインの準備。
from transformers import pipeline
# パイプラインの準備
pipe = pipeline("text-generation", model=model, tokenizer=tokenizer)
(5) 日本語で質問応答。
日本語はあまりうまく回答できませんでした。処理時間はCPUのみで1推論30〜40秒ほどでした。
# 日本語で質問応答
text="日本で一番人気のアニメは?"
generated_text = pipe(text, max_length=50, do_sample=False, no_repeat_ngram_size=2)[0]
print(generated_text['generated_text'])
日本で一番人気のアニメは?tᄊ﹀︀(※)
そして、おふ�
(6) 英語で質問応答。
英語では自然な回答 (正確性は別として) が返ってきました。
# 英語で質問応答
text="What is the most popular anime in Japan?"
generated_text = pipe(text, max_length=50, do_sample=False, no_repeat_ngram_size=2)[0]
print(generated_text['generated_text'])
The most watched anime is "Gintama" (Gin Tama). It is a comedy anime that is based on the manga of the same name. It was created by the studio "
この記事が気に入ったらサポートをしてみませんか?