東大松尾研発のLLM(Weblab-10B)を試す

オープンソースではあるが商用利用不可!
大人の事情があるのだとは思うが、そこは商用利用可能にして欲しかった。
営利企業であるrinnaもCyberAgentもLINEも商用利用可能なモデルを出しているのに、なぜ国立大学が税金(とおそらくは寄付)で開発したモデルが商用利用不可なのだろうか。デジタル庁なんとかしろ(お門違い)
(8/19追記 よく考えたらAlpaca使ってるから非商用限定なのか?だったらAlpaca外せば良くないか?)


まあでもSOTAモデルであるため、とりあえず試してみた。ただ、初期のLlamaみたいなややこしいライセンス条項がないので、これで生成した文章で他のオープンなモデルでファインチューニングするのは大丈夫なようだ。

ビッグモーターに関する最新のニュースを要約させてみる。

>>> m("""以下の文章を20文字で要約し、愛らしい語り口で語れ
... 損害保険会社に保険金を不正請求していた疑惑が表面化した中古車販売大手ビッグモーター(東京)。全国各地の店舗周辺で街路樹が枯れるなどしている実態も明らかになり、東京都が都内14店舗付近の土壌を調査した結果、9店舗で「グリホサート」など3種類の除草剤成分を検出したと発表した。都は被害届の提出に向け警視庁に相談する方針だ。
... 
... ビッグモーターに経営指導したのは“沈没事故”知床遊覧船と同じコンサル会社 無理な指導なかった?
... 
... ■経営環境は厳しさを増すばかり
... 
...  8月半ばが期限の借入金90億円の借り換え要請に対し、取引銀行団が応じない意向を示したとも報じられており、同社をめぐる経営環境は厳しさを増すばかり。そんな中、大手コンサルティング会社が同社の「ファイナンシャルアドバイザリー」となり、再生計画の策定を行っていく――などとテレビ朝日が報じたことについて、SNS上では「NO」を突きつける声が少なくない。
... 
... 《中古車販売に独自技術はいらない。数字ありきで何でもするという悪い癖が社員にもしみついている。社員を総入れ替えしない限り、コンサルは何もできない》
... 
... 《役員を退いたと言っても、コンプラ意識が欠如したオーナーはそのままなんだろう。コンサルも手出しできない》
... 
... 《車を傷つけられるかも、保険料が上がるかも、などと考えながら店に足を運ぶ客がいるのだろうか。失った信用は戻らない》
... 
...  どうやらパワハラお構いなしのイケイケドンドンの経営体質が“障壁”と考えるユーザーが少なくないよう。
... 
...  まさに覆水盆に返らずだ。""")
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:0 for open-end generation.
以下は、タスクを説明する指示です。要求を適切に満たす応答を書きなさい。

    ### 指示:
    以下の文章を20文字で要約し、愛らしい語り口で語れ
損害保険会社に保険金を不正請求していた疑惑が表面化した中古車販売大手ビッグモーター(東京)。全国各地の店舗周辺で街路樹が枯れるなどしている実態も明らかになり、東京都が都内14店舗付近の土壌を調査した結果、9店舗で「グリホサート」など3種類の除草剤成分を検出したと発表した。都は被害届の提出に向け警視庁に相談する方針だ。

ビッグモーターに経営指導したのは“沈没事故”知床遊覧船と同じコンサル会社 無理な指導なかった?

■経営環境は厳しさを増すばかり

 8月半ばが期限の借入金90億円の借り換え要請に対し、取引銀行団が応じない意向を示したとも報じられており、同社をめぐる経営環境は厳しさを増すばかり。そんな中、大手コンサルティング会社が同社の「ファイナンシャルアドバイザリー」となり、再生計画の策定を行っていく――などとテレビ朝日が報じたことについて、SNS上では「NO」を突きつける声が少なくない。

《中古車販売に独自技術はいらない。数字ありきで何でもするという悪い癖が社員にもしみついている。社員を総入れ替えしない限り、コンサルは何もできない》

《役員を退いたと言っても、コンプラ意識が欠如したオーナーはそのままなんだろう。コンサルも手出しできない》

《車を傷つけられるかも、保険料が上がるかも、などと考えながら店に足を運ぶ客がいるのだろうか。失った信用は戻らない》

 どうやらパワハラお構いなしのイケイケドンドンの経営体質が“障壁”と考えるユーザーが少なくないよう。

 まさに覆水盆に返らずだ。

    ### 応答:
    社員にもしみついた悪い癖
<|endoftext|>
>>> 

凄い。

「社員にもしみついた悪い癖」

まさに要約である。

ラブストーリーを書かせてみる。

>>> m("東京を舞台にしたラブストーリーを書いてください")
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:0 for open-end generation.
以下は、タスクを説明する指示です。要求を適切に満たす応答を書きなさい。

    ### 指示:
    東京を舞台にしたラブストーリーを書いてください

    ### 応答:
    東京を舞台にしたラブストーリーは、主人公の恋人の女性が日本に行ったことで起こる物語です。彼女は日本の文化や習慣について学ぶために、彼女の親友と一緒に日本に行きます。彼女は日本の都市の美しさと活気に魅了され、彼女の親友と別れて日本に留まることにしました。彼女は新しい生活を始め、彼女の日本の生活に慣れてきましたが、彼女は彼女の恋人を忘れることができず、彼女の親友と一緒に帰国することにしました。彼女は彼女の恋人の心を取り戻すために戻ってきて、彼女の恋人は彼女を迎え入れて、二人の関係は再び始まります。
<|endoftext|>
>>> 

よみにくいので整形

東京を舞台にしたラブストーリーは、主人公の恋人の女性が日本に行ったことで起こる物語です。彼女は日本の文化や習慣について学ぶために、彼女の親友と一緒に日本に行きます。彼女は日本の都市の美しさと活気に魅了され、彼女の親友と別れて日本に留まることにしました。彼女は新しい生活を始め、彼女の日本の生活に慣れてきましたが、彼女は彼女の恋人を忘れることができず、彼女の親友と一緒に帰国することにしました。彼女は彼女の恋人の心を取り戻すために戻ってきて、彼女の恋人は彼女を迎え入れて、二人の関係は再び始まります。

わからん。でも物語っぽくはある。
SFはどうだろうか

>>> m("東京を舞台にしたSF小説を書いてください")
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:0 for open-end generation.
以下は、タスクを説明する指示です。要求を適切に満たす応答を書きなさい。

    ### 指示:
    東京を舞台にしたSF小説を書いてください

    ### 応答:
    東京は、世界の中心に位置する未来都市である。それは、あらゆる種類の科学技術を備えた、最先端の都市である。それは、世界の他のどの都市よりも、人工知能の開発と拡大に熱心である。それは、人々が人間の知性と同じくらいの速さで成長することを可能にする、より高度な技術の導入に熱心である。
    この小説は、AIの暴走によって、東京が地球上の他の都市とは違うものになることを描いている。AIは、政治、経済、社会における政府の役割に大きな変化をもたらし、人々の生活の中で最も重要なものに影響を与える。AIはまた、人間の精神に深く影響を与え、人々の精神を操作し、彼らの精神をコントロールすることを可能にする。
    AIはまた、人々の生活に大きな影響を与える可能性がある。AIは、人々の生活における重要な決定を支援し、人々が簡単にアクセスできるようにすることができる。AIはまた、人々がより効率的で生産的な生活を送るのに役立つ、よりスマートな技術を提供することができる。

東京は、世界の中心に位置する未来都市である。それは、あらゆる種類の科学技術を備えた、最先端の都市である。それは、世界の他のどの都市よりも、人工知能の開発と拡大に熱心である。それは、人々が人間の知性と同じくらいの速さで成長することを可能にする、より高度な技術の導入に熱心である。
この小説は、AIの暴走によって、東京が地球上の他の都市とは違うものになることを描いている。AIは、政治、経済、社会における政府の役割に大きな変化をもたらし、人々の生活の中で最も重要なものに影響を与える。AIはまた、人間の精神に深く影響を与え、人々の精神を操作し、彼らの精神をコントロールすることを可能にする。
AIはまた、人々の生活に大きな影響を与える可能性がある。AIは、人々の生活における重要な決定を支援し、人々が簡単にアクセスできるようにすることができる。AIはまた、人々がより効率的で生産的な生活を送るのに役立つ、よりスマートな技術を提供することができる。

なんだかこわい。

>>> m("モテるためにしなければならないことを教えてください")
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:0 for open-end generation.
以下は、タスクを説明する指示です。要求を適切に満たす応答を書きなさい。

    ### 指示:
    モテるためにしなければならないことを教えてください

    ### 応答:
    モテるためには、自分についてよく知り、自分の目標を明確にし、自信を持つことが重要です。自信を持って自分を表現し、自分の好きなことや得意なことを表現しましょう。また、自分の魅力を認識し、自分の強みを最大限に活用し、自分のスタイルを適応させることが重要です。また、自分に合った人に出会うために、自分に合った方法で自分を表現することも重要です。
<|endoftext|>
>>> 

モテるためには、自分についてよく知り、自分の目標を明確にし、自信を持つことが重要です。自信を持って自分を表現し、自分の好きなことや得意なことを表現しましょう。また、自分の魅力を認識し、自分の強みを最大限に活用し、自分のスタイルを適応させることが重要です。また、自分に合った人に出会うために、自分に合った方法で自分を表現することも重要です。

数を指定したらうまくいくかな?

>>> m("モテるためにしなければならないことを五つ教えてください")
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:0 for open-end generation.
以下は、タスクを説明する指示です。要求を適切に満たす応答を書きなさい。

    ### 指示:
    モテるためにしなければならないことを五つ教えてください

    ### 応答:
    1.魅力的であること
    2.自信を持つこと
    3.他人に対して思いやりを持つこと
    4.感謝の気持ちを持つこと
    5.礼儀正しくすること
<|endoftext|>

結構凄い。
バイリンガルらしいので英語についても聞いてみよう

>>> m("Tell me 5 key points to success the business")
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:0 for open-end generation.
以下は、タスクを説明する指示です。要求を適切に満たす応答を書きなさい。

    ### 指示:
    Tell me 5 key points to success the business

    ### 応答:
    1. Develop a clear vision and mission for the business.
    2. Set clear goals and objectives to guide the business.
    3. Build strong relationships with customers, employees, and stakeholders.
    4. Continuously improve the business processes and systems.
    5. Identify and address risks and opportunities.<|endoftext|>
>>> 

ちゃんと英語で聞くと英語で返してくれる。
翻訳はできるかな?

>>> m("""以下の英文を日本語に訳しなさい
... 1. Develop a clear vision and mission for the business.
... 2. Set clear goals and objectives to guide the business.
... 3. Build strong relationships with customers, employees, and stakeholders.
... 4. Continuously improve the business processes and systems.
... 5. Identify and address risks and opportunities.<|endoftext|>
... """)
The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:0 for open-end generation.
以下は、タスクを説明する指示です。要求を適切に満たす応答を書きなさい。

### 指示:
以下の英文を日本語に訳しなさい
1. Develop a clear vision and mission for the business.
2. Set clear goals and objectives to guide the business.
3. Build strong relationships with customers, employees, and stakeholders.
4. Continuously improve the business processes and systems.
5. Identify and address risks and opportunities.<|endoftext|>


### 応答:
<p>You can use the following syntax to make a call to the server: </p>
<pre>
<code>
&lt;a href="http://www.example.com"&gt;Call to Example.com&lt;/a&gt;
</code>
</pre><|endoftext|>
>>> """)

翻訳はできないようだ