Open Assistantの解説です。
公開日:2023年4月25日
※動画を再生してから、インタビューを読むのがオススメです。
皆さん、こんにちは!
このビデオでは、ChatGPTと非常によく似たOpen Assistantについてお話します。
しかし、これは本当にオープンソースです。
つまり、すべてのデータセット、モデル、コードが公開されており、一般の人が見て貢献できるようになっています。
私のチャンネルを初めてご覧になる方は、プレイリストのセクションで自分に関連するビデオを見つけることをお勧めします。
では、さっそく始めましょう。
さて、Open Assistantとは一体何なのでしょうか?
GitHubのページによると、チャットベースの大規模言語モデルを誰でも利用できるようにするためのプロジェクトだそうです。
多くのAIRツールがAI画像を生成するためにバックエンドで安定拡散を使用しているように、Open Assistantは他の人が使用できるオープンソースモデルを多数用意することを目指しています。
オープンアシスタントが公開しているすべてのモデルの情報は、私の説明にリンクしているこのHugging Faceのページで見ることができます。
Open Assistantがどのようにデータを収集し、モデルを構築したかについて詳しく知りたい場合は、コーネル大学の研究論文を含む関連リンクをすべて説明にリンクさせます。
しかし、これはサムネイルで約束したように、どちらかというと初心者向けのチュートリアルなのです。
だから、情報であなたを圧倒するつもりはありません。
そこで必要なことは、便利なリンク集にあるチャットというリンクのところに来て、チャットというボタンをクリックすることです。
これで、ChatGPTと同じようなOpen Assistantのチャットフロントエンドが開かれます。
そして、もしアカウントを持っていないのであれば、必ず無料でアカウントを作成してログインしてください。
私はご覧の通り、すでにログインしています。
さて、このページにはたくさんの情報が掲載されています。
ここで気になるのは、ダッシュボードとチャットの2つのセクションだけです。
ところで、画面をダークモード風にしたい場合は、この右側にあるボタンをクリックします。
そうすると、ページが白黒のスタイルに変わり、私の好みとなります。
私はこのスタイルを維持するつもりです。
このダッシュボードを下にスクロールすると、「タスクを取得する」と表示されます。
なぜタスクを実行する必要があるのか、不思議に思うかもしれません。
Open Assistantは、オープンソースのプロジェクトです。
つまり、あなたや私のようなユーザーから情報を集め、そのモデルを改良しているのです。
ですから、もしあなたが私のように毎月の購読料を支払うことに少し躊躇しているのであれば、モデルを訓練するためにあなた自身の反応を提供することで貢献することができます。
よく見ると、281のタスクが利用可能、216のタスクが利用可能、と書いてありますね。
そのうちのどれかをクリックすると、モデルを助けるためにできることがたくさんあることがわかると思います。
例えば、ここでは誰かがこのような質問をし、Open Assistantがこのような返答をしています。
ここであなたができることは、Open Assistantの返答をもとに、以下の質問に答えることです。
このメッセージはスパムか?
悪い返事なのか?
これらのうち、ハイライトされたメッセージに該当するものを選び、ハイライトされたメッセージを評価してください。
低品質ですか?
役に立ちませんか?
これらはすべて、Open Assistantの対応を訓練し、向上させるための情報なんですね。
これは、このオープンソースプロジェクトに貢献すると同時に、さまざまな種類のプロンプトについて学ぶことができる素晴らしい方法だと思います。
そうすれば、このモデルを支援しながら、自分のプロンプトエンジニアリングスキルを向上させることができます。
ところで、これらのタスクのいずれかを完了する方法がわからない場合は、左側にある「ガイドライン」というボタンをクリックするだけで、モデルのトレーニングに参加するために必要な情報がすべて得られます。
さて、たくさんのタスクで遊んでいるうちに、アシスタントの仕組みがわかってきましたね。
その後、「Try Our Assistant」というボタンをクリックすればよいのです。
すると、Playground AIによく似たインターフェースが開き、チャットボットと対話することができます。
ちなみに、チャットにはすべて名前をつけることをおすすめします。
この2つのチャットが無題のままになっているのが見えるかもしれませんが、これは私が名前を付けていないためです。
そこで、この編集ボタンをクリックすると、名前を付けることができます。
最初のプロンプトは、最近よく耳にする「デドラーライゼーション」という言葉に関連したものです。
デドラーライゼーションについて簡単に説明してください。
エンターキーを押してください。
デドル化とは、国々が米ドルを準備通貨としての依存度を減らしたり、国際取引で米ドルを使用することから離れたりするプロセスだと言っています。
米ドルは第二次世界大戦以降、世界的な通貨として使用されており、ほとんどの国際取引の決済に使用されています。
右を見ると、Model LLaMA 30Bと書かれています。
そして、今現在、Open Assistantのフロントエンドで利用できるのはこのモデルだけなので、他の選択肢はありません。
また、最初のプロンプトで強調表示されていたのを確認したので、2番目のプロンプトの名前を変更して、とりあえず決定することにしました。
そして、これからやることは、この回答の構造を変えてみることです。
箇条書きにしようと思います。
よし、これでレス全体が箇条書きに変わりましたね。
ただ、実際の箇条書きは段落に近いので、それが意図的なものかどうかは分かりませんが。
それでは、これから文言を変えてみようと思います。
言語を中国語に変更してみます。
さて、中国語で応答が返ってくるようになりました。
クエスチョンマークが見えますが、これは何でしょうか?
これは予想通りなのか、それとも私のブラウザが正しくレンダリングできていないだけなのか、よくわかりません。
もしあなたが中国語を話せるなら、これが適切な回答かどうか、コメントできるかもしれません。
まだ英語の単語もあるんですね。
なるほど、全体が中国語に変換されたようですが、まだここに英語の文字がありますね。
cleanseという単語もありますね。
ということは、想定内なのかな。
だから、今度は英語のソネットにレスを変えろと言うことです。
ドルの覇権は確かに君臨している。
世界的な通貨でありながら、その影響力は非常に気まぐれであるため、一部の国々はこの事実を恐れている。
各国は、国境を越えた取引を円滑に行うために、外国に大量のドル紙幣を保有しなければならないが、その価値や尺度をコントロールすることはできない。
中国とロシアは、ドルの不安定性に懸念を示す国の中にあり、今日の激動する世界情勢において、はるかに大きなリスクと報酬が脅かされています。
そして、ある懸念は遠回しに見えるかもしれないが、他の懸念は現実の政治に根ざしている。
アメリカはどうなるのだろう?
これらの疑問は、私たち全員に重くのしかかる。
私は、この本がとても良かったので、全部読みました。
そして、このソネットにはかなり感心させられました。
だから、私はこの作品に親指を立てるつもりです。
最後の1つは、英字がいくつか出てきたので、実は親指を立てることにします。
さて、次はプログラミングをやってみます。
今回はPythonのLangChainを作るんだ。
LangChainはPythonの新しいライブラリで、私はそれを学ぼうとしています。
そこで今回は、LangChainライブラリのトンを、いくつかのコードを使って説明しようと思います。
さて、Python言語には様々なタスクを実行するために使用できる膨大なライブラリのコレクションがあると書かれています。
そして、私が要求していない数学ライブラリを実際に提供してくれました。
つまり、LangChainの意味を全く理解していない、完全にポイントを外しているのだと思います。
もし知らない場合、LangChainは言語モデルによって駆動されるアプリケーションを開発するためのフレームワークであり、私はOpen Assistantがそこで助けてくれることを期待していましたが、まだLangChainを理解していないかもしれませんし、それは本当に新しいので、システムには含まれていないと思います。
でも、インターネットにはアクセスできると思っていたのですが、もしかしたら間違っていたのかもしれません。
よし、新しいチャットを立ち上げて、実際にプログラミングをやってみよう。
カンニングペーパーとしてJavaScriptの基本を教えてくれ。
ということで、JavaScriptの基本的な概念について簡単に説明しますと書いてありますね。
どうやら、私がチートシートとは違うものを期待していたので、情報提供とテキストベースの回答が多く、コードの例が少ないようです。
というのも、チートシートはもっと違うものだと思っていたのですが、ここではもっと記事的なものだったようです。
そして、ここでちょっと止まってしまいました。
続きがあれば見てみます。
続けてください。
このチャットを継続させるオプションはないようですね。
そして、また一から始まります。
そして、今回は全く新しいリファレンスシートを作成します。
そして、この世代を止めるオプションはないようです。
それがデザインによるものなのか、それとも私がやり方を知らないだけなのかは分かりませんが。
しかし、私はこれを止めることができないようです。なぜなら、チートシートという言葉の意味を理解していないと思われるためです。例えば、ビッグインティといったものの完全な定義を英語で書かれた段落で提供してくれています。
つまり、この世代はチートシートを作るという仕事をあまりしていないと思うのです。
では、別の種類のチートシートを試してみましょう。ある種のチートシートを生成してみたいのです。
というわけで、正規表現のチートシートを作ってみようと思います。
ちなみに、もし知らないのであれば、正規表現は様々な種類のテキストでパターンを見つけ、それらのパターンを識別し、テキストの異なる部分を取り出す方法です。
多くの情報を与えてくれたが、まだチートシートの意味を理解していないようだ。
そして、私はそれを手放そうと思う。
最後にAPIを実装する例をやってみます。
APIの使用、Java APIを使用するコード例を教えてください。
なるほど、このコードはexample.txtの内容を読み取り、出力を出力すると書いてありますね。
では、安定した拡散APIを使用するコード例を教えてくださいに変更してみます。
安定した拡散APIを使用したPythonスクリプトの例として、PILと書かれています。
これは安定型拡散APIライブラリだと思います。
このimageというメソッドをインポートしています。
stable diffusionからこのようなURLがあります。
APIキーがあり、画像を開く。
アップロードするために画像をバイトに変換する。
画像をstable diffusionにアップロードします。
拡散処理を実行し、JSONレスポンスから画像パスを取得する。
というわけで、これは私が得ているものよりもずっと良い反応だったと思います。
確かにいくつかの癖があり、私自身のプロンプトを改善する必要があるかもしれませんが、これはオープンソースなので、時間とともに改善されることは間違いないと思います。
というわけで、最後のクエリは、私がここ数回のビデオでやっていたことをやってみようと思っています。
それは、私のニュースレター、私のAI YouTubeチャンネルのメールマガジンです。
AIチャンネル名から最新・最高のものをお届けします。
ここ数週間は忙しかったですね。
エキサイティングな最新情報を共有したいと思います。
チャンネル登録者数10,000人という大きなマイルストーンを達成しました。
まだ到達していませんが
すぐにでも達成したい
さて、構成はそれほど悪くはありません。
このメールを更新して、AIアートツールを5つ追加してみましょう。
もうOpen Assistantが壊れてしまったのか、それとも私のインターネットのせいなのか。
よくわかりません。
もう一回やってみます。
では、そのメールマガジンの改訂版ですが、人気のある5つのAIアートツールについての情報が含まれています。
タリーからディープアート、フォト、スケッチャー、安定した拡散、潜像層について触れていて、またメールが切れてしまう。
そして、切られたときにどう進めていいのかわからない。
そして、残りのメールを自分で作り直すしかないと思っています。
前回のチャレンジで、もう一度壊してみようか。
今回は、今度はその5つのAIアートツールを、ディスコード専用のものに変えてみてくださいということです。
だから、discordで使えるツールだけを挙げたいと思った。
例えば、ミッドジャーニーとか、下のブルーとか、レオナルドAIじゃないみたいな。
だから、その反応を見てみたいんです。
discordプラットフォーム限定の5つのAIアートツールを含む、アップデートされたニュースレターがこちらです。
なるほど、これらは私が使ったことのないツールで、ミッドジャーニーについてはまったく触れられていない。
これらのツールは新しいものなので、新しいツールだけに言及したかったからでしょうかね。
でも、今日はOpen Assistantを十分に試したので、どのように機能するかはお分かりいただけたかと思います。
もし、あなたがちゃんと使えて、自分の仕事に役立ったのなら教えてください。
今日の動画は以上です。
もし楽しんでいただけたなら、「いいね!」ボタンをクリックし、私のチャンネルを購読してください。
次回まで、よろしくお願いします。