OpenAIによる今回のアップデートがなぜ私たち開発者たちの間で「神アップデート」と呼ばれているか解説!!
OpenAIによる今回のアップデートがなぜ私たち開発者たちの間で「神アップデート」と呼ばれているかを解説する。人間とコンピュータのインターフェースに起こりつつある大きな変化を加速するアップデートだからだ。
出たばかりのコンピュータは、キーボードからコマンドを打たなければならず( CUI (Character-based User Interface))、とても使いづらかった。CP/MとかMS-DOSの時代だ。
それを誰にでも使えるGraphical User Interface(GUI)に進化させたのがMacintoshであり、Windowsだ。パソコンが爆発的に普及したのは、GUIによるところが大きい。
スマホの時代になっても、それは変わりがなかった。しかし、研究者たちは、その次に来たるべきは自然言語によるインターフェースであることは知っていた。話しかけるだけで指示に従ってくれる人工知能だ。
音声認識の技術の進歩により、音声インターフェースを持つハードやアプリが誕生した。アマゾンのAlexaやアップルのSiriだ。でもそれらは僕らが望む人工知能とは程遠いものだった。
2020になって発表されたGPT3は、多くの専門家すらも驚かせた。単なる「言語モデル」があたかも知識を持つかの様に振る舞い始めたのだ。
今注目を集めているChatGPはそのGPT3の上に作られているがチャットボットだが、これはGPT3が(正確には大規模言語モデルが)世の中にもたらす価値の、最初の一歩でしかない。
次に起きるのは、GPT3の様な大規模言語モデルを活用したマンマシンインターフェイスの次のフェーズ、Natural Language User Interface (NLUI)の時代だ。
人間に話しかける様に普通に話しかければ、コンピュータがそれに従って仕事をしてくれる時代が来るのだ。今回のアップデートにはそれを可能にする仕掛けが入っているのだ。
「今日は8時ぐらいに帰るから、帰ったらすぐに風呂に入れる様にしておいて。」「東京駅までなるはやで。」「6月に入ってから売れ行きが好調な商品は何?」みたいな質問に、コンピュータが答えてくれる時代が来るのだ。
試しに、GPTの"Function calling"がどのくらい使えるものか、ホーム・オートメーション・システムのフロントエンドを作ってみたところ、とても良い感じで動くので感動している。私とシステムの会話から、APIへの流れを紹介します。
私: キッチンの電気を付けて
{
"name": "control_light",
"arguments": {
"location": "kitchen",
"switch": "on"
}
}
私: 今日は夜8時に帰ります
GPT: すみませんが、その情報をどのように使用すべきか具体的に教えていただけますか?
私: すぐにお風呂に入りたい
{
"name": "fill_bath",
"arguments": {
"at": "20:00"
}
}
私: ネコのタマが今、何しているか確認したい。
GPT: すみませんが、どのカメラを使用して確認しますか?
私: キッチンにいるはず。
{
"name": "take_picture",
"arguments": {
"camera": "kitchen"
}
}
私: 音楽をかけて
GPT: もちろんですが、どの部屋で音楽を再生しますか? また、特定のアーティスト、曲、またはプレイリストがありますか?
私: リビング でビートルズを
{
"name": "play_music",
"arguments": {
"location": "living room",
"music": "The Beatles"
}
}
GPT3/4の"function call"を活用すると、こんなNLUI(Natural Language UI)が簡単に実装できてしまいます。
実際にどんなコードを書いたかについては、メルマガで紹介しています。初月は無料なので、是非ともお試しを。
※下記のコードを参考に組み合わせて、あなただけのアプリ等
作ってみてください。https://github.com/snakajima/SlashGPT/blob/main/resources/home.json
https://github.com/snakajima/SlashGPT/blob/main/prompts/home2.json
この記事が気に入ったらサポートをしてみませんか?