[備忘録]ChatGPT・AIで役に立ちそうな記事
(表紙はFirely(beta)が作りました)
これってどうやるんだったっけ?という時にお世話になりっぱなしのChatGPT。検索で無駄にする時間が減り余計な広告にも煩わされず大変重宝してます。
が、つぎつぎのAI関連のハックが公開されていて、実務もあるので試しきれません。というかほとんど触れてないです😥
そいうことで、見つけた記事などはここにメモすることにしました。時々追記したり、古いのは消しますのでご了承ください。
最新・画像認識
ChatGPT とエクセル
英語の記事なんですけども、翻訳するとこんな感じでお役立ち情報が満載。
こちらの記事もなかなかです
「Microsoft はまもなく ChatGPT を Excel に統合する予定ですが、Microsoft Copilot 365 に注目する必要がある理由を説明します。」
※こういう記事で英語のやり取りを画像として貼ってある場合、Bingなどを使うと文字起こしをしてくれますので、簡単に翻訳が可能です。
コーディング補助
Stable Code
画像生成AI「Stable Diffusion」の開発などで知られるAI開発企業Stability Aが発表したAIサービスで、学習データにはPythonやGo、Java、Javascript、C言語など多様なプログラミング言語が含まれているということでこの分野の競争も加速しそうです。
MEAT の Code LLaMA (無料)
Code Llama は、 Llama 2に基づくコードの大規模言語モデル ファミリです。オープン モデル間で最先端のパフォーマンス、埋め込み機能、大規模な入力コンテキストのサポート、プログラミング タスクのゼロショット命令追従機能を提供します。幅広いアプリケーションをカバーするための複数のフレーバーを提供しています。
テスト利用環境
git
Python in Excel
「PY関数(=PY)」を入力するとPythonのコードが記述できます。
Microsoft 365 Insider Programに参加していれば利用可能。
Flowise
UI をドラッグ アンド ドロップして、カスタマイズされた LLM フローを構築します
・LangChain搭載
・アプリテンプレート付き
・クラウドへの簡単連携
MerlinでもうChatGPT課金はする必要なし?
残念ながら課金をしないと回数制限があるため、利用は限定的になりますが「ここはChatGPT4で聞いてみたい」というときには便利です。
ただし日本語入力でリターンキーを押すと入力途中でも送信されるため、元祖ChatGPTで質問したものをコピペしてChatGPT4でも聞き直す、というくらいの使い方ならば無料範囲である程度使えそうです。
Merlin以外でも同じとは思いますが、extensions機能などでブラウザ横にAIがいて検索したことを横で評価してくれるのはセカンドオピニオン機能として最高に便利です。検索結果は多くが広告やそれに近いブログなど「人目を引く」ものが上に出てきますが正しいものが先に表示されるとは限らないどころか、最近ではスクロールして下の方まで見ないと、というご時世だからです。
個性ある自分用のchat botが作れるダンテAI
アカウント作成後、データをアップロードして自分用のAIにカスタマイズが出来ます。生成したチャットボットを人に共有したりWebに埋め込んだり出来るのがこのサービスの大きな利用価値になっています。
※2ヶ月無料、$100/$600プランということで企業向け
→PDF、Word ドキュメント、Excel シートなど、AI フレンドについて語るドキュメントをアップロードして
→システム ベース プロンプトを変更して、独自の個性を与えます。
→魅力的なアバターであなたの AI 友達に命を吹き込みましょう!
→そして、特別感を出すために、ダンテのブランドを削除
AIで音声合成↔文字
Mubert-Text-to-Music
プロンプトから楽曲生成してくれます。これを待っていました!
・プロンプトベースの音楽生成が可能に
・音楽ジャンル・楽器・ムードなどジャンルも指定可能
これから音楽生成はドンドン進化が加速するような気がします。動画を作る時に著作権や曲探しで頭が痛い人も多いと思うので朗報ではないでしょうか
PlayHT
文字から音声を生成してくれるサービスです。日本語ではVOICEVOXなどがありますがこちらはオンラインで使えるサービスです。
ビジネスユースケース
1. ビデオ用の新しい音声
2. 学習ビデオを生成する
3. カスタマー サービス支援に使用する API
4. IVR での音声対話
5. ウェブサイト上の SEO に適したオーディオ ウィジェット
notta
Nottaは高精度の音声認識とAI要約機能を使って、1時間の音声を5分で文字起こしし、簡潔な要約を作成することができます。
実際に動画(スティーブ・ジョブズの談話)をnottaで英語文字起こしをして、それを日本語にする、という作業を試したところあっという間に出来ました。
音声を直接理解し、それに対応する手法の論文
https://arxiv.org/pdf/2307.11795.pdf
Metaとケンブリッジ大の研究者らにより出された論文です。進歩が止まりませんね!
Microsoft Designer (マイクロソフトデザイナー)
CanvaみたいなWebアプリですがAI機能が無料で使えるCanvaキラーというお話です
これからはデザインもプロンプトでチャットボットと相談しながら素材を選んではめ込んだりが多くなるのかもしれません。
画像をAIでサイズ補完 PromeAI
Bing art creator などで生成した画像が正方形で、横長にしたいけど上下を着ると顔が切れてしまう!とかありませんか?そんな時に便利なのでPromeAIです。
こんな感じで足りない部分をAIが追加してくれます。これは便利!
CanvaがChatGPTに対応
TikTok または YouTube ショートを作成する
広告クリエイティブの生成
プレゼンテーションを作成
ロゴデザイン
ソーシャル バナーをデザイン
グッズデザイン
ソーシャルメディアへの投稿
↓に動画があるのでわかりやすです
FacebookのMetaがLlama2リリース!
7/18にMetaがリリースした最先端のオープンアクセス大規模言語モデル ファミリでChatGPT と同等のパフォーマンスを達成している、としています。
Metaが以前に発表したC++製のDeep Learning (Flashlightのより前に発表されたもの)はpythonの同じものに比べて数百倍も早くメモリも使わなかったので期待してしまいます。
サイトにはデモがあり、日本語も対応しています。(ただし英語に自動変換され、英語の返答が自動で日本語に翻訳されるので微妙にニュアンスが変わることがあります、以下は例。Forest color は英語で通じても日本語で森色は日本語には馴染みません)
「クローズドソースのチャットボットに代わるオープンな代替手段を待っていたなら、おそらく Llama 2-Chat が最良の選択となるでしょう。」
PEFTによる微調整
「Llama 2 7B を微調整するためのコマンド例をtimdettmers/openassistant-guanaco以下に示します。safetensorスクリプトは、引数を指定することで、LoRA の重みをモデルの重みにマージし、重みとして保存できます。
テキスト生成推論と推論エンドポイントを使用したトレーニング後に、微調整されたモデルをデプロイできるようになります。」とあります。
python finetune_llama_v2.py \
--model_name llamaste/Llama-2-7b-hf \
--dataset_name timdettmers/openassistant-guanaco \
--use_4bit \
--merge_and_push
Llama2利用例:Doctor GPT
DoctorGPT は、Meta のLlama2 70 億パラメータ大規模言語モデルのバージョンで、医療対話データセットで微調整され、強化学習と憲法 AI を使用してさらに改善されました。モデルのサイズはわずか 3 ギガバイトなので、どのローカル デバイスにも適合し、使用するために API を支払う必要はありません。
ChatGPT HACK
ChatGPT institution
有料会員向けの新機能で、デフォルトの設定をすることで毎回同じことを入力する手間を省けるようになりました。
ChatGPTで文字起こし
AIの利用法で今後当たり前になるのが会議などの『文字起こし』ではないでしょうか。AIさんが「あれ?何の話だったっけ」とか「言った言わない」を撲滅する日が近づいていまます。
こちらの記事は今あるツールを組み合わせればそんな未来が実現できる方法を詳しく解説してくださっています。
ファクトファイルの利用
方法を書いている方がいたのでこちらで…
Bard のパワーアップ機能
まだベータということもあるでしょうがChatGPTには見劣りするところが多いGoogle Bardですが飛び道具を出してきました。
画像が表示できるようになった!
7月にアップデートがあり大幅に進化! まだ英語用の機能ですが英語で例えば「What are some typical Japanese dishes? Please introduce with images.」(代表的な日本料理を教えて。写真つきで紹介して)と言った使い方が出来ます。
Bardに画像入力・画像認識機能
これは使おうとしたら自分のアカウントではまだ画像uploadボタンが表示されませんでした。アカウントの設定->個人情報ー>言語 でEnglish/United State に設定後、Bard画面をリロードすると使えるようになりました。
ニュースリストのスクショをアップロードして、「extract all letters from the pic 」(文字をすべて抽出して)と命じると、バッチリ出力されました。
画像から他のAI画像生成ツール用にプロンプトを作る
画像と共に「Please describe this image in detail.(この画像を詳細に説明してください。)」と入力すると作成してくれます。試しにベトナム鉄道の写真を入れると下記のように状況説明が出ました。更にこの解説からBing Creatorで画像を作るとアメリカっぽい写真が(笑
The train is a GE Genesis locomotive, model number P42DC.
The train is pulling six passenger cars, each of which is about 85 feet long.
The platform is about 500 feet long and 100 feet wide.
The sign on the platform says "RATRACO", which is the name of the train company.
The image was taken in the morning, as the sun is just starting to rise.
The temperature is about 50 degrees Fahrenheit.
画像を指示する文章を Japanese train E700 Shinkansen としたらこうなりました。便利。。。
Google docsのAI利用術
よく使うツールxAIが一番効果爆発泣きがしています。まだ活用できてないですが、これからの人はこれが基準になるのでしょうね。
Google スプレッドシートの AI – GPT Copilot の使用方法
以下のコパイロット関数について解説しています。ありがとう!
文書・資料関連
ざっくりAI解説
入門のきっかけや広く網羅されているので資料を作る時にも便利だなと思いました。自分でこういうのを全部作るとメンテで負債になっていくので大変ありがたいです。
東京都の文章生成AI利活用ガイドライン
社内でのAI利用のガイドを作るときに参考になりそうです。
などとなっています。
無料で使えるGoogleのAI講座
Google Cloud Skill boostの解説など。講座を受ける前に見ると全体像が日本語で理解できるので大変ありがたい動画です。
Google AI コースはこんな
同じ方の入門動画も分かりやすいです
個人的にはプロンプトエンジニアリングはあまり焦らなくても、サーバー側で改良が進むと思うので心配していません。
が、複数のバリエーションを作ってもらったり応用方法は少しずつでも利用して慣れていたほうが良さそうです。
Adobe Firefly
無料で使える画像生成AI。
1.テキストから生成
2.ジェネレーティブフィル(画像をアップロードして編集)
3.テキスト効果
3の機能で作った画像。残念なことに画像にAdobe社の透かしが入るので商用利用できません。有料化するまで練習しろ、ということのようです
Midjourney
ざっくり使い方
簡単にかっこいいポートレートを作成
この方のNOTEは便利なハックがいっぱい。とても勉強になります。
inpainting 機能
生成した画像の1部だけを編集?する機能です。
↓百聞は一見にしかず
ChatGPTを利用したプロンプト入門
同じ題材で様々な画像を生成する例でわかりやすい!
Generative AI art prompt generator
100のプロンプト例が掲載されているサイト。英語での指示のほうがAIは正しく働いてくれるのでこれはとても勉強になります。
Midjourney 動画を出力する方法
OpenAI
ChatGPTは自然言語のUIで利用者を爆発的に増やしたことが主な功績・ブームの理由と思います。同じ機能をAPIで使えるOpenAIのAPIサービスの記事はChatGPTに比べると驚くほど少なく、特に日本語ではアカウントを作って触るまでの入り口の記事ばかり(おそらくマーケティングのための広告記事)です。
自分も利用していますがあまりうまく使えていないので、OpenAIをもっと掘り下げたいと思っています。
OpenAI使い方と例
↓こんな感じで幅広くたくさん解説してくれています)
この英語記事の記述から更に検索すればより深く情報が得られそうです
本家マニュアル
本家マニュアルを熟読して色々試すのが一番かもしれませんが、とっつきづらい面が(笑
GPT-3 モデルを微調整し、パフォーマンスを向上させる方法
Python を使用して独自のデータで GPT-3 モデルを微調整し、パフォーマンスを向上させる方法を解説。
総合版
AIツールアグリゲーターのWebサイト。 現在、データベースには 1413 のツールがあり、さらに継続的に追加されています。
29のカテゴリで絞り込むことができます
サポートありがとうございます😊 ベトナムにお越しの際はお声がけくださいね🌻