見出し画像

【Xを追うのが面倒な人向け】AIジャーナル Vol.2

私は普段、X(Twitter)を使ってAI関連の最新情報をチェックしています。

特に最近はリリースも多く追うのが大変ですが、好きなので楽しんでやっています。
でも、世の中の人のほとんどはXのタイムラインを隙あらば見るほど時間もなく、面倒に思う人も多いと思います。(そもそもそこまで追う必要ない人も、、)

そんな人向けに生成AI情報がザーッと追えるAIジャーナルを発信しています。

早速、今週の最新トピックスから!

最新トピックス(独断と偏見で選定)

ChatGPTでツール間の切り替えが不要に

GPT-4で利用可能な以下の機能について切り替えをせずに利用できるようにアップデート!!

・Advanced Data Analysis
・プラグイン
・ブラウジング
・DALL-E 3

これによって、UIが向上したことは勿論ですが、それぞれの機能を横断した処理が可能になりました。

例えばこんなことができるように..!
・プラグインで読み込んだPDFの要約をwordに出力
・Excelデータにプラグインで取得した最新情報を追加
・生成した画像をPowerPointに貼り付けて出力
・画像読み込みの出力データをもとに画像生成

これは一例なので無限の組み合わせで入力と出力が可能になりますね!

まだ、一部のユーザーにしか解放されていないようなのでXで事例が出てきたら次回以降で紹介していきます!


生成AIを使ったChatbotが作れる「poe」がクリエイター向けの収益化機能を発表

PoeというChatbotを作れるサービスがbotを作成したクリエイターに収益を分配する機能をリリース!

収益化の構造としては2つあります。

  • すぐに利用可能:ボットがユーザーにPoeを購読させると(いくつかの方法で計測)、その収益の一部が配分される。

  • まもなく開始:メッセージごとの料金を設定し、各メッセージでそれを支払います(このシステムの整備中)

現在アメリカの住民向けですが、まもなく他の国々にも拡張される予定だそう。

Poeでは特化型のAIbotを作れるため英会話向け、セラピー、アシスタント、教育などテーマを絞ってbot作成してユーザーに提供できます。

日本ではまだ使っている人は少なそうですが、収益化が導入されれば広がっていきそうですね。


深掘りトピックス

ChatGPT-4V 実験 画像のすべての部分が同じように扱われるわけではない?

GPT-4Vで画像のどこの部分が優先的に見られているのかの実験結果が登場。
この実験結果では画像の左上隅から開始し、次に中央に向かって上を横切り、次に画像の中央を優先する結果に。

「The animal is...」というフレーズの後に動物の名前がランダムに記載された3x3のグリッドを作成しました。

次に、そのグリッドの画像をChatGPT 4Vにアップロードし、「どの動物ですか? 一つだけ選んでください」というプロンプトとともに送りました。
ChatGPTがある動物を他の動物よりも選ぶと、それは画像の一部を優先している手がかりとなりました。
「正解」したマスを排除して、グリッドの多くのバリエーションでこのプロ
セスを繰り返しました。

これがただの偶然でないことを確認するために、各実験を少なくとも2回以上(または複数のマスを持つグリッドの場合はそれ以上)繰り返しました。

9マスのグリッドに動物の名前をプロット

以下のように1つずつ確認していくプロセスを繰り返す。

人間も左上から見ていく傾向があるというのがデザインの常識で言われていますが、それがChatGPTにも当てはまるというのが面白いですね

詳細はこちらの記事で確認できます!


AIでこんなこともできる

AIがセールスできる時代に

今週、Xで話題になったのがAIが人間のような電話応対ができるサービス
ただ、応対するだけでなくAIが顧客にヒアリングし営業・クロージングまで出来ています。
まだ、完璧ではないですがかなり人間に近いレベルまで近づいていますし、何より24時間365日働けるので、人間に繋ぐ前の段階としては十分な働きをしてくれるサービスになりそうです。

https://www.air.ai/

本物の人間のように聞こえる 10 ~ 40 分間の長時間通話が可能で、無限の記憶力と完璧な記憶力を備え、5,000 を超えるアプリケーションにわたって自律的にアクションを実行できる世界初の AI 。トレーニング、管理、モチベーションを必要とせずに、フルタイム エージェントの仕事全体を行うことができます。24時間365日稼働します。


ChatGPTの使い方事例

ChatGPTに何を聞いたらいいかわからないという人もまだまだ多い印象です。
このコーナーではテーマに沿って、どういうことをChatGPTに聞くのが有効かの簡単な例を紹介します。

今回は画像を認識できるGPT-4Vの使い方事例についてです。

動画では、GPT4Vの使い方事例が22個紹介されています。

- 絵のパネルに対するグループダイナミクスと視点の意味
- 人間の細胞の構造の解説
- 料理のレシピの生成
- 電子回路の解析
- キノコの写真に対する医師や科学者の反応
- 内装の改善提案
- 複雑な脳の構造と神経経路の解説
- 駐車場の制限の解説
- 数学の問題の解法
- インテリアデザインの提案
- プログラミングのコード生成
- 複雑な図の解析
- クロスワードパズルの解答
- ウェブサイトのコード生成
- 物体の認識と解釈
- デイプランナーのアプリ化
- トレーディンググラフの解釈
- 映画のキャラクターの特定
- 室内デザインの命名提案
- 学術論文の要約
- デザインスケッチのウェブサイト化
- 画像内の特定の要素の識別

画像から様々なことが読み取れるので使い方の用途は幅広いので、こんなことができるという一例として参考にしてみて下さい。


あれ?なんか、Xで最新情報追ってみたくなったという人はよかったらフォローお待ちしております。


この記事が気に入ったらサポートをしてみませんか?