見出し画像

GoogleのAI「Gemini」(ジェミニ)


初めに


 昨日記事にしたのOpenAI社のChatGPTの対抗馬であるGoogleの Geminiについて紹介します!ちなみに明日はAnthropic社のClaudeについて紹介します。(文章生成系のAIの紹介はラスト)

 ネタを考える中で、生成AIといっても幅広く抽象的なので、生成AIのジャンルや、用途別に紹介して行く事にしました。順番が前後したり、全く異なる内容を挙げるかもしれませんが、知りたいツールなどがあれば是非コメントしていただけると幸いです。

今後紹介するジャンル一覧

  • 生成AI系(文章生成)

  • 検索系

  • 動画生成系

  • 画像生成系

  • 議事録・音声系

  • パワポ資料作成系

  • コード生成系

  • ポータルサイト系

  • 音声生成系

  • AI系のショートカットキーや豆知識

Gemini(ジェミニ)とは


 Gemini(ジェミニ)は2024年2月にBardがGeminiへと統合された天下のGoogleの生成AI。OpenAI社のChatGPTと生成AI市場の覇権争いをしている。最近テレビコマーシャルやSNSでの企業案件動画がかなり多くなり、お茶の間で目にする機会が多くなった。

 昨日のChatGPT-4oでマルチモーダル化で処理できるようになり、人間を凌駕する可能性について触れたが、 Geminiはいち早くマルチモーダル化でデータを処理していた。そして Geminiにしか出来ない活用法があるので、是非最後まで目を通していただける、即座に活用法を体得できるかと思います!

※マルチモーダル化とは
テキストだけでなく、画像、音声、動画などさまざまな形式のデータを理解し、処理できる能力を指す

GeminiはGoogle系のサービスと抜群の相性


 まず、前提として共有したい事は何度もお伝えるしているが、 GeminiはGoogleが提供している。そのため、Google Workspaceと連携しており、Google Workspace内のドキュメントやスプレッドシート、G-mail、YouTubeなどと連携している事が最大の武器である。またGoogleの検索エンジンとも連携している為、検索型のAIでもありハルシネーションが少ない事も Geminiの強みだ。

※ハルシネーション(Hallucination)とは、人工知能(AI)が事実とは異なる、または存在しない情報を生成してしまう現象

 個人的に最近はChatGPTより、 Geminiを使用している。理由は長文の読み込みが強いからである。またとりあえず、長文や大量のデータをスキャンしたい際にChatGPTだと読み込めないからだ。
 Gemini 1.5 Proの100万トークンを一度に対応できる。(ChatGPTは32,000トークン)その為、非常に長い文章や大量のデータを一度に処理できる。
100万トークンとは1時間の動画、11時間の音声データ、70万語以上の英単語(約1,500ページの書籍相当)などを一度に処理できるレベルだ。

具体的な活用方法

①PDFを読み込ませて、要約する。


 先ほども伝えたが、とにかく Geminiは大量のデータに強い。その為、PDFデータなども読み込み可能だ。
 実際に最近使用した実例としては、気になる企業の有価証券報告書を読み込ませて、内容を要約し、分からない箇所をさらに質問していくイメージだ。学生、社会人問わず、先にAIにスキャンさせることは理解度に直結してくる。

②拡張機能をフル活用する!


 赤文字の①の箇所の設定から、拡張機能でGoogle work spaceにアクセスできるようになる。GoogleマップやGmail、YouTubeなどのデータを元にアウトプット物を生成してくれる。
 例えばGoogleフライトとGoogleマップを使用して、大方の時間や経路を即座に把握したりする事ができる。

①設定→拡張機能をONにする。②はチャットの入力と履歴。③は使用モデルの変更箇所

③ちょっとした違和感を即座に修正する。


 生成された文章が気に入らなければ、その場でその他に3つ他の提案をしてくれる。

右上に「解答案を表示」とあり、3つの案を提案してくれる。
短くしたり、長くしたり、即座に修正できる。

 その他にも、もう少し手を入れたい際は、ボタン1つである程度修正できる。この一手間がChatGPTにはない魅力だ。

④アウトプットを即座に転送する。


「共有とエクスポート」からGoogleドキュメントやGmai、スプレッドシートにもそのまま転送できる。

ドキュメントやGmailに直接エクスポートできる。

またGoogleスプレッドシートにも直接転用できる。

右下の「スプレッドシートにエクスポート」から直接転送できる。
スプレッドシートに直接エクスポート

メリット


 メリットは上記の具体例でも示したように、Googleが展開するサービスとの相性が抜群であるのと大量のデータに強い事とGoogle検索エンジンを元にしているため、ハルシネーションが少ない点である。
 そのほかは時期によって1〜3ヶ月無料で有料版を利用できる点だ。とりあえず無料で試してみることが最重要事項だ。

デメリット


 デメリットとしては、月額が日本円で2900円であるところだ。(ChatGPTは月額20ドルなので実質同じであるが)ChatGPTとGeminiはどちらかを使いこなせば、余裕でペイできるので、好みの方を使うのが最適解かもしれない。

個人的な感想


 GeminiとChatGPTのどちらかを使うかはUI・UXの違いの好みかもしれない。文章系の生成AIの投稿が終わったら、大方のAIを無料で使える裏技を共有しようと思っているのでお楽しみに!

この記事が気に入ったらサポートをしてみませんか?