GoogleのAI「Gemini」(ジェミニ)
初めに
昨日記事にしたのOpenAI社のChatGPTの対抗馬であるGoogleの Geminiについて紹介します!ちなみに明日はAnthropic社のClaudeについて紹介します。(文章生成系のAIの紹介はラスト)
ネタを考える中で、生成AIといっても幅広く抽象的なので、生成AIのジャンルや、用途別に紹介して行く事にしました。順番が前後したり、全く異なる内容を挙げるかもしれませんが、知りたいツールなどがあれば是非コメントしていただけると幸いです。
今後紹介するジャンル一覧
生成AI系(文章生成)
検索系
動画生成系
画像生成系
議事録・音声系
パワポ資料作成系
コード生成系
ポータルサイト系
音声生成系
AI系のショートカットキーや豆知識
Gemini(ジェミニ)とは
Gemini(ジェミニ)は2024年2月にBardがGeminiへと統合された天下のGoogleの生成AI。OpenAI社のChatGPTと生成AI市場の覇権争いをしている。最近テレビコマーシャルやSNSでの企業案件動画がかなり多くなり、お茶の間で目にする機会が多くなった。
昨日のChatGPT-4oでマルチモーダル化で処理できるようになり、人間を凌駕する可能性について触れたが、 Geminiはいち早くマルチモーダル化でデータを処理していた。そして Geminiにしか出来ない活用法があるので、是非最後まで目を通していただける、即座に活用法を体得できるかと思います!
※マルチモーダル化とは
テキストだけでなく、画像、音声、動画などさまざまな形式のデータを理解し、処理できる能力を指す
GeminiはGoogle系のサービスと抜群の相性
まず、前提として共有したい事は何度もお伝えるしているが、 GeminiはGoogleが提供している。そのため、Google Workspaceと連携しており、Google Workspace内のドキュメントやスプレッドシート、G-mail、YouTubeなどと連携している事が最大の武器である。またGoogleの検索エンジンとも連携している為、検索型のAIでもありハルシネーションが少ない事も Geminiの強みだ。
※ハルシネーション(Hallucination)とは、人工知能(AI)が事実とは異なる、または存在しない情報を生成してしまう現象
個人的に最近はChatGPTより、 Geminiを使用している。理由は長文の読み込みが強いからである。またとりあえず、長文や大量のデータをスキャンしたい際にChatGPTだと読み込めないからだ。
Gemini 1.5 Proの100万トークンを一度に対応できる。(ChatGPTは32,000トークン)その為、非常に長い文章や大量のデータを一度に処理できる。
100万トークンとは1時間の動画、11時間の音声データ、70万語以上の英単語(約1,500ページの書籍相当)などを一度に処理できるレベルだ。
具体的な活用方法
①PDFを読み込ませて、要約する。
先ほども伝えたが、とにかく Geminiは大量のデータに強い。その為、PDFデータなども読み込み可能だ。
実際に最近使用した実例としては、気になる企業の有価証券報告書を読み込ませて、内容を要約し、分からない箇所をさらに質問していくイメージだ。学生、社会人問わず、先にAIにスキャンさせることは理解度に直結してくる。
②拡張機能をフル活用する!
赤文字の①の箇所の設定から、拡張機能でGoogle work spaceにアクセスできるようになる。GoogleマップやGmail、YouTubeなどのデータを元にアウトプット物を生成してくれる。
例えばGoogleフライトとGoogleマップを使用して、大方の時間や経路を即座に把握したりする事ができる。
③ちょっとした違和感を即座に修正する。
生成された文章が気に入らなければ、その場でその他に3つ他の提案をしてくれる。
その他にも、もう少し手を入れたい際は、ボタン1つである程度修正できる。この一手間がChatGPTにはない魅力だ。
④アウトプットを即座に転送する。
「共有とエクスポート」からGoogleドキュメントやGmai、スプレッドシートにもそのまま転送できる。
またGoogleスプレッドシートにも直接転用できる。
メリット
メリットは上記の具体例でも示したように、Googleが展開するサービスとの相性が抜群であるのと大量のデータに強い事とGoogle検索エンジンを元にしているため、ハルシネーションが少ない点である。
そのほかは時期によって1〜3ヶ月無料で有料版を利用できる点だ。とりあえず無料で試してみることが最重要事項だ。
デメリット
デメリットとしては、月額が日本円で2900円であるところだ。(ChatGPTは月額20ドルなので実質同じであるが)ChatGPTとGeminiはどちらかを使いこなせば、余裕でペイできるので、好みの方を使うのが最適解かもしれない。
個人的な感想
GeminiとChatGPTのどちらかを使うかはUI・UXの違いの好みかもしれない。文章系の生成AIの投稿が終わったら、大方のAIを無料で使える裏技を共有しようと思っているのでお楽しみに!
この記事が気に入ったらサポートをしてみませんか?