見出し画像

Gemini 2.0 Flash Thinkingの使い方とレビュー

 [読了目安: 2分]

AI系ポッドキャスト(耳で学ぶAI)運営の矢野哲平(@robothink_jp)です。この記事ではGoogleから新しく発表されたGemini 2.0 Flash Thinkingの使い方と実際に使ってみた感想をレビューします。

Gemini 2.0 Flash Thinking

2024年12月に公開されたGeminiのモデル。公式サイトでは以下のように説明されています。

Gemini 2.0 Flash 思考モードは、応答の一部としてモデルが実行する「思考プロセス」を生成するようにトレーニングされた実験モデルです。その結果、思考モードは、Gemini 2.0 Flash 実験モデルよりも強力な推論能力で応答できます。

最近はo1しかり推論系のモデルが多くリリースされていますね。
直帰のチャットボットアリーナのランキングでは好成績です。

使い方

Google AI Studioで利用できます。ありがたいことに無料🙏

Google AI Studioにログインし画面右側のModel欄から選択できます。

制限

Gemini 2.0 Flash Thinkingは実験的なモデルであることを念頭に置いておきましょう。そして次のような制限があります。

  • トークンの入力制限は3.2万トークン

  • トークンの出力制限は8,000トークン

  • インプットはテキストと画像入力のみ

  • アウトプットはテキストのみ

Gemini 2.0 Flash Thinkingを試す

挨拶代わりに9.9 or 9.11問題いきましょうか。

9.9と9.11はどちらが大きいですか?
→正解

次にすももテストやってみます。

「すもももももももものうち」の中に"も"はいくつ含まれますか?
→不正解 7と回答(正解は8)

次に簡単なスクリプトを書かせてみました。

/inputsフォルダ直下に1-1.mp4と1-1.vttファイルがあります。
字幕ファイルを動画ファイルに埋め込む処理をPythonで実装して

試している時に気づきましたが処理が速いですね。さすがにGemini 1.5 Flash並みとはいきませんが割とサクサク処理が進みます。o1よりは速いです。
コード全体を出力してくれたので実行してみます。
…あれ?エラー…
次にエラーを入力して改善するよう指示するも…エラー。

うーん、コード関連のタスクは期待していましたが出鼻をくじかれた感があります。少し様子見といった感じでしょうか。

【note読者限定】生成AIのおすすめツールは?

  • 生成AIは何を使えばいいか分からない

  • もっと業務効率化に貢献するツールを知りたい

  • ChatGPT以外のAIツールを知りたい

こういった声に応えておすすめの生成AIツールを解説する資料を制作しました。よりAIの情報をキャッチアップしたい人はチェックしてみてください。

👉資料を受け取る【無料】

noteでも月に20本ほどAI関連の記事を投稿しています。フォローよろしくお願いします😼

いいなと思ったら応援しよう!

この記事が参加している募集