npaka
記事一覧
HuggingFace の speech-to-speech を試す
「HuggingFace」の「speech-to-speech」を試したのでまとめました。
1. speech-to-speech「Hugging Face」の「speech-to-speech」は、ローカルで音声認識、応答生成、音声合成を行うためのオープンソースの取り組みです。
特徴は、次のとおりです。
主要コンポーネントは、次のとおりです。
利点は、次のとおりです。
2. 実行手順M
Gemini の 新機能 - Gems と Imagen 3 の概要
「Gemini」の 新機能「Gems」と「Imagen 3」の概要をまとめました。
1. はじめに本日 (8月29日)、Geminiの2つの新機能が発表されました。
「Gems」は今すぐ、「Imagen 3」は今後数日以内に「Gemini Advanced」「Business」「Enterprise」のユーザーが利用できます。
2. Gems「Gems」は、Gemini をカスタマイズして、
Google Colab で CogVideoX を試す
「Google Colab」で「CogVideoX」を試したのでまとめました。
1. CogVideoX「CogVideoX」は、「Zhipu AI」が開発した動画生成AIです。「CogVideoX-2B」と「CogVideoX-5B」の2つのモデルが提供されています。
2. Colabでの実行Colabでの実行手順は、次のとおりです。
(1) パッケージのインストール。
# パッケージの
Gemini 1.5 Pro Experimental 0827 ・ Gemini 1.5 Flash Experimental 0827 ・ Gemini 1.5 Flash-8B Experimental 0827 の概要
「Gemini 1.5 Pro Experimental 0827」「Gemini 1.5 Flash Experimental 0827」「Gemini 1.5 Flash-8B Experimental 0827」の概要をまとめました。
1. はじめに本日 (8月28日)、Geminiの3つの実験モデルを公開されました。
「Google AI Studio」および「Gemini API」で