#生成AI
GoogleのGemini新機能「Multimodal Live API」で音声・映像・テキストをリアルタイムに扱う時代が到来!スターターキット公開で誰でも実装可能に
今回はGoogleが発表した次世代大規模言語モデル「Gemini」に搭載された新機能、Multimodal Live APIについてご紹介したいと思います。最近Githubでスターターキットが公開され、「え?これgit cloneで誰でも使えるの!?」とAI好きとしては衝撃を受けています。
「音声とカメラを通じてリアルタイムでGeminiと会話できる」「動画まで解析できる」など、まるでSF映画の
DeepSeek-R1で変わる生成AIの常識|オープンソースで高性能かつ低コスト
近年、ChatGPTをはじめとする生成AIが注目を集める中、さらに革新的なオープンソースモデルが台頭しています。その代表格として注目されるのがDeepSeek-R1です。本記事では、DeepSeek-R1の技術的特徴から「生成AI SEO」への応用方法、そしてOpenAI o1との比較ポイントを詳細に解説。DeepSeek-R1 vs o1の性能差や導入メリットを踏まえながら、コストと品質を両立す
もっとみる動画生成AI「Hunyuan Video」がスゴイ!ComfyUI対応で軽量化🚀 指差し・コスプレ動画も簡単に作れちゃう💕メモリ15GB~でOK!使い方を徹底解説!
メリー・クリスマスです!皆さん🎄✨️ 買い物リストを見ながら、お店で「あれ、見たことないぞ?」って謎の品が増えてるのはなんででしょうか、葉加瀬あい(ハカセアイ) です!
突然ですが、みなさんはオープンソースで無料で使える「 Hunyuan Video 」をご存知でしょうか?とても面白い動画生成AIなんです!Tencent社が開発した、 テキストから動画を生成するAI なんです⋯!
有料の動画
AIエディタCursor+Clineエージェントでゼロイチ開発を体験しよう
AIエージェントというキーワードが盛り上がってきています。どのようなものなのでしょうか?
エージェントとは「代理人」の意味です。私の記憶が確かならばエージェントプログラムとは「自律的に(自分がとるべき行動を自分で決めて)動くプログラム」という認識です。
生成AIの登場で自律的に動けるプログラムが作れるようになってきています。すでにAIプログラムをAIに書かせるような動きもあるようです。
この
【最強AI音声合成ツールAivisSpeech🚀】人間と見分けがつかないほど自然で,感情表現豊かな高品質音声が無料で使い放題!😳読み間違い修正機能や豊富な音声モデルで、コンテンツ制作が劇的に効率化!✨
どうも皆さん!葉加瀬あいです!
今回は話題の音声合成ツール「AivisSpeech」について解説をしていきます!
なお、私の メンバーシップ にご入門されている方は、いつものように記事の内容を 動画 で確認できます!
Youtubeでは一部の動画を期間限定配信しているので、よかったらチャンネル登録もおねがいします🙌
なお、AivisSpeech-Engine を使ってみたい開発者向けにこ
「Hallo2」とは?特徴とセットアップを紹介!【無料で高品質リップシンク】
Hallo2の概要Hallo2は、入力された音声と人物画像を同期させるオープンソースプロジェクトです。
実際のアウトプットは、以下のイメージです。
Hallo2の強みは、大まかに以下の3つになると思います。
これらの強みを実現するために以下のような実装をしていると記載されています。
DeepL直張りのため、原文興味ある方は以下のリンクから!
Hallo2のセットアップ公式のREADME
【AI画像生成でリアルな肌を表現する方法✨】人物画像の生成で、肌がのっぺりしたり、プラスチックのように不自然に見える…そんな悩みを解決!🤔 SDXLとFlux両方で使える「スキンディテイラー」。DL可能なワークフローを使って、誰でも簡単にリアルな肌を再現できます。✨ さらに、Florence2を使った自動プロンプト生成や、ComfyUI Layer Styleを活用した高度な美肌表現テクニックも解説。今すぐ理想の肌表現を手に入れよう!💖
どうも皆さん!葉加瀬あいです!
今回は画像生成AIでリアルな肌を表現する方法について解説をしていきます!
なお、私の メンバーシップ にご入門されている方は、いつものように記事の内容を 『動画』 で確認できます!
Youtubeでは一部の動画を期間限定配信しているので、よかったらチャンネル登録もおねがいします🙌
それでは、本日もよろしくお願いします!
はい!それでは改めてこんにちは皆さ
【日記#44】AIツール「pinokio」使ってみた
以下の「Animate Anyone」の動画を見つけ説明を聞いていましたら「pinokio」というツールがあるらしく、簡単に環境構築できるようで気になったので使ってみました。
※「pinokio」はあまり詳しくない人向けのアプリですが、不安になりそうな要素がいくつかあったのでそれにわざわざ触れて行く内容になっていることをご了承ください。そのため、いつもの画像比較だけ見たい方は目次の「生成画像の比
OpenRouter で Grok 2 API を試す
「OpenRouter」で「Grok 2 API」を試したのでまとめました。
1. OpenRoute「OpenRoute」は、複数のAIモデルに一元的にアクセスできるプラットフォームです。「GPT-4」「LLaMA」「Claude」「Command-R」など、130種類以上の様々なAIモデルに共通インタフェースで利用することができます。
2. Grok 2・Grok 2 mini「Grok
【画像つき解説】v0で作ったアプリをCursorで起動させる手順
こんばんは、moz (もず)です!
普段はXにて生成AIのことをメインでつぶやいています。
先日、v0→Cursorの手順を自身のメモがてらXに投稿したら思いもしないほど伸びたので、このnoteに詳細な手順をまとめようとしたところ、
心優しい方に「もっと簡単な方法があるよ!」と教えてもらったので、
新しい手順で検証したものをこのnoteに書いていきます。
前置きが少し長くなってしまいましたが