マガジンのカバー画像

AI

368
運営しているクリエイター

#生成AI

GoogleのGemini新機能「Multimodal Live API」で音声・映像・テキストをリアルタイムに扱う時代が到来!スターターキット公開で誰でも実装可能に

GoogleのGemini新機能「Multimodal Live API」で音声・映像・テキストをリアルタイムに扱う時代が到来!スターターキット公開で誰でも実装可能に

今回はGoogleが発表した次世代大規模言語モデル「Gemini」に搭載された新機能、Multimodal Live APIについてご紹介したいと思います。最近Githubでスターターキットが公開され、「え?これgit cloneで誰でも使えるの!?」とAI好きとしては衝撃を受けています。

「音声とカメラを通じてリアルタイムでGeminiと会話できる」「動画まで解析できる」など、まるでSF映画の

もっとみる
DeepSeek-R1で変わる生成AIの常識|オープンソースで高性能かつ低コスト

DeepSeek-R1で変わる生成AIの常識|オープンソースで高性能かつ低コスト

近年、ChatGPTをはじめとする生成AIが注目を集める中、さらに革新的なオープンソースモデルが台頭しています。その代表格として注目されるのがDeepSeek-R1です。本記事では、DeepSeek-R1の技術的特徴から「生成AI SEO」への応用方法、そしてOpenAI o1との比較ポイントを詳細に解説。DeepSeek-R1 vs o1の性能差や導入メリットを踏まえながら、コストと品質を両立す

もっとみる
【画像つき解説】Difyの新機能「プラグイン」でSlackボットを作ってみた

【画像つき解説】Difyの新機能「プラグイン」でSlackボットを作ってみた

※この記事は無料で途中まで読めます

こんにちは!moz(もず)です。
普段はX(@moz_ai_tech)にて、生成AIについて発信をしています。

まだベータ版ですが、ついにDifyのバージョン1.0.0が出ましたね!

新しく「プラグイン機能」や「エージェントノード」が追加されたり、
新機能が盛り沢山で今後の正式リリースが楽しみです。

今回は「プラグイン機能」を使ってSlackボットを作っ

もっとみる
動画生成AI「Hunyuan Video」がスゴイ!ComfyUI対応で軽量化🚀 指差し・コスプレ動画も簡単に作れちゃう💕メモリ15GB~でOK!使い方を徹底解説!

動画生成AI「Hunyuan Video」がスゴイ!ComfyUI対応で軽量化🚀 指差し・コスプレ動画も簡単に作れちゃう💕メモリ15GB~でOK!使い方を徹底解説!

メリー・クリスマスです!皆さん🎄✨️ 買い物リストを見ながら、お店で「あれ、見たことないぞ?」って謎の品が増えてるのはなんででしょうか、葉加瀬あい(ハカセアイ) です!

突然ですが、みなさんはオープンソースで無料で使える「 Hunyuan Video 」をご存知でしょうか?とても面白い動画生成AIなんです!Tencent社が開発した、 テキストから動画を生成するAI なんです⋯!

有料の動画

もっとみる
AIエディタCursor+Clineエージェントでゼロイチ開発を体験しよう

AIエディタCursor+Clineエージェントでゼロイチ開発を体験しよう

AIエージェントというキーワードが盛り上がってきています。どのようなものなのでしょうか?

エージェントとは「代理人」の意味です。私の記憶が確かならばエージェントプログラムとは「自律的に(自分がとるべき行動を自分で決めて)動くプログラム」という認識です。

生成AIの登場で自律的に動けるプログラムが作れるようになってきています。すでにAIプログラムをAIに書かせるような動きもあるようです。

この

もっとみる
Google Colab で hallo2 を試す

Google Colab で hallo2 を試す

「Google Colab」で「hallo2」を試したのでまとめました。

1. hallo2「hallo2」は顔の静止画と音声からリップシンク動画を生成するAIモデルです。
特徴は、次のとおりです。

2. Google Colabでの実行「Google Colab」での実行手順は、次のとおりです。

(1) パッケージのインストール。

# パッケージのインストール!git clone htt

もっとみる
「Hallo2」とは?特徴とセットアップを紹介!【無料で高品質リップシンク】

「Hallo2」とは?特徴とセットアップを紹介!【無料で高品質リップシンク】


Hallo2の概要Hallo2は、入力された音声と人物画像を同期させるオープンソースプロジェクトです。

実際のアウトプットは、以下のイメージです。

Hallo2の強みは、大まかに以下の3つになると思います。

これらの強みを実現するために以下のような実装をしていると記載されています。

DeepL直張りのため、原文興味ある方は以下のリンクから!

Hallo2のセットアップ公式のREADME

もっとみる
【AI画像生成でリアルな肌を表現する方法✨】人物画像の生成で、肌がのっぺりしたり、プラスチックのように不自然に見える…そんな悩みを解決!🤔 SDXLとFlux両方で使える「スキンディテイラー」。DL可能なワークフローを使って、誰でも簡単にリアルな肌を再現できます。✨  さらに、Florence2を使った自動プロンプト生成や、ComfyUI Layer Styleを活用した高度な美肌表現テクニックも解説。今すぐ理想の肌表現を手に入れよう!💖

【AI画像生成でリアルな肌を表現する方法✨】人物画像の生成で、肌がのっぺりしたり、プラスチックのように不自然に見える…そんな悩みを解決!🤔 SDXLとFlux両方で使える「スキンディテイラー」。DL可能なワークフローを使って、誰でも簡単にリアルな肌を再現できます。✨ さらに、Florence2を使った自動プロンプト生成や、ComfyUI Layer Styleを活用した高度な美肌表現テクニックも解説。今すぐ理想の肌表現を手に入れよう!💖

どうも皆さん!葉加瀬あいです!

今回は画像生成AIでリアルな肌を表現する方法について解説をしていきます!

なお、私の メンバーシップ にご入門されている方は、いつものように記事の内容を 『動画』 で確認できます!

Youtubeでは一部の動画を期間限定配信しているので、よかったらチャンネル登録もおねがいします🙌

それでは、本日もよろしくお願いします!

はい!それでは改めてこんにちは皆さ

もっとみる
【日記#44】AIツール「pinokio」使ってみた

【日記#44】AIツール「pinokio」使ってみた

以下の「Animate Anyone」の動画を見つけ説明を聞いていましたら「pinokio」というツールがあるらしく、簡単に環境構築できるようで気になったので使ってみました。

※「pinokio」はあまり詳しくない人向けのアプリですが、不安になりそうな要素がいくつかあったのでそれにわざわざ触れて行く内容になっていることをご了承ください。そのため、いつもの画像比較だけ見たい方は目次の「生成画像の比

もっとみる
公式アンバサダーが初心者に向けて徹底解説!  話題のAI検索エンジン 「Felo」とその活用法

公式アンバサダーが初心者に向けて徹底解説! 話題のAI検索エンジン 「Felo」とその活用法

はじめに
リンクに飛んでいただきありがとうございます!大斗(ひろと)と申します!
現在、大学4年生で生成AIを使った様々なことに取り組んでいます。
Xでの投稿・情報発信もしているのでぜひフォローよろしくお願いします!

最近は様々なAIツールが毎日のように登場したり新たな機能が追加されたり…

情報を追いきれていない、どのツールを使えばいいかわからない。
そう感じている方が多いのではないでしょうか

もっとみる
OpenRouter で Grok 2 API を試す

OpenRouter で Grok 2 API を試す

「OpenRouter」で「Grok 2 API」を試したのでまとめました。

1. OpenRoute「OpenRoute」は、複数のAIモデルに一元的にアクセスできるプラットフォームです。「GPT-4」「LLaMA」「Claude」「Command-R」など、130種類以上の様々なAIモデルに共通インタフェースで利用することができます。

2. Grok 2・Grok 2 mini「Grok

もっとみる
【画像つき解説】v0で作ったアプリをCursorで起動させる手順

【画像つき解説】v0で作ったアプリをCursorで起動させる手順

こんばんは、moz (もず)です!
普段はXにて生成AIのことをメインでつぶやいています。

先日、v0→Cursorの手順を自身のメモがてらXに投稿したら思いもしないほど伸びたので、このnoteに詳細な手順をまとめようとしたところ、

心優しい方に「もっと簡単な方法があるよ!」と教えてもらったので、
新しい手順で検証したものをこのnoteに書いていきます。

前置きが少し長くなってしまいましたが

もっとみる