マガジンのカバー画像

AI

356
運営しているクリエイター

記事一覧

AIエディタCursor+Clineエージェントでゼロイチ開発を体験しよう

AIエディタCursor+Clineエージェントでゼロイチ開発を体験しよう

AIエージェントというキーワードが盛り上がってきています。どのようなものなのでしょうか?

エージェントとは「代理人」の意味です。私の記憶が確かならばエージェントプログラムとは「自律的に(自分がとるべき行動を自分で決めて)動くプログラム」という認識です。

生成AIの登場で自律的に動けるプログラムが作れるようになってきています。すでにAIプログラムをAIに書かせるような動きもあるようです。

この

もっとみる
GitHub Copilotを無料で利用できる

GitHub Copilotを無料で利用できる

ネットニュースで、Github Copilotを無料で利用できることを知りました。
早速VSCODEの拡張機能を確認しました。

こちらから、無料でGithub Copilotを使うことができます。

Github Copilotのチャット画面

無料で使えるモデルは、GPT-4oとClaude 3.5 Sonnet(プレビュー)です。

無料版では、利用できる内容に制限があります。
公式のドキュ

もっとみる
商用利用ができる表現能力が高いAIアート用画像生成AI、Emi 3を無償公開

商用利用ができる表現能力が高いAIアート用画像生成AI、Emi 3を無償公開

はじめにこんにちは、AI Picasso社の開発チームです。皆様に重要なお知らせがあります。高品質AIアート用画像生成AI、Emi 3 を商用利用可能で無償公開します。この画像生成AIは、基盤モデルの学習においてオプトアウトが実施されており、追加学習において無断転載画像を学習していません。
Emi 3は以下のURLから無料でダウンロードできます。

Emi 3の特徴1.表現能力が高い

このモデル

もっとみる

Notion APIを使いウェブサイトを作る際のプロンプト

Notion APIを使いbolt.newで作ると、WordPressよりも簡単でセキュアなウェブサイトを作ることができると、話題になっています。
それで私も、この数日Notion APIを使ってCMSやウェブサイトとして表示できるように、試行錯誤を続けています。

その中で、Notion APIを使ってウェブサイト作る手順ですが、bolt.newのプロンプトとして使える内容を考案しました。

もっとみる
Stable Diffusionでリップシンク動画が生成できる拡張機能『SadTalker』を使ってみた!

Stable Diffusionでリップシンク動画が生成できる拡張機能『SadTalker』を使ってみた!

どうも🎵OpenAIの『Sora』他、最近は動画生成AIがどんどん出てきているなぁと感じているエルティアナです。

今回はそんな動画生成AIサービスがたくさん出てきている中で、どれもクラウドの月額有料サービスが基本的な感じなので、取り急ぎStableDiffusionでなにかできないかな?と調べてみた中で、音声データと静止画からリップシンク動画を作ってくれる『Sad Talker』という拡張機能

もっとみる
AI エージェント エディタ「Windsurf」登場!真の Cursor キラーついに現る

AI エージェント エディタ「Windsurf」登場!真の Cursor キラーついに現る

ついに真の Cursor キラーが現れました。その名も「Windsurf」。

GitHub Copilot、Zed、Void など今までがっかりさせられてきましたが、今回は本物です。

海外ではすでに話題になっています:

Windsurf は、Codeium が開発した新しい AI エージェントエディタです。Codeium は超メジャーな VS Code 拡張機能なので、聞き覚えがある人もいる

もっとみる
PowerPointのスライドを半自動で作りナレーションを付けて公開する方法

PowerPointのスライドを半自動で作りナレーションを付けて公開する方法

私は、先日この動画を作りました。

Felo.AIで検索した結果で右上に、プレゼンテーションを作るボタンがあります。
ここから、プレゼンテーションを制作できます。

ここで作成したプレゼンテーションは、Canvaで編集できます。
ダウンロードのボタンでは、Canvaで編集の項目が見つからないことがあります。

文書を表示のボタンをクリックすると、このようなメニューが表示されます。

Canvaで編

もっとみる
Gemini 2.0 の APIのはじめ方

Gemini 2.0 の APIのはじめ方

「Gemini 2.0」の APIのはじめ方をまとめました。

1. Gemini 2.0 Flash「Gemini 2.0 Flash」は、「Gemini Developer API」と「Google AI Studio」を通じて、実験的なプレビューリリースとして利用できるようになりました。

このモデルの新機能は、次のとおりです。

新しいSDKもリリースしています。「Gemini 2.0」の

もっとみる

Gemini 2.0 Flash Experimentalでパソコンの画面を共有する手順

X旧Twitterの投稿で、Gemini 2.0 Flash Experimentalでマルチモーダルが使えること、画像認識がすごいという内容の投稿が増えているようです。
そしてパソコンの画面を取り込んで、リアルタイムで回答を得ているポスト(投稿)もありました。

今回は、パソコンの画面を取り込むまでの手順が分かりましたので、記事に書きました。

こちらのURLで、リアルタイムで回答を得られるAP

もっとみる
にじボイス API を試す

にじボイス API を試す

tl;drにじボイス API が正式リリースしたよ

5,000 文字分の無料音声生成クレジットが付与されるよ

クレジット消費は入力文字数に応じて計算されるよ

にじボイス公式の API 画面から音声は生成できるよ

Python でも生成してみたよ

下記のにじボイス API ページより Google アカウントでログインしましょう。

ログイン後の画面で現在の利用状況の確認や支払い、API

もっとみる
Gemini 2.0 の概要

Gemini 2.0 の概要

以下の記事が面白かったので、簡単にまとめました。

1. Gemini 2.0 Flash「Gemini 2.0 Flash」は、開発者に最も人気の高いモデルである「Gemini 1.5 Flash」を基に構築されており、同様に応答時間が高速です。「Gemini 1.5 Pro」を2倍の速度を上回っています。「Gemini 2.0 Flash」には新機能も搭載されています。マルチモーダル入力のサポ

もっとみる
ついに正式公開!OpenAIの動画生成AI『Sora』と新時代の映像クリエイション

ついに正式公開!OpenAIの動画生成AI『Sora』と新時代の映像クリエイション

OpenAIが開発する動画生成AI「Sora」が、ついに研究プレビューから一般公開へと移行しました。

今年初め、Soraがテキストからリアルな動画を生み出す実験的取り組みとして話題を呼びましたが、今回「Sora Turbo」という高速化モデルを搭載し、Sora.com(新たなインターフェース)上でChatGPT Plus/Proユーザー向けに本格的な利用が可能となりました。

Soraの特徴:①

もっとみる
Figma x Replit Agentでホームページ作成

Figma x Replit Agentでホームページ作成



今回は、デザインツール「Figma」とAI開発「Replit Agent」でUIを作成していきたいと思います。手順をそのまま載せるので非エンジニアでも簡単にできるのでチャレンジしてみてください。

ここでのやり方を真似すればこのようなウェブページが作れます👇

全く同じものが作れるわけではないのでご了承ください!

動きの動画👇

今回使用する生成AI👇

Figma(ワイヤーフレーム生

もっとみる
【サンプルコードあり】独自MCPサーバーでDisordとClaudeDescktopを接続する方法

【サンプルコードあり】独自MCPサーバーでDisordとClaudeDescktopを接続する方法

みなさん、最近Anthropic社が発表したMCPというプロトコルをご存じでしょうか?
MCP(Model Context Protocol)は、LLM(大規模言語モデル)と様々なデータやツールを簡単かつ安全に連携するための共通プロトコルです。これが実用化されることで、AIアシスタントが直接さまざまな社内データベースやクラウドサービス、外部APIなどにアクセスできるようになり、より高度な活用が可能

もっとみる