Masayuki Abe

最新の海外のAI事例を、ChatGPT、AI、Generative AI、GitHub…

Masayuki Abe

最新の海外のAI事例を、ChatGPT、AI、Generative AI、GitHub、Hugging Faceなどから実際に手を動かしてから紹介しています。記事作成の励みになりますので、フォロー頂ければ幸いです。

マガジン

  • InfraGPTの構築記録

    InfraGPTを構築しています。Linux系を中心に、自然言語でLinuxサーバに関する主要操作をするウェブアプリの開発をしています。当面はLinuxサーバ系を中心にしており、Windows Server系も自然言語操作を目指しています。

  • Google AI系記事

最近の記事

ベクトル検索(Chroma)を使ってみる

Chromaの紹介今回は、Chromaを使ってテキストベースと画像ベースの検索について紹介していきます。 1年ほど前に、ベクトル検索としてChromaの記事を書きました。 1年前と比べてみると、あまり大幅なアップデートは無いように見えましたが、テキストと画像ベースの検索方法がGoogle Colabを利用して紹介されていますので興味を持ちました。 また、今回は記事にはしていませんが、Chromaはここ1年ほどLangchainやLlamaIndexなどのツールへの統合

    • 今から始めるGitHub Copilot

      GitHub Copilotの紹介GitHub Copilotは、AI(人工知能)を利用したプログラミングアシスタントです。 コードの作成、既存のコードの理解、新しいコードの提案など、様々なタスクを支援します。 OpenAIのGPT-4モデルを使用しており、多くのプログラミング言語とフレームワークをサポートしています。 前提として、GitHubでアカウントを持っているところから話をします。 最初に、GitHubのサイトにアクセスします。 次に、右上のところのSet

      • DockerをGoogle Colabで動かす方法

        udockerの紹介udockerは、Docker コンテナをroot権限なしで実行できるツールです。 主な特徴 非特権ユーザーでの実行: udockerは、特権昇格なしにコンテナを実行することができます。これにより、セキュリティリスクを低減しながら、多くのユーザーが自由にコンテナを使用できるようになります。 互換性: udockerは、Dockerコンテナイメージと互換性があります。Docker Hub などからイメージをプルして、udockerで実行することが可

        • 今から始めるAnthoropicのClaude(※ChatGPTみたいなもの)

          AnthoropicのClaudeの紹介AmazonがAnthoropicに巨額の投資をしたということで話題になっています。ちらほらとClaude(クロード)の記事も目にすることが増えたので、私も記事を書いてみます。 AnthorpicのClaudeが出た当時は、利用範囲がアメリカしか登録できなかったですが、今は日本でも登録できるようになっています。 左側にあるTalk to Claudeをクリックします。 名前などを入力して、感覚的に答えていけば、うまく行くように思

        ベクトル検索(Chroma)を使ってみる

        マガジン

        • InfraGPTの構築記録
          6本
        • Google AI系記事
          18本

        記事

          ローカルLLMを動かすOllamaをGoolge Colabで動かす方法

          Ollamaの紹介Ollamaとは、ローカルLLMをローカル環境で動かすためのコマンドツールです。今回、Google ColabでOllamaを動かす方法を見つけましたので、紹介していきます。 こちらの記事を参考にさせて頂きました。 OllamaをGoogle Colabで動かす方法今回は、Google Colabで、ランタイムはTPUv2を選択します。ローカルLLMはllama3を使用します。 !curl https://ollama.ai/install.sh |

          ローカルLLMを動かすOllamaをGoolge Colabで動かす方法

          ChatVRMでVOICEBOXを使う方法

          無料音声のVOICEBOXを使うことができるChatVRMのプロジェクトをGitHubで見つけたので紹介していきます。 無料のVOICEBOXを使うことが出来るので、音声に関するAPIはお金がかかりません。 ChatVRMの使い勝手がかなり良くなっています。 今回、記事の参考にしています。 こちらの方が作られている下記のnike-ChatVRMを利用しています。 今回は、OpenAIのAPIキーを利用して、ChatVRMで音声はVoiceBoxを利用します。 Op

          ChatVRMでVOICEBOXを使う方法

          リニューアルされたOpenAIのサイトを眺めてみる

          OpenAIのサイトが大幅なリニューアルされています。 エンタープライズ向けのAIプラットフォームとしてですが、OpenAIの戦略?あるいはサービスラインナップの概念が見えますね。これが今回のサイトリニューアルで一番重要な情報な気がします。前からあったかも? ざっと見てみた感じは、AIにおけるフェーズが変わってきたのかなと思います。 今までは、アーリーアダプターやアーリーマジョリティの一部の先進技術に興味のある層を対象としてきたが、今後はアーリーマジョリティ、レイトマジ

          リニューアルされたOpenAIのサイトを眺めてみる

          LLM付きの検索エンジンの構築方法

          Perplexicaの紹介PerplexicaというLLMを利用した検索エンジンの紹介をします。名前からしてPerplexity.AIをフリーコードで作成したプロジェクトとなります。Perplexity.AIみたく自然言語での質問に対して、検索結果を表示してくれます。 今回面白いなと思ったのは、OpenAIのAPIを使ったり、オープンソースのLLMを使い、検索をすることができるからです。また、searXNGという使われているオープンソースのメタ検索エンジンに興味を持ったの

          LLM付きの検索エンジンの構築方法

          Winny開発者の金子勇氏のED法はAIに変革を起こすのか?

          最近、AmazonPrimeで映画Winnyを見ました。そんな時、技術ブログサイトの代表格のQiitaで、金子勇氏のED法がBP法というAIのアルゴリズムに変革を促すのではないかと話題になっています。次々とED法にチャレンジしている記事が登場しています。 20年以上前、ChatGPTのような先進的な技術がまだ知られていない時代に考案され、論文などに記録されることなく忘れ去られていたED法について、今、有志たちがAIにおける可能性を探っています。この試みになんか胸が熱くなりま

          Winny開発者の金子勇氏のED法はAIに変革を起こすのか?

          高速AIチップで話題のGroqのAPIをStreamlitで使う方法

          Groq社の紹介Groqとは、高速なLPU(Language Processing Unit)を開発しているアメリカ系のベンチャー企業です。株式は公開されていませんが、Meta社のLlama3リリースタイミングで、Llama3を取り込んだGroqChatにより、高速な言語処理能力を見せつけて、Twitterやテック系記事で取り上げられています。 Groqの紹介記事やGroqChat、GroqのAPIキーの取得方法について、以前記事を書いたので興味があるなら参考にしてみてく

          高速AIチップで話題のGroqのAPIをStreamlitで使う方法

          ChatGPT登場時と同じような衝撃を受けたgroqを調べてみた

          groqとは?groqとは、言語モデル処理に特化したLPU(Language Processing Unit)を開発している会社です。 このLPUを使用することにより大規模言語モデルの応答速度が格段に速くなります。 その結果、ユーザはレスポンスの待ち時間を意識することなく大規模言語モデルを使用することができるようになります。 groqは、そのLPUを使用したgroq.comというChatGPTに似たサイトであるGroqChatを提供しています。 GroqChatの使

          ChatGPT登場時と同じような衝撃を受けたgroqを調べてみた

          MetaのLlama3を眺めてみる

          Hugging FaceにおけるLlama3の紹介2024年4月18日に、MetaよりFacebookの会社より、Llama3がリリースされました。オープン系の大規模言語モデルでは、Meta社のLlama2をベースにファインチューニングされているLLMが性能評価でも結果を残しているので、Llama2の後継のLlama3は期待度が高いです。 Hugging FaceにおけるLlama3の情報を眺めていきます。 Llama3は、80億パラメータと700億パラメータのバージョ

          MetaのLlama3を眺めてみる

          ゼロから始める自作LLM

          イントロダクション今回は、オズの魔法使いの文章をベースに自作LLMをGoogle Colabで作成していきます。LLMのベースとなる学習データがオズの魔法使いという非常に少ない文章量のため、実行結果は期待されているほどにはなりません。しかし、ゼロからLLMを作成してみるという経験を積むには良いと考えてます。 今回は、こちらのコードを参考にさせて頂きました。 コード説明今回は、Google ColabのA100かV100で実行します。それ以外だと計算に時間がかかりすぎてしま

          ゼロから始める自作LLM

          ストリートファイター3をプレイするのにOpenAIの最強の言語モデルは?

          OpenAI言語モデルがストリートファイター3をプレイしたら? gpt-3.5-turbo-16kのモデルが一番強かったです。 以前、ストリートファイター3で言語モデル同士を戦わせる方法を記事にしました。自分でも実施してみたいと思う人は、この記事を参考にしてください。 今回は、OpenAIの言語モデル同士でストリートファイター3で戦わせていきます。今回登場するOpenAIの言語モデルは以下です。 gpt-4-turbo gpt-4 gpt-3.5-turbo

          ストリートファイター3をプレイするのにOpenAIの最強の言語モデルは?

          AIで画像からショート動画を作ろう

          SadTalkerの紹介SadTalkerという画像1枚から用意した音声をベースに動く動画を作成してくれるGitHubのプロジェクトを紹介していきます。今回作成するのは、次のようなショート動画を1枚の画像から作成してきます。 SadTalkerのGitHubのプロジェクトは、こちらです。 テンセント、アントの人らが作ったGitHubプロジェクトとなります。 SadTalkerの使い方GitHubプロジェクトのところに、Google Colabのコードがありますので、こ

          AIで画像からショート動画を作ろう

          OpenAIのSoraに対抗しているOpen Sora Planを使ってみた

          Open Sora PlanのGitHubプロジェクトの紹介OpenAIが自然言語から動画を作成するモデルSoraのプレスリリースをして世間を驚かせましたが、いつ頃出てくるのかはまだ発表されていません。そんな中、オープンソースで自然言語から動画を作成するプロジェクトがGitHubにありましたので紹介していきます。今回の成果物は次のような動画です。 Open Sora Planの使い方今回は、Open Sora PlanのGitHubプロジェクトに、Google Cola

          OpenAIのSoraに対抗しているOpen Sora Planを使ってみた