npaka

プログラマー。iPhone / Android / Unity / ROS / AI …

npaka

プログラマー。iPhone / Android / Unity / ROS / AI / AR / VR / RasPi / ロボット / ガジェット。年2冊ペースで技術書を執筆。アニソン / カラオケ / ギター / 猫 twitter : @npaka123

マガジン

  • 自然言語処理入門

    自然言語処理関係のノートをまとめました。

  • JavaScript入門

    JavaScript関連のノートをまとめました。

  • AR・VR・MR入門

    AR・VR・MR関連のノートをまとめました。

  • iOS・Androidアプリ開発入門

    iOSとAndroidのアプリ開発関連のノートをまとめました。

  • AIリリース年表

    AIリリース年表をまとめました。

最近の記事

  • 固定された記事

『Google Gemini 1.5/LlamaIndex/LangChain 人工知能プログラミング実践入門』 がまもなく発売になります。

『Google Gemini 1.5/LlamaIndex/LangChain 人工知能プログラミング実践入門』 がまもなく発売になります。 この本は、この本は、Googleの「Gemini」を活用して人間の仕事をサポートする「LLMアプリケーション」を開発するための入門書です。2024年5月末の「Gemini 1.5 Pro」「Gemini 1.5 Flash」の正式版リリースに対応しています。 対象読者は、次のとおりです。 「Gemini」は、Googleが開発した

    • Gen-3 Alpha プロンプトガイド

      以下の記事が面白かったので、簡単にまとめました。 1. Gen-3 Alpha プロンプトガイド「Gen-3 Alpha」は、Runwayが開発した最新の動画生成AIです。芸術的ビジョンに命を吹き込む無限の可能性を秘めています。シーンを伝える強力なプロンプトを作成することは、コンセプトに沿った動画を生成するための鍵になります。 この記事では、「Gen-3 Alpha」を使い始めるのに役立つ「プロンプト構造」「プロンプトキーワード」「ヒント」について説明します。これらは単な

      • 2024年6月のAIリリース年表

        2024年6月のAIリリース年表をまとめました。 2024年6月5日 【音楽生成AI】 Stable Audio Open 6月6日 【Google】 NotebookLM 多言語対応 6月6日 【音楽生成AI】 udio - Audio Uploads 6月7日 【動画生成AI】 KLING 6月10日 【Apple】Apple Intelligence 6月12日 【画像生成AI】 Stable Diffusion 3 Medium 6月12日 【動画生成A

        • LangGraph v0.1 と LangGraph Cloud の概要

          以下の記事が面白かったので、簡単にまとめました。 1. はじめに本日 (2024年6月27日)、「LangGraph v0.1」と「LangGraph Cloud」をリリースしました。 2. LangGraph v0.1「LangGraph」は、エージェントおよびマルチエージェントアプリケーションを構築するためのフレームワークです。エージェントとは、LLMがアプリケーションの制御フローを決定し、外部のデータや計算ソースに接続して複雑なタスクを自動化するシステムのことを指し

        • 固定された記事

        『Google Gemini 1.5/LlamaIndex/LangChain 人工知能プログラミング実践入門』 がまもなく発売になります。

        マガジン

        • 自然言語処理入門
          783本
        • JavaScript入門
          65本
        • iOS・Androidアプリ開発入門
          75本
        • AR・VR・MR入門
          92本
        • AIリリース年表
          12本
        • 強化学習入門
          109本

        記事

          Gemini API の Code Execution

          以下の記事が面白かったので、簡単にまとめました。 1. Code Eexecution「Code Execution」は、モデルがPythonコードを生成して実行することを可能にします。「Google AI Studio」や「Gemini API」で利用可能です。仮想マシン上でNumPyやSimPyなどのライブラリを使用できますが、追加のライブラリをインストールすることはできません。コード実行はモデルまたはリクエストレベルで有効化でき、チャットでも利用可能です。実行環境には

          Gemini API の Code Execution

          Gemma 2 の 概要

          以下の記事が面白かったので、簡単にまとめました。 1. Gemma 2本日 (2024年6月27日)、「Gemma 2」の9Bと27Bがリリースされました。第1世代よりもパフォーマンスが高く、推論の効率も高く、安全性が大幅に向上しています。 特徴は、次のとおりです。 2. Gemma 2 の統合「Gemma 2」は強力であるだけでなく、ワークフローに簡単に統合できるように設計されています。 「Gemma Cookbook」を参照してください。これは、「Gemma 2」

          Gemma 2 の 概要

          Next.jsのRoute HandlersでOpenAI APIのストリーミングを試す

          「Next.js」の「Route Handlers」でOpenAI APIのストリーミングを試したので、まとめました。 1. Next.js の Route Handlers「Next.js」の「Route Handler」は、APIエンドポイントを定義してリクエストを処理するための機能です。Next.js v13.2からの新機能で、バックエンドのロジックをサーバーレスな方法で実装することができます。 2. プロジェクトの準備プロジェクトの準備の手順は、次のとおりです。

          Next.jsのRoute HandlersでOpenAI APIのストリーミングを試す

          Chrome の Gemini Nano を試す

          「Chrome」の「Gemini Nano」を試したので、まとめました。 1. Chrome の Gemini Nano「Chrome」の「Gemini Nano」の早期アクセス版が使えるようになりました。 2. セットアップ(1)「Chrome Canary」をダウンロードして実行。 Chromeの早期アクセス版です。新しいウェブ技術やAPIをいち早く試すことができます。「Chrome Dev」(Canaryより安定) でも試しましたが、自分が試した環境 (Mac) と

          Chrome の Gemini Nano を試す

          Claude 3.5 Sonnet の概要

          以下の記事が面白かったので、簡単にまとめました。 1. Claude 3.5 Sonnet本日 (2024年6月21日)、「Claude 3.5 Sonnet」がリリースしました。これは、今後リリースされる「Claude 3.5」モデルファミリーの最初のリリースです。「Claude 3.5 Sonnet」は、インテリジェンスの業界標準を引き上げ、幅広い評価で競合モデルや「Claude 3 Opus」を上回り、中間層モデルである 「Claude 3 Sonnet」の速度とコス

          Claude 3.5 Sonnet の概要

          Ragas で LangChainのRAG評価 を試す

          「Ragas」でLangChainのRAG評価を試したので、まとめました。 1. Ragas「Ragas」は、「RAG」を評価するためのフレームワークです。 2. LangChainの準備LangChainの準備手順は、次のとおりです。 (1) パッケージのインストール。 # パッケージのインストール!pip install langchain==0.2.0!pip install langchain-openai!pip install langchain-chro

          Ragas で LangChainのRAG評価 を試す

          LangChain で RAGのハイブリッド検索 を試す

          「LangChain」でRAGのハイブリッド検索を試したので、まとめました。 1. RAGのハイブリッド検索「RAG」のハイブリッド検索は、複数の検索方法を組み合わせる手法で、主に「ベクトル検索」と「キーワード検索」を組み合わせて使います。 2. LangChainの準備LangChainの準備の手順は、次のとおりです。 (1) LangChainのパッケージのインストール。 # LangChainのパッケージのインストール!pip install langchain

          LangChain で RAGのハイブリッド検索 を試す

          Gemini API の Context Caching

          以下の記事が面白かったので、簡単にまとめました。 1. Context Caching「Context Caching」は、入力トークンをキャッシュして、後続リクエストでキャッシュされたトークンを参照することで、コストとレイテンシを低くおさせることができる機能です。 トークンをキャッシュに保存する時、キャッシュの保存期間「TTL」(time to live)を指定します。キャッシュの保存費用は、入力トークンのサイズとトークンの保持期間によって決まります。 「Contex

          Gemini API の Context Caching

          Luma Dream Machine プロンプトガイド

          以下の記事が面白かったので、簡単にまとめました。 1. Image to Video のプロンプトガイド・生成ページの画像アイコンをクリックして JPG、JPEG、PNG画像をアップロードします。シーンを説明するプロンプトを提供することもできます。 ・「Enhance Prompt」を有効にすると、シーンで何が起きてほしいかを説明するだけで済みます。 ・希望する出力が得られない場合は、「Enhance prompt」なしで試すことができます。この場合、画像とシーンで何が

          Luma Dream Machine プロンプトガイド

          WWDC24 の visionOS の セッションまとめ

          「WWDC24」の「visionOS」のセッション をまとめました。 1. 優れたvisionOSアプリの設計没入感を取り入れ、目と手に合わせて設計し、奥行き、スケール、空間を活用して、魅力的な空間コンピューティングアプリを作成する方法を学びます。優れたvisionOSアプリの例をいくつか紹介し、そのデザイナーがプラットフォームの新しい体験を作成するためにどのようにアプローチしたかを探ります。 2. visionOSのオブジェクトトラッキングオブジェクトトラッキングを使用

          WWDC24 の visionOS の セッションまとめ

          React Native Paper の使い方

          「React Native Paper」の使い方をまとめました。 前回1. React Native Paper「React Native Paper」は、「React Native」のUIライブラリのひとつです。デフォルトでGoogleのマテリアルデザインガイドラインに準拠します。 2. React Native Paper の使い方「React Native Paper」の使い方の手順は次のとおりです。 2-1. セットアップ (1) React Nativeプロ

          React Native Paper の使い方

          diffusers での Stable Diffusion 3 の使い方

          以下の記事が面白かったので、簡単にまとめました。 1. Stable Diffusion 3「SD3」は、3つの異なるテキストエンコーダー (CLIP L/14、OpenCLIP bigG/14、T5-v1.1-XXL)、新しい MMDiT (Multimodal Diffusion Transformer)、および「Stable Diffusion XL」に類似した16チャネルAutoEncoderで構成される潜在拡散モデルです。 「SD3」は、テキスト入力とピクセル潜

          diffusers での Stable Diffusion 3 の使い方