npaka

プログラマー。iPhone / Android / Unity / ROS / AI …

npaka

プログラマー。iPhone / Android / Unity / ROS / AI / AR / VR / RasPi / ロボット / ガジェット。年2冊ペースで技術書を執筆。アニソン / カラオケ / ギター / 猫 twitter : @npaka123

マガジン

  • 自然言語処理入門

    自然言語処理関係のノートをまとめました。

  • iOS・Androidアプリ開発入門

    iOSとAndroidのアプリ開発関連のノートをまとめました。

  • JavaScript入門

    JavaScript関連のノートをまとめました。

  • AIリリース年表

    AIリリース年表をまとめました。

  • AR・VR・MR入門

    AR・VR・MR関連のノートをまとめました。

最近の記事

  • 固定された記事

【Gemini本発売記念】npaka による マルチモーダルとローカルLLMの現在と未来

『Google Gemini 1.5/LlamaIndex/LangChain 人工知能プログラミング実践入門』の出版記念イベントを開催させていただくことになりました。 この本は、Googleの「Gemini」を活用して人間の仕事をサポートする「LLMアプリケーション」を開発するための入門書です。2024年5月にリリースされた「Gemini 1.5 Pro」は、6月現在の Chatbot Arena リーダーボードの日本語性能のランキングで1位を獲得しています。 出版記念

    • diffusers での Stable Diffusion 3 の使い方

      以下の記事が面白かったので、簡単にまとめました。 1. Stable Diffusion 3「SD3」は、3つの異なるテキストエンコーダー (CLIP L/14、OpenCLIP bigG/14、T5-v1.1-XXL)、新しい MMDiT (Multimodal Diffusion Transformer)、および「Stable Diffusion XL」に類似した16チャネルAutoEncoderで構成される潜在拡散モデルです。 「SD3」は、テキスト入力とピクセル潜

      • HuggingFace Diffusers v0.29.0の新機能

        「Diffusers v0.29.0」の新機能についてまとめました。 前回 1. Diffusers v0.29.0 のリリースノート情報元となる「Diffusers 0.29.0」のリリースノートは、以下で参照できます。 2. Stable Diffusion 3「Stable Diffusion 3」は、Stability AIが開発した最新の画像生成AIモデルです。「Scaling Rectified Flow Transformers for High-Resol

        • Apple の Private Cloud Compute の概要

          Apple の「Private Cloud Compute」の概要をまとめました。 1. Private Cloud Compute「Apple Intelligence」は、iPhone、iPad、Macに強力な生成モデルをもたらすパーソナルインテリジェンスシステムです。このシステムで複雑な推論が必要な場合のために、AppleではプライベートAI処理専用に設計されたクラウドインテリジェンスシステム「Private Cloud Compute」(PCC) を開発しました。P

        • 固定された記事

        【Gemini本発売記念】npaka による マルチモーダルとローカルLLMの現在と未来

        マガジン

        • 自然言語処理入門
          772本
        • iOS・Androidアプリ開発入門
          73本
        • JavaScript入門
          63本
        • AIリリース年表
          12本
        • AR・VR・MR入門
          91本
        • 強化学習入門
          109本

        記事

          Apple Intelligence の機能

          「Apple Intelligence」の機能をまとめました。 1. Apple Intelligence「Apple Intelligence」は、iPhone、iPad、Macに強力な生成モデルを組み込み、ユーザーのコミュニケーション、作業、自己表現をサポートするパーソナルインテリジェンスシステムです。これら「Apple Intelligence」の機能をアプリに組み込むことができます。 2. Writing Tools「Writing Tools」はシステム全体で利

          Apple Intelligence の機能

          Appleのオンデバイス・サーバー基盤モデルの概要

          以下の記事が面白かったので、簡単にまとめました。 1. はじめにWWDC24で、iOS 18、iPadOS 18、macOS Sequoia に統合されたパーソナルインテリジェンスシステム「Apple Intelligence」を発表しました。「Apple Intelligence」は、ユーザーの日常的なタスクに特化した複数の高性能生成モデルで構成されており、現在のアクティビティに即座に適応できます。組み込まれている基盤モデルは、テキストの作成と調整、通知の優先順位付けと要

          Appleのオンデバイス・サーバー基盤モデルの概要

          React Nativeの AsyncStorage の使い方

          「React Native」の「AsyncStorage」の使い方をまとめました。 前回1. AsyncStorage「AsyncStorage」は、アプリケーション内でキーとバリューのペアを非同期的に保存および取得するためのAPIです。 2. データの読み書き(1) React Nativeプロジェクトの生成。 npx react-native init my_appcd my_app (2) パッケージのインストール。 npm install @react-na

          React Nativeの AsyncStorage の使い方

          react-native-fs の使い方

          「react-native-fs」の使い方をまとめました。 前回1. react-native-fs「react-native-fs」は、React Nativeアプリからネイティブファイルシステムにアクセスするためのライブラリです。 2. ファイルの読み書き(1) React Nativeプロジェクトの生成。 npx react-native init my_appcd my_app (2) パッケージのインストール。 npm install react-nati

          react-native-fs の使い方

          react-native-share の使い方

          「react-native-share」の使い方をまとめました。 前回1. react-native-share「react-native-share」は、React Nativeアプリにアプリ間共有を追加するためのライブラリです。 2. アプリからデータを送信2-1. セットアップ (1) React Nativeプロジェクトの生成。 npx react-native init my_appcd my_app (2) パッケージのインストール。 npm inst

          react-native-share の使い方

          最近話題の AI搭載の人型ロボット まとめ

          最近話題のAI搭載の人型ロボットをまとめました。 1. Tesla - Optimus2. Boston Dynamics - Atlas3. Figure - Figure 014. Agility - Digit5. Engineered Arts - Ameca6. 1x - Neo7. Unitree - Unitree H18. Fourier Intelligence - GR-19. Sanctuary AI - Phoenix

          最近話題の AI搭載の人型ロボット まとめ

          3D Gaussian Splatting Converter の使い方

          「3D Gaussian Splatting Converter」の使い方をまとめました。 1. 3D Gaussian Splatting Converter「3D Gaussian Splatting Converter」は、3DGS形式のPLYファイルと CloudCompare形式のPLYファイルを相互変換するツールです。 2. 主な機能「3D Gaussian Splatting Converter」の主な機能は、次のとおりです。 3. インストールPytho

          3D Gaussian Splatting Converter の使い方

          react-three-fiber のはじめ方

          「react-three-fiber」のはじめ方をまとめました。 前回1. react-three-fiber「react-three-fiber」は「three.js」用のReactレンダラーです。 2. エコシステム「react-three-fiber」の周りには、ライブラリ、ヘルパー、抽象化など活気に満ちた広範なエコシステムがあります。 3. Reactプロジェクトの準備Reactプロジェクトの準備手順は、次のとおりです。 (1) Reactプロジェクトの生成。

          react-three-fiber のはじめ方

          Reactフック まとめ

          「Reactフック」についてまとめました。サンプルはReact Nativeで記述してます。 1. Reacteフック「Reactフック」は、Reactの関数コンポーネントで状態管理やライフサイクルを利用するためのAPIです。フックはReact 16.8で導入され、クラスコンポーネントの代わりに関数コンポーネントを使用することを可能にし、コードをより簡潔でスマートに記述できるようになりました。 2. Stateフック状態をコンポーネントに記憶させることができます。状態の初

          Reactフック まとめ

          react-native-vision-camera の使い方

          「react-native-vision-camera」の使い方をまとめました。 前回1. react-native-vision-camera「react-native-vision-camera」は、React Native用のカメラライブラリです。機能は次のとおりです。 2. カメラの使用手順カメラの使用手順は、次のとおりです。 (1) パッケージのインストール。 $ npm install react-native-vision-camera$ cd ios$

          react-native-vision-camera の使い方

          Google Colab で EasyAnimate を試す

          「Google Colab」で「EasyAnimate」を試したのでまとめました。 1. EasyAnimate「EasyAnimate」は、高解像度で長い動画を生成するためのエンドツーエンドのソリューションです。transformerベースの拡散発生器を学習し、長い動画を処理するためのVAEを学習し、メタデータを前処理することができます。 Soraのような構造とDITに基づいて、動画生成用のdiffuserとしてtransformerを使用しています。モーションモジュー

          Google Colab で EasyAnimate を試す

          Google Colab で ToonCrafter を 試す

          「ToonCrafter」を試したので、まとめました。 1. ToonCrafter「ToonCrafter」は、事前学習されたImage-to-Videoの拡散事前確率を利用して、2つのアニメ画像を補間します。 ・ショーケース (512x320) ・スパーススケッチガイダンス 動いてる様子は公式ページ参照。 2. Colabでの実行Colabでの実行手順は、次のとおりです。 (1) 「camenduru/ToonCrafter-jupyter」のColabノート

          Google Colab で ToonCrafter を 試す