npaka

プログラマー。iPhone / Android / Unity / ROS / AI …

npaka

プログラマー。iPhone / Android / Unity / ROS / AI / AR / VR / RasPi / ロボット / ガジェット。年2冊ペースで技術書を執筆。アニソン / カラオケ / ギター / 猫 twitter : @npaka123

マガジン

  • 自然言語処理入門

    自然言語処理関係のノートをまとめました。

  • iOS・Androidアプリ開発入門

    iOSとAndroidのアプリ開発関連のノートをまとめました。

  • 強化学習入門

    強化学習関連のノートをまとめました。

  • AR・VR・MR入門

    AR・VR・MR関連のノートをまとめました。

  • AIリリース年表

    AIリリース年表をまとめました。

記事一覧

固定された記事

『OpenAI GPT-4V/ChatGPT/GPTs 人工知能プログラミング実践入門』 が発売になりました。

『OpenAI GPT-4V/ChatGPT/GPTs 人工知能プログラミング実践入門』が発売になります。技術アップデートが早すぎることもあり、PDFおよびamazonプリント・オン・デマンド …

npaka
3か月前
86

PaliGemma の概要

以下の記事が面白かったので、簡単にまとめました。 1. PaliGemma「PaliGemma」は、画像エンコーダーとしての「SigLIP-So400m」とテキスト デコーダーとしての「Gemma-2B…

npaka
1日前
15

LangChainのパートナーパッケージ langchain-huggingface の概要

以下の記事が面白かったので、簡単にまとめました。 1. langchain-huggingface「LangChain」のHuggingFace関連のクラスはすべてコミュニティによってコーディングされてお…

npaka
1日前
16

Android の Google AI の新機能まとめ

以下の記事が面白かったので、簡単にまとめました。 1. Circle to Search - 生徒の宿題サポート「Circle to Search」は、Androidの新しい検索機能です。画面上のオブジェ…

npaka
1日前
12

Gemini 1.5 Pro のアップデート ・ Gemini 1.5 Flash ・ PaliGemma ・ Gemma 2

以下の記事が面白かったので、簡単にまとめました。 1. はじめに昨年12月、「Gemini 1.0」をリリースし、「Gemini API」を「Google AI Studio」および「Vertex AI」で利用…

npaka
1日前
70

React Native のアプリのビルド手順

「React Native」のアプリのビルド手順をまとめました。 前回1. EAS1-1. EASの概要 「EAS」(Expo Application Services) は、Expoプラットフォーム上で動作するアプリケ…

npaka
2日前
10

GPT-4o の概要

以下の記事が面白かったので、簡単にまとめました。 1. GPT-4o「GPT-4o」 (「omni」の「o」) は、人間とコンピュータのより自然な対話に向けた一歩です。テキスト、音声、…

npaka
2日前
737

React Native クイックスタートガイド

「React Native」のアプリの作成手順をまとめました。 1. React Native「React Native」は、Metaによって開発されたオープンソースのモバイルアプリケーションフレームワ…

npaka
3日前
24

OpenAI の Model Spec の概要

以下の記事が面白かったので、簡単にまとめました。 Exampleは省略してるので元記事で確認してください。 1. Model Spec の概要1-1. Model Spec の概要 これは「Model Sp…

npaka
4日前
51

LangChain v0.2 の概要

以下の記事が面白かったので、簡単にまとめました。 1. LangChain v0.2「LangChain v0.2」は v0.1 上に構築されており、コミュニティからのフィードバックが組み込まれて…

npaka
5日前
45

Google Colab で 属性予測モデル KARAKURI LM 7B APM v0.1 を試す

「Google Colab」で属性予測モデル「KARAKURI LM 7B APM v0.1」を試したので、まとめました。 1. KARAKURI LM 7B APM v0.1「KARAKURI LM 7B APM v0.1」は、属性予測モデ…

npaka
8日前
27

Dify で RAG を試す

「Dify」で「RAG」を試したので、まとめました。 前回1. RAG「RAG」(Retrieval Augmented Generation) は、最新の外部知識の習得とハルシネーションの軽減という、LLMの2…

npaka
11日前
229

Dify の ワークフロー の概要

以下の記事が面白かったので、簡単にまとめました。 1. ワークフロー1-1. ワークフロー 「ワークフロー」は、複雑なタスクを小さな「ノード」に分割することで、LLMアプ…

npaka
12日前
230

iOS・Android の ローカルLLM実行環境まとめ

iOS・Android の ローカルLLMの実行環境をまとめました。 1. iOS1-1. Llama.cpp (gguf) 「Llama.cpp」の「example/llama.swiftui」で、iOSでggufを実行するプロジェクト…

npaka
2週間前
69

mergekit-evolve のパラメータまとめ

以下の記事が面白かったので、簡単にまとめました。 1. mergekit-evolve「mergekit-evolve」は、進化的アルゴリズム (CMA-ES) を使用して、モデル メトリックに対してマー…

npaka
2週間前
15

Google Colab で mergekit-evolve による 進化的モデルマージ を試す

「Google Colab」で「mergekit-evolve」による「進化的モデルマージ」を試したので、まとめました。 1. mergekit-evolve「Google Colab」で「mergekit-evolve」による進化…

npaka
2週間前
27
『OpenAI GPT-4V/ChatGPT/GPTs 人工知能プログラミング実践入門』 が発売になりました。

『OpenAI GPT-4V/ChatGPT/GPTs 人工知能プログラミング実践入門』 が発売になりました。

『OpenAI GPT-4V/ChatGPT/GPTs 人工知能プログラミング実践入門』が発売になります。技術アップデートが早すぎることもあり、PDFおよびamazonプリント・オン・デマンド と Kindle での販売になります。

この本は、「GPT-4V」「ChatGPT」「GPTs」を活用して人間の仕事をサポートする「チャットAI」を開発するための入門書です。
2023年11月の「Open

もっとみる
PaliGemma の概要

PaliGemma の概要

以下の記事が面白かったので、簡単にまとめました。

1. PaliGemma「PaliGemma」は、画像エンコーダーとしての「SigLIP-So400m」とテキスト デコーダーとしての「Gemma-2B」で構成されるアーキテクチャを備えたビジョン言語モデルです。「SigLIP」は画像と文字の両方を理解できる最先端のモデルです。「CLIP」と同様に、共同で学習された画像とテキストのエンコーダーで構

もっとみる
LangChainのパートナーパッケージ langchain-huggingface の概要

LangChainのパートナーパッケージ langchain-huggingface の概要

以下の記事が面白かったので、簡単にまとめました。

1. langchain-huggingface「LangChain」のHuggingFace関連のクラスはすべてコミュニティによってコーディングされており、これで成功しましたが、時間の経過とともに、内部関係者の視点が欠如しているため、一部のクラスは非推奨になりました。

パートナーパッケージになることで、HuggingFace エコシステムで利

もっとみる
Android の Google AI の新機能まとめ

Android の Google AI の新機能まとめ

以下の記事が面白かったので、簡単にまとめました。

1. Circle to Search - 生徒の宿題サポート「Circle to Search」は、Androidの新しい検索機能です。画面上のオブジェクトやテキストを指で円を描いたり線を引いたりするだけで、そのコンテンツに関連する検索結果を表示できます。

本日より、「Circle to Search」が生徒の宿題をサポートしました。携帯電話

もっとみる
Gemini 1.5 Pro のアップデート ・ Gemini 1.5 Flash ・ PaliGemma ・ Gemma 2

Gemini 1.5 Pro のアップデート ・ Gemini 1.5 Flash ・ PaliGemma ・ Gemma 2

以下の記事が面白かったので、簡単にまとめました。

1. はじめに昨年12月、「Gemini 1.0」をリリースし、「Gemini API」を「Google AI Studio」および「Vertex AI」で利用できるようにしました。2月に、100万トークンのコンテキストウィンドウを備えた最初のモデルである「Gemini 1.5 Pro」をリリースしました。先月、ネイティブ音声理解、システム指示、

もっとみる
React Native のアプリのビルド手順

React Native のアプリのビルド手順

「React Native」のアプリのビルド手順をまとめました。

前回1. EAS1-1. EASの概要

「EAS」(Expo Application Services) は、Expoプラットフォーム上で動作するアプリケーションの開発、ビルド、デプロイを支援する一連のクラウドサービスです。

1-2. EASの主なサービス

主なサービスは、次のとおりです。

1-3. ビルドの種類

「Re

もっとみる
GPT-4o の概要

GPT-4o の概要

以下の記事が面白かったので、簡単にまとめました。

1. GPT-4o「GPT-4o」 (「omni」の「o」) は、人間とコンピュータのより自然な対話に向けた一歩です。テキスト、音声、画像のあらゆる組み合わせを入力として受け入れ、テキスト、音声、画像の出力のあらゆる組み合わせを生成します。 音声入力にはわずか232ミリ秒 (平均320ミリ秒) で応答できます。これは、人間の会話における応答時間と

もっとみる
React Native クイックスタートガイド

React Native クイックスタートガイド

「React Native」のアプリの作成手順をまとめました。

1. React Native「React Native」は、Metaによって開発されたオープンソースのモバイルアプリケーションフレームワークです。このフレームワークを使用することで、開発者はJavaScriptでiOSとAndroidの両方のプラットフォームで動作するネイティブアプリケーションを共通のコードベースから構築することが

もっとみる
OpenAI の Model Spec の概要

OpenAI の Model Spec の概要

以下の記事が面白かったので、簡単にまとめました。
Exampleは省略してるので元記事で確認してください。

1. Model Spec の概要1-1. Model Spec の概要

これは「Model Spec」の最初のドラフトであり、OpenAI APIおよびChatGPTでのモデルの望ましい動作を指定する文書です。これには、一連の中核目標と、矛盾する目標や指示に対処する方法に関するガイダン

もっとみる
LangChain v0.2 の概要

LangChain v0.2 の概要

以下の記事が面白かったので、簡単にまとめました。

1. LangChain v0.2「LangChain v0.2」は v0.1 上に構築されており、コミュニティからのフィードバックが組み込まれています。

完全な v0.2 は数週間以内に公開されます。

2. langchain と langchain-community の完全な分離「LangChain v0.2」での最も注目すべき変更点の

もっとみる
Google Colab で 属性予測モデル KARAKURI LM 7B APM v0.1 を試す

Google Colab で 属性予測モデル KARAKURI LM 7B APM v0.1 を試す

「Google Colab」で属性予測モデル「KARAKURI LM 7B APM v0.1」を試したので、まとめました。

1. KARAKURI LM 7B APM v0.1「KARAKURI LM 7B APM v0.1」は、属性予測モデルです。「Gemma 7B」のファイチューニングモデルになります。

学習データセットは、次の2つです。

2. 属性属性の値は 0(最低)〜4(最高)

もっとみる
Dify で RAG を試す

Dify で RAG を試す

「Dify」で「RAG」を試したので、まとめました。

前回1. RAG「RAG」(Retrieval Augmented Generation) は、最新の外部知識の習得とハルシネーションの軽減という、LLMの2つの主要課題に対処するためのフレームワークです。開発者はこの技術を利用して、AI搭載のカスタマーボット、企業知識ベース、AI検索エンジンなどをコスト効率よく構築できます。これらのシステム

もっとみる
Dify の ワークフロー の概要

Dify の ワークフロー の概要

以下の記事が面白かったので、簡単にまとめました。

1. ワークフロー1-1. ワークフロー

「ワークフロー」は、複雑なタスクを小さな「ノード」に分割することで、LLMアプリケーションのモデル推論への依存を減らし、システムの説明可能性、安定性、耐障害性を向上させます。

「ワークフロー」の種類は、次のとおりです。

1-2. Chatflow

自然言語入力におけるユーザー意図認識の複雑さに対処

もっとみる
iOS・Android の ローカルLLM実行環境まとめ

iOS・Android の ローカルLLM実行環境まとめ

iOS・Android の ローカルLLMの実行環境をまとめました。

1. iOS1-1. Llama.cpp (gguf)

「Llama.cpp」の「example/llama.swiftui」で、iOSでggufを実行するプロジェクトが提供されています。モデルはHuggingFaceの「TheBloke」「mmnga」などで数多く提供されています。ただし、メモリ制限のため小サイズのモデルに

もっとみる
mergekit-evolve のパラメータまとめ

mergekit-evolve のパラメータまとめ

以下の記事が面白かったので、簡単にまとめました。

1. mergekit-evolve「mergekit-evolve」は、進化的アルゴリズム (CMA-ES) を使用して、モデル メトリックに対してマージのパラメータを最適化するスクリプトです。これは、「SakanaAI」の「Evolutionary Optimization of Model Merging Recipes」、特にパラメータ空

もっとみる
Google Colab で mergekit-evolve による 進化的モデルマージ を試す

Google Colab で mergekit-evolve による 進化的モデルマージ を試す

「Google Colab」で「mergekit-evolve」による「進化的モデルマージ」を試したので、まとめました。

1. mergekit-evolve「Google Colab」で「mergekit-evolve」による進化的モデルマージを試します。うみゆきさんのコードを参考にさせてもらいつつ、実行環境 Colab + 評価者 Gemini で試してみました。

2. Colabでの実行

もっとみる