npaka

プログラマー。iPhone / Android / Unity / ROS / AI …

npaka

プログラマー。iPhone / Android / Unity / ROS / AI / AR / VR / RasPi / ロボット / ガジェット。年2冊ペースで技術書を執筆。アニソン / カラオケ / ギター / 猫 twitter : @npaka123

マガジン

  • iOS・Androidアプリ開発入門

    iOSとAndroidのアプリ開発関連のノートをまとめました。

  • 自然言語処理入門

    自然言語処理関係のノートをまとめました。

  • AIリリース年表

    AIリリース年表をまとめました。

  • JavaScript入門

    JavaScript関連のノートをまとめました。

  • AR・VR・MR入門

    AR・VR・MR関連のノートをまとめました。

記事一覧

React Native で iOSのアプリ内課金 を試す

「React Native」で「iOSのアプリ内課金」を試したのでまとめました。 前回1. アプリ内課金「アプリ内課金」の種類は、次の3つです。 1-1. 消耗型 料金を​支払って​獲…

npaka
13時間前
8

React Native の アプリ作成から App Store Connect での内部テストまでの流れ

「React Native」のアプリ作成から「App Store Connect」での内部テストまでの流れをまとめました。 前回1. React Native アプリの作成「React Native」アプリの作成手順…

npaka
1日前
13

React Native で Androidのアプリ内課金 を試す

「React Native」で「Android のアプリ内課金」を試したのでまとめました。 前回1. アプリ内課金「アプリ内課金」の種類は、次の3つです。 1-1. 消費型 料金を​支払っ…

npaka
1日前
14

React Native の アプリ作成から Google Play Console での内部テストまでの流れ

「React Native」のアプリ作成から「Google Play Console」での内部テストまでの流れをまとめました。 前回1. React Native アプリの作成「React Native」アプリの作成手…

npaka
1日前
15

Google Colab で CogVideoX の Image-to-Video と Video-to-Video を試す

「Google Colab」で「CogVideoX」の Image-to-Video と Video-to-Video を試したのでまとめました。 1. CogVideoX「CogVideoX」は、「Zhipu AI」が開発した動画生成AIです…

npaka
2日前
16

LangChain v0.3 の変更点

以下の記事が面白かったので、簡単にまとめました。 1. LangChain v0.3 の変更点1-1. Python 1-2. JavaScript 2. LangChain v0.2の開発中の改善点3. 最新バージョンへの…

npaka
4日前
21

LangChain v0.3 クイックスタートガイド - Python版

Python版の「LangChain」のクイックスタートガイドをまとめました。 1. LangChain「LangChain」は、「大規模言語モデル」 (LLM : Large language models) と連携するアプ…

npaka
7日前
49

DataGemma の概要

以下の記事が面白かったので、簡単にまとめました。 1. DataGemma今日のAIイノベーションを支えるLLMは、ますます高度化しています。これらのモデルは、膨大なテキストを…

npaka
8日前
58

OpenAI o1 の APIの使い方

以下の記事が面白かったので、簡単にまとめました。 1. OpenAI o1「OpenAI o1」シリーズは、複雑な推論を行うために強化学習を用いて学習された新しい大規模言語モデルで…

npaka
10日前
132

OpenAI o1 の概要

以下の記事が面白かったので、簡単にまとめました。 1. OpenAI o1「OpenAI o1」は、応答する前により多くの時間をかけて思考するように設計された新しいAIモデルシリーズ…

npaka
10日前
51

Google Colab で Pixtral-12B を試す

「Google Colab」で「Pixtral-12B」を試したのでまとめました。 1. Pixtral-12B「Pixtral-12B」は、Mistralが開発した初のマルチモーダルモデルです。 特徴は、次のとおり…

npaka
10日前
20

HuggingFace の speech-to-speech を試す

「HuggingFace」の「speech-to-speech」を試したのでまとめました。 1. speech-to-speech「Hugging Face」の「speech-to-speech」は、ローカルで音声認識、応答生成、音声…

npaka
12日前
29

Llama.cpp で Command-R-plus-08-2024 を試す

「Llama.cpp」で「Command-R-plus-08-2024」を試したのでまとめました。 1. Command-R-plus-08-2024「Command-R-plus-08-2024」は、「Cohere」が開発した「Command-R」シ…

npaka
3週間前
25

Google Colab で Qwen2-VL を試す

「Google Colab」で「Qwen2-VL」を試したのでまとめました。 1. Qwen2-VL「Qwen2-VL」は、「Alibaba Cloud」が開発したVLMです。 特徴は次のとおりです。 2. Qwen2-VLの…

npaka
3週間前
16

Google Colab で Tanuki-8x8B を試す

「Google Colab」で「Tanuki-8x8B」を試したのでまとめました。 1. Tanuki-8x8B「Tanuki-8x8B」は、経産省及びNEDOが進める日本国内の生成AI基盤モデル開発を推進する「GE…

npaka
3週間前
32

Gemini の 新機能 - Gems と Imagen 3 の概要

「Gemini」の 新機能「Gems」と「Imagen 3」の概要をまとめました。 1. はじめに本日 (8月29日)、Geminiの2つの新機能が発表されました。 「Gems」は今すぐ、「Imagen 3…

npaka
3週間前
50
React Native で iOSのアプリ内課金 を試す

React Native で iOSのアプリ内課金 を試す

「React Native」で「iOSのアプリ内課金」を試したのでまとめました。

前回1. アプリ内課金「アプリ内課金」の種類は、次の3つです。

1-1. 消耗型

料金を​支払って​獲得した​ものを​一度の​使用で​終了する​課金方式です。​使い​切りの​ため、​必要になるたびに​何度も​支払う​ことに​なります。

1-2. 非消耗型

一度の​支払いで​購入した​コンテンツや​機能を​永

もっとみる
React Native の アプリ作成から App Store Connect での内部テストまでの流れ

React Native の アプリ作成から App Store Connect での内部テストまでの流れ

「React Native」のアプリ作成から「App Store Connect」での内部テストまでの流れをまとめました。

前回1. React Native アプリの作成「React Native」アプリの作成手順は次のとおりです。

(1) Node.js のセットアップ。

(2) パッケージのインストール。

npx react-native init hellocd hello

(3

もっとみる
React Native で Androidのアプリ内課金 を試す

React Native で Androidのアプリ内課金 を試す

「React Native」で「Android のアプリ内課金」を試したのでまとめました。

前回1. アプリ内課金「アプリ内課金」の種類は、次の3つです。

1-1. 消費型

料金を​支払って​獲得した​ものを​一度の​使用で​終了する​課金方式です。​使い​切りの​ため、​必要になるたびに​何度も​支払う​ことに​なります。

1-2. 非消費型

一度の​支払いで​購入した​コンテンツや​

もっとみる
React Native の アプリ作成から Google Play Console での内部テストまでの流れ

React Native の アプリ作成から Google Play Console での内部テストまでの流れ

「React Native」のアプリ作成から「Google Play Console」での内部テストまでの流れをまとめました。

前回1. React Native アプリの作成「React Native」アプリの作成手順は次のとおりです。

(1) Node.js のセットアップ。

(2) パッケージのインストール。

npx react-native init hellocd hello

もっとみる
Google Colab で CogVideoX の Image-to-Video と Video-to-Video を試す

Google Colab で CogVideoX の Image-to-Video と Video-to-Video を試す

「Google Colab」で「CogVideoX」の Image-to-Video と Video-to-Video を試したのでまとめました。

1. CogVideoX「CogVideoX」は、「Zhipu AI」が開発した動画生成AIです。「CogVideoX-2B」と「CogVideoX-5B」の2つのモデルが提供されています。

1. Image-to-VideoGoogle Cola

もっとみる
LangChain v0.3 の変更点

LangChain v0.3 の変更点

以下の記事が面白かったので、簡単にまとめました。

1. LangChain v0.3 の変更点1-1. Python

1-2. JavaScript

2. LangChain v0.2の開発中の改善点3. 最新バージョンへの移行最新バージョンへの移行するためのガイドは、以下で参照できます。

4. ドキュメント以前のバージョンのドキュメントは、以下で参照できます。

5. LangGraph

もっとみる
LangChain v0.3 クイックスタートガイド - Python版

LangChain v0.3 クイックスタートガイド - Python版

Python版の「LangChain」のクイックスタートガイドをまとめました。

1. LangChain「LangChain」は、「大規模言語モデル」 (LLM : Large language models) と連携するアプリの開発を支援するライブラリです。

「LLM」という革新的テクノロジーによって、開発者は今まで不可能だったことが可能になりました。しかし、「LLM」を単独で使用するだけで

もっとみる
DataGemma の概要

DataGemma の概要

以下の記事が面白かったので、簡単にまとめました。

1. DataGemma今日のAIイノベーションを支えるLLMは、ますます高度化しています。これらのモデルは、膨大なテキストを処理したり、要約を作成したり、新しいクリエイティブな方向性を提案したり、コードを生成したりすることができます。しかし、能力がいかに優れていても、LLMが時には自信を持って不正確な情報を提示することがあります。この現象は「ハ

もっとみる
OpenAI o1 の APIの使い方

OpenAI o1 の APIの使い方

以下の記事が面白かったので、簡単にまとめました。

1. OpenAI o1「OpenAI o1」シリーズは、複雑な推論を行うために強化学習を用いて学習された新しい大規模言語モデルです。回答する前に考える特性があり、ユーザーに応答する前に長い内部思考の過程を生み出すことができます。これにより、科学的な推論に優れ、競技プログラミングの問題 (Codeforces) では89パーセンタイルにランクイン

もっとみる
OpenAI o1 の概要

OpenAI o1 の概要

以下の記事が面白かったので、簡単にまとめました。

1. OpenAI o1「OpenAI o1」は、応答する前により多くの時間をかけて思考するように設計された新しいAIモデルシリーズです。以前のモデルよりも複雑なタスクを推論し、科学、コーディング、数学の分野でより難しい問題を解決することができます。

本日 (2024年9月12日)、このシリーズの最初のモデルをChatGPTおよびAPIでリリー

もっとみる
Google Colab で Pixtral-12B を試す

Google Colab で Pixtral-12B を試す

「Google Colab」で「Pixtral-12B」を試したのでまとめました。

1. Pixtral-12B「Pixtral-12B」は、Mistralが開発した初のマルチモーダルモデルです。
特徴は、次のとおりです。

2. Colabでの実行Colabでの実行手順は、次のとおりです。

(1) モデルカードでAgreeをクリック。

(2) パッケージのインストール。

# パッケージの

もっとみる
HuggingFace の speech-to-speech を試す

HuggingFace の speech-to-speech を試す

「HuggingFace」の「speech-to-speech」を試したのでまとめました。

1. speech-to-speech「Hugging Face」の「speech-to-speech」は、ローカルで音声認識、応答生成、音声合成を行うためのオープンソースの取り組みです。

特徴は、次のとおりです。

主要コンポーネントは、次のとおりです。

利点は、次のとおりです。

2. 実行手順M

もっとみる
Llama.cpp で Command-R-plus-08-2024 を試す

Llama.cpp で Command-R-plus-08-2024 を試す

「Llama.cpp」で「Command-R-plus-08-2024」を試したのでまとめました。

1. Command-R-plus-08-2024「Command-R-plus-08-2024」は、「Cohere」が開発した「Command-R」シリーズの最新モデルです。

「Command-R」シリーズの最新モデルとして、次の2つが提供されています。

2. Command-R-plus-

もっとみる
Google Colab で Qwen2-VL を試す

Google Colab で Qwen2-VL を試す

「Google Colab」で「Qwen2-VL」を試したのでまとめました。

1. Qwen2-VL「Qwen2-VL」は、「Alibaba Cloud」が開発したVLMです。
特徴は次のとおりです。

2. Qwen2-VLのモデル「Qwen2-VL-7B」と「Qwen2-VL-2B」は、Apache 2.0でウェイトが公開されています。

「Qwen2-VL-72B」は、APIで提供されてお

もっとみる
Google Colab で Tanuki-8x8B を試す

Google Colab で Tanuki-8x8B を試す

「Google Colab」で「Tanuki-8x8B」を試したのでまとめました。

1. Tanuki-8x8B「Tanuki-8x8B」は、経産省及びNEDOが進める日本国内の生成AI基盤モデル開発を推進する「GENIAC」プロジェクトにおいて、松尾・岩澤研究室が開発・公開した日本語LLMです。

フルスクラッチで開発されたモデルで、Apache License 2.0に基づき、研究および商業

もっとみる
Gemini の 新機能 - Gems と Imagen 3 の概要

Gemini の 新機能 - Gems と Imagen 3 の概要

「Gemini」の 新機能「Gems」と「Imagen 3」の概要をまとめました。

1. はじめに本日 (8月29日)、Geminiの2つの新機能が発表されました。

「Gems」は今すぐ、「Imagen 3」は今後数日以内に「Gemini Advanced」「Business」「Enterprise」のユーザーが利用できます。

2. Gems「Gems」は、Gemini をカスタマイズして、

もっとみる