npaka

プログラマー。iPhone / Android / Unity / ROS / AI …

npaka

プログラマー。iPhone / Android / Unity / ROS / AI / AR / VR / RasPi / ロボット / ガジェット。年2冊ペースで技術書を執筆。アニソン / カラオケ / ギター / 猫 twitter : @npaka123

マガジン

  • 自然言語処理入門

    自然言語処理関係のノートをまとめました。

  • AIリリース年表

    AIリリース年表をまとめました。

  • JavaScript入門

    JavaScript関連のノートをまとめました。

  • iOS・Androidアプリ開発入門

    iOSとAndroidのアプリ開発関連のノートをまとめました。

  • AR・VR・MR入門

    AR・VR・MR関連のノートをまとめました。

記事一覧

LangChain v0.3 の変更点

以下の記事が面白かったので、簡単にまとめました。 1. LangChain v0.3 の変更点1-1. Python 1-2. JavaScript 2. LangChain v0.2の開発中の改善点3. 最新バージョンへの…

npaka
1日前
19

LangChain v0.3 クイックスタートガイド - Python版

Python版の「LangChain」のクイックスタートガイドをまとめました。 1. LangChain「LangChain」は、「大規模言語モデル」 (LLM : Large language models) と連携するアプ…

npaka
3日前
47

DataGemma の概要

以下の記事が面白かったので、簡単にまとめました。 1. DataGemma今日のAIイノベーションを支えるLLMは、ますます高度化しています。これらのモデルは、膨大なテキストを…

npaka
5日前
54

OpenAI o1 の APIの使い方

以下の記事が面白かったので、簡単にまとめました。 1. OpenAI o1「OpenAI o1」シリーズは、複雑な推論を行うために強化学習を用いて学習された新しい大規模言語モデルで…

npaka
6日前
128

OpenAI o1 の概要

以下の記事が面白かったので、簡単にまとめました。 1. OpenAI o1「OpenAI o1」は、応答する前により多くの時間をかけて思考するように設計された新しいAIモデルシリーズ…

npaka
6日前
49

Google Colab で Pixtral-12B を試す

「Google Colab」で「Pixtral-12B」を試したのでまとめました。 1. Pixtral-12B「Pixtral-12B」は、Mistralが開発した初のマルチモーダルモデルです。 特徴は、次のとおり…

npaka
7日前
20

HuggingFace の speech-to-speech を試す

「HuggingFace」の「speech-to-speech」を試したのでまとめました。 1. speech-to-speech「Hugging Face」の「speech-to-speech」は、ローカルで音声認識、応答生成、音声…

npaka
8日前
29

Llama.cpp で Command-R-plus-08-2024 を試す

「Llama.cpp」で「Command-R-plus-08-2024」を試したのでまとめました。 1. Command-R-plus-08-2024「Command-R-plus-08-2024」は、「Cohere」が開発した「Command-R」シ…

npaka
2週間前
25

Google Colab で Qwen2-VL を試す

「Google Colab」で「Qwen2-VL」を試したのでまとめました。 1. Qwen2-VL「Qwen2-VL」は、「Alibaba Cloud」が開発したVLMです。 特徴は次のとおりです。 2. Qwen2-VLの…

npaka
2週間前
16

Google Colab で Tanuki-8x8B を試す

「Google Colab」で「Tanuki-8x8B」を試したのでまとめました。 1. Tanuki-8x8B「Tanuki-8x8B」は、経産省及びNEDOが進める日本国内の生成AI基盤モデル開発を推進する「GE…

npaka
2週間前
32

Gemini の 新機能 - Gems と Imagen 3 の概要

「Gemini」の 新機能「Gems」と「Imagen 3」の概要をまとめました。 1. はじめに本日 (8月29日)、Geminiの2つの新機能が発表されました。 「Gems」は今すぐ、「Imagen 3…

npaka
3週間前
49

Google Colab で CogVideoX を試す

「Google Colab」で「CogVideoX」を試したのでまとめました。 1. CogVideoX「CogVideoX」は、「Zhipu AI」が開発した動画生成AIです。「CogVideoX-2B」と「CogVideoX-5B」…

npaka
3週間前
28

Gemini 1.5 Pro Experimental 0827 ・ Gemini 1.5 Flash Experimental 0827 ・ Gemini 1.5 Flash-8B Experimental 0827 の概要

「Gemini 1.5 Pro Experimental 0827」「Gemini 1.5 Flash Experimental 0827」「Gemini 1.5 Flash-8B Experimental 0827」の概要をまとめました。 1. はじめに本日 (8月2…

npaka
3週間前
27

LlamaIndex 0.11 の概要

以下の記事が面白かったので、簡単にまとめました。 1. LlamaIndex 0.11「LlamaIndex 0.11」の新機能を紹介します。 1-1. Workflow 「Workflow」を導入しました。これは…

npaka
3週間前
19

Google Colab で Phi-3.5-mini-instruct を試す

「Google Colab」で「Phi-3.5-mini-instruct」を試したのでまとめました。 1. Phi-3.5-mini-instruct「Phi-3.5-mini」は、「Phi-3」に使用されるデータセットで構築された…

npaka
4週間前
24

Google Colab で EZO-InternVL2-26B を試す

「Google Colab」で「EZO-InternVL2-26B」を試したのでまとめました。 1. EZO-InternVL2-26B「EZO-InternVL2-26B」は、「InternVL2-26B」をベースに、複数のチューニング…

npaka
1か月前
16
LangChain v0.3 の変更点

LangChain v0.3 の変更点

以下の記事が面白かったので、簡単にまとめました。

1. LangChain v0.3 の変更点1-1. Python

1-2. JavaScript

2. LangChain v0.2の開発中の改善点3. 最新バージョンへの移行最新バージョンへの移行するためのガイドは、以下で参照できます。

4. ドキュメント以前のバージョンのドキュメントは、以下で参照できます。

5. LangGraph

もっとみる
LangChain v0.3 クイックスタートガイド - Python版

LangChain v0.3 クイックスタートガイド - Python版

Python版の「LangChain」のクイックスタートガイドをまとめました。

1. LangChain「LangChain」は、「大規模言語モデル」 (LLM : Large language models) と連携するアプリの開発を支援するライブラリです。

「LLM」という革新的テクノロジーによって、開発者は今まで不可能だったことが可能になりました。しかし、「LLM」を単独で使用するだけで

もっとみる
DataGemma の概要

DataGemma の概要

以下の記事が面白かったので、簡単にまとめました。

1. DataGemma今日のAIイノベーションを支えるLLMは、ますます高度化しています。これらのモデルは、膨大なテキストを処理したり、要約を作成したり、新しいクリエイティブな方向性を提案したり、コードを生成したりすることができます。しかし、能力がいかに優れていても、LLMが時には自信を持って不正確な情報を提示することがあります。この現象は「ハ

もっとみる
OpenAI o1 の APIの使い方

OpenAI o1 の APIの使い方

以下の記事が面白かったので、簡単にまとめました。

1. OpenAI o1「OpenAI o1」シリーズは、複雑な推論を行うために強化学習を用いて学習された新しい大規模言語モデルです。回答する前に考える特性があり、ユーザーに応答する前に長い内部思考の過程を生み出すことができます。これにより、科学的な推論に優れ、競技プログラミングの問題 (Codeforces) では89パーセンタイルにランクイン

もっとみる
OpenAI o1 の概要

OpenAI o1 の概要

以下の記事が面白かったので、簡単にまとめました。

1. OpenAI o1「OpenAI o1」は、応答する前により多くの時間をかけて思考するように設計された新しいAIモデルシリーズです。以前のモデルよりも複雑なタスクを推論し、科学、コーディング、数学の分野でより難しい問題を解決することができます。

本日 (2024年9月12日)、このシリーズの最初のモデルをChatGPTおよびAPIでリリー

もっとみる
Google Colab で Pixtral-12B を試す

Google Colab で Pixtral-12B を試す

「Google Colab」で「Pixtral-12B」を試したのでまとめました。

1. Pixtral-12B「Pixtral-12B」は、Mistralが開発した初のマルチモーダルモデルです。
特徴は、次のとおりです。

2. Colabでの実行Colabでの実行手順は、次のとおりです。

(1) モデルカードでAgreeをクリック。

(2) パッケージのインストール。

# パッケージの

もっとみる
HuggingFace の speech-to-speech を試す

HuggingFace の speech-to-speech を試す

「HuggingFace」の「speech-to-speech」を試したのでまとめました。

1. speech-to-speech「Hugging Face」の「speech-to-speech」は、ローカルで音声認識、応答生成、音声合成を行うためのオープンソースの取り組みです。

特徴は、次のとおりです。

主要コンポーネントは、次のとおりです。

利点は、次のとおりです。

2. 実行手順M

もっとみる
Llama.cpp で Command-R-plus-08-2024 を試す

Llama.cpp で Command-R-plus-08-2024 を試す

「Llama.cpp」で「Command-R-plus-08-2024」を試したのでまとめました。

1. Command-R-plus-08-2024「Command-R-plus-08-2024」は、「Cohere」が開発した「Command-R」シリーズの最新モデルです。

「Command-R」シリーズの最新モデルとして、次の2つが提供されています。

2. Command-R-plus-

もっとみる
Google Colab で Qwen2-VL を試す

Google Colab で Qwen2-VL を試す

「Google Colab」で「Qwen2-VL」を試したのでまとめました。

1. Qwen2-VL「Qwen2-VL」は、「Alibaba Cloud」が開発したVLMです。
特徴は次のとおりです。

2. Qwen2-VLのモデル「Qwen2-VL-7B」と「Qwen2-VL-2B」は、Apache 2.0でウェイトが公開されています。

「Qwen2-VL-72B」は、APIで提供されてお

もっとみる
Google Colab で Tanuki-8x8B を試す

Google Colab で Tanuki-8x8B を試す

「Google Colab」で「Tanuki-8x8B」を試したのでまとめました。

1. Tanuki-8x8B「Tanuki-8x8B」は、経産省及びNEDOが進める日本国内の生成AI基盤モデル開発を推進する「GENIAC」プロジェクトにおいて、松尾・岩澤研究室が開発・公開した日本語LLMです。

フルスクラッチで開発されたモデルで、Apache License 2.0に基づき、研究および商業

もっとみる
Gemini の 新機能 - Gems と Imagen 3 の概要

Gemini の 新機能 - Gems と Imagen 3 の概要

「Gemini」の 新機能「Gems」と「Imagen 3」の概要をまとめました。

1. はじめに本日 (8月29日)、Geminiの2つの新機能が発表されました。

「Gems」は今すぐ、「Imagen 3」は今後数日以内に「Gemini Advanced」「Business」「Enterprise」のユーザーが利用できます。

2. Gems「Gems」は、Gemini をカスタマイズして、

もっとみる
Google Colab で CogVideoX を試す

Google Colab で CogVideoX を試す

「Google Colab」で「CogVideoX」を試したのでまとめました。

1. CogVideoX「CogVideoX」は、「Zhipu AI」が開発した動画生成AIです。「CogVideoX-2B」と「CogVideoX-5B」の2つのモデルが提供されています。

2. Colabでの実行Colabでの実行手順は、次のとおりです。

(1) パッケージのインストール。

# パッケージの

もっとみる
Gemini 1.5 Pro Experimental 0827 ・ Gemini 1.5 Flash Experimental 0827 ・ Gemini 1.5 Flash-8B Experimental 0827 の概要

Gemini 1.5 Pro Experimental 0827 ・ Gemini 1.5 Flash Experimental 0827 ・ Gemini 1.5 Flash-8B Experimental 0827 の概要

「Gemini 1.5 Pro Experimental 0827」「Gemini 1.5 Flash Experimental 0827」「Gemini 1.5 Flash-8B Experimental 0827」の概要をまとめました。

1. はじめに本日 (8月28日)、Geminiの3つの実験モデルを公開されました。

「Google AI Studio」および「Gemini API」で

もっとみる
LlamaIndex 0.11 の概要

LlamaIndex 0.11 の概要

以下の記事が面白かったので、簡単にまとめました。

1. LlamaIndex 0.11「LlamaIndex 0.11」の新機能を紹介します。

1-1. Workflow

「Workflow」を導入しました。これは、複雑なAIアプリを構築するため、イベント駆動型アーキテクチャです。「クエリパイプライン」に代わるものになります。詳しくはチュートリアルを参照してください。

1-2. Instr

もっとみる
Google Colab で Phi-3.5-mini-instruct を試す

Google Colab で Phi-3.5-mini-instruct を試す

「Google Colab」で「Phi-3.5-mini-instruct」を試したのでまとめました。

1. Phi-3.5-mini-instruct「Phi-3.5-mini」は、「Phi-3」に使用されるデータセットで構築された軽量で最先端のオープンモデルです。128Kトークンのコンテキスト長をサポートします。

2. Colabでの実行Colabでの実行手順は、次のとおりです。

(1)

もっとみる
Google Colab で EZO-InternVL2-26B を試す

Google Colab で EZO-InternVL2-26B を試す

「Google Colab」で「EZO-InternVL2-26B」を試したのでまとめました。

1. EZO-InternVL2-26B「EZO-InternVL2-26B」は、「InternVL2-26B」をベースに、複数のチューニング手法で画像認識と日本語性能を向上させたモデルです。

2. Colabでの実行Colabでの実行手順は、次のとおりです。

(1) パッケージのインストール。

もっとみる