ailora will

LLM・画像生成AIほか生成AI全般に興味あり。たまに検証とかします。 作ったコードと…

ailora will

LLM・画像生成AIほか生成AI全般に興味あり。たまに検証とかします。 作ったコードとかは https://github.com/willailora

記事一覧

アリス問題による日本語推論能力の比較

このツィートを見て、論文もざっくり確認しましたが、自分の体感とも少し異なっているため、英語ではなく日本語で、簡単に調査してみることにしました。 調査方法基本的に…

ailora will
12日前
1

アリス問題の参考画像集

以下はいわゆるアリス問題をChatBotArenaや各LLM公式サイトやPerplexityでテストした結果の画像です。 調査した結果の論評は以下のnote記事を見てください。 https://note.

ailora will
12日前
1

中国製LLMのライセンス問題と国安法について

Qwenを始め、YiやDeepSeekや先日話題になったGLMなどの中国製モデルは急速に日本語能力を高めています。 そのため、利用したり、オープンソースだから大丈夫だと深く考えず…

ailora will
2週間前
3

ChatGPT-Next-WebでGemini1.5-Flashを活用する(画像アップロードにも対応)

Gemini1.5-FlashをChatでただ使うなら、本家のAIStudioで良いちゃ良いのですが、自動で保存されなかったり、システムプロンプトも毎回自分でいれる必要があったりとちょっ…

ailora will
2週間前
3

OpenAI-TranslatorでGemini1.5FlashAPIを利用して、長文でも無料で翻訳をする方法(翻訳以外にコード解説や要約、自分で作成した…

※OpenAI-Translatorは中国系の方が開発されているOSSであり、その点に懸念を持つ方には使用はおすすめできません。 何故翻訳アプリが必要なのか今や、ChromeやEdgeには英…

ailora will
4週間前
15

gpt2-chatbotとGPT4-Turbo-2024-04-09をChatbotArenaで捕まえられたので、ネオチバの設定作成対決させた(創造的タスクテスト)。

幸運なことに、gpt2-chatbotとGPT4-Turbo-2024-04-09をChatbotArenaで捕まえられたので、「サイバーパンクの仮想の千葉市、ネオチバの設定を作ってください。」で設定を作…

ailora will
1か月前
13

ChatbotArenaで対戦しまくって、各LLMの日本語回答性能と特徴を調べた。Llama3とGeminiProdevが興味深かった。

LMSYS Chatbot Arena: Benchmarking LLMs in the Wildは、オープンソースで人間がLLMの勝ち負けを評価する研究で、現在40種類のLLMのうち、2つのLLMが一定の基準(得点が定…

ailora will
2か月前
9

ChatbotArenaの対戦画像集

各項目の一番下にあるPerplexityのリンクは、各質問をClaude3-Opusにしたものですので、参考にしてください。 本編はこちらです。 ChatbotArenaで対戦しまくって、各LLMの…

ailora will
2か月前
2

11種のLLMでのPythonコード生成(ダイスアプリ作成)の簡易テストをしました。

様々なコード生成専用のものも含めて、自分の使用可能な範囲のLLMを使用し、簡単なダイスアプリを作らせることで、実際の簡単なコード生成がどの程度できるか調査してみま…

ailora will
2か月前
7

bartimerというタイマーとインターバルタイマーがバーの増加で経過時間がわかりやすいアプリ(exe版もあり)をGithubで公開しまし…

 bartimerというタイマーとインターバルタイマーがバーの増加で経過時間がわかりやすいアプリ(exe版もあり)をClaude3-OpusとGPT4-Turboを使用して、ところどころ修正して…

ailora will
2か月前
2

CommandR+量子化の簡易比較テスト(dranger氏のtxtを使用)追記ローカルでのiq1_sテスト

 CommandR+の量子化を作成してくれたdranger氏が各量子化ごとでの出力結果のtxtを公開してくれました。  同じシード、温度は0の設定で、「Write an essay about AI in th…

ailora will
2か月前
3

llama.cppのserver.exeに起動オプションを送って起動できるPythonコードを公開しました。

残念ながら、2024年4月6日時点のKoboldcppではc4ai-command-r-v01-GGUFが起動できないので、llama.cppで起動するしか無いのですが、cuiで動かすのは嫌なので、server.exeで…

ailora will
2か月前
4

Koboldcpp用pngメタデータ編集コード公開しました

 GUI付きでKoboldcppにインポート可能なchub.aiとPygmalionAIのダウンロードしたキャラクターのPNGファイルのメタデータを編集できて保存ができるコードを作成しました。 …

ailora will
2か月前

PerplexityのProSearchなどの日本語変換の確定でクエリが送信される問題を解決するユーザースクリプトの公開(ホームでたまに送信…

@toshikawaさんが、labs.Perplexityでの日本語入力問題を解決するコードを作成してくれました! Labs.perplexity.aiでの日本語入力中のEnterで送信されないようにする。 自…

ailora will
2か月前
4

Claudeに定型文挿入ボタンを追加するユーザースクリプトを公開しました

 Claude本家サイトのChatに定型文挿入のボタンを追加するユーザースクリプトを公開しました。基本はClaude3-Opusに作成してもらって、動作しなかったので私が適宜修正しま…

ailora will
2か月前
2

Perplexityの検索ボックスに定型文を入力できるコードを公開しました

 残念ながら、Perplexityの検索のバックエンドはおそらくBingを使用(訂正Bingではなくhttps://www.reddit.com/r/LocalLLaMA/comments/1bh6o3e/reverse_engineering_perple

ailora will
2か月前
2
アリス問題による日本語推論能力の比較

アリス問題による日本語推論能力の比較

このツィートを見て、論文もざっくり確認しましたが、自分の体感とも少し異なっているため、英語ではなく日本語で、簡単に調査してみることにしました。

調査方法基本的にhttps://arena.lmsys.org/で対戦しまくることで、結果がどうなるかを確認した。いくつかは、対戦でなくダイレクトチャットで追試をした。
また、PerplexityにあるモデルはPerplexityでもテストした。
使用し

もっとみる
アリス問題の参考画像集

アリス問題の参考画像集

以下はいわゆるアリス問題をChatBotArenaや各LLM公式サイトやPerplexityでテストした結果の画像です。
調査した結果の論評は以下のnote記事を見てください。
https://note.com/willplion/n/n5842538dd13d

中国製LLMのライセンス問題と国安法について

中国製LLMのライセンス問題と国安法について

Qwenを始め、YiやDeepSeekや先日話題になったGLMなどの中国製モデルは急速に日本語能力を高めています。
そのため、利用したり、オープンソースだから大丈夫だと深く考えずに商用利用してしまうこともあるかも知れません。
ただし、これらのモデルを利用する場合、法の管轄権が中国であることが明示されていたり、独自ライセンスを提示している場合があります。
追記:2024/06/07 間の悪い話ですが

もっとみる
ChatGPT-Next-WebでGemini1.5-Flashを活用する(画像アップロードにも対応)

ChatGPT-Next-WebでGemini1.5-Flashを活用する(画像アップロードにも対応)

Gemini1.5-FlashをChatでただ使うなら、本家のAIStudioで良いちゃ良いのですが、自動で保存されなかったり、システムプロンプトも毎回自分でいれる必要があったりとちょっと面倒です。
そこで、もっと便利なの無いかと探したのですが、Geminiにそもそも対応してなかったり、Windowsでは動かないのだったり、GeminiProにしか対応してないとか、そういうのばかりだったのですが、

もっとみる
OpenAI-TranslatorでGemini1.5FlashAPIを利用して、長文でも無料で翻訳をする方法(翻訳以外にコード解説や要約、自分で作成したアクションも可能)

OpenAI-TranslatorでGemini1.5FlashAPIを利用して、長文でも無料で翻訳をする方法(翻訳以外にコード解説や要約、自分で作成したアクションも可能)

※OpenAI-Translatorは中国系の方が開発されているOSSであり、その点に懸念を持つ方には使用はおすすめできません。

何故翻訳アプリが必要なのか今や、ChromeやEdgeには英日翻訳機能が付いていて、翻訳性能も十二分なものになって、今更翻訳アプリなんて不要と言いきっても良いわけだが、Firefoxには英日翻訳機能はまだない。
更にいうと、まだChromeやEdgeにもpdfの翻訳機

もっとみる
gpt2-chatbotとGPT4-Turbo-2024-04-09をChatbotArenaで捕まえられたので、ネオチバの設定作成対決させた(創造的タスクテスト)。

gpt2-chatbotとGPT4-Turbo-2024-04-09をChatbotArenaで捕まえられたので、ネオチバの設定作成対決させた(創造的タスクテスト)。

幸運なことに、gpt2-chatbotとGPT4-Turbo-2024-04-09をChatbotArenaで捕まえられたので、「サイバーパンクの仮想の千葉市、ネオチバの設定を作ってください。」で設定を作らせ続けて、創造的タスクでの性能を比較してみた。

最初はそのまま作らせ続けたのだが、途中から適当に指示を追加して、性能を比較した。
指示によって、評価がひっくり返ることも合ったが、本当にギリギリ

もっとみる
ChatbotArenaで対戦しまくって、各LLMの日本語回答性能と特徴を調べた。Llama3とGeminiProdevが興味深かった。

ChatbotArenaで対戦しまくって、各LLMの日本語回答性能と特徴を調べた。Llama3とGeminiProdevが興味深かった。

LMSYS Chatbot Arena: Benchmarking LLMs in the Wildは、オープンソースで人間がLLMの勝ち負けを評価する研究で、現在40種類のLLMのうち、2つのLLMが一定の基準(得点が定まったものは選ばれにくくなるなど)で選ばれて、その出力結果を人間がAとBのLLMの名前が伏せられた状態で、どちらが優れているかを評価するテストです。
その結果もリンク先のLead

もっとみる
ChatbotArenaの対戦画像集

ChatbotArenaの対戦画像集

各項目の一番下にあるPerplexityのリンクは、各質問をClaude3-Opusにしたものですので、参考にしてください。
本編はこちらです。
ChatbotArenaで対戦しまくって、各LLMの日本語回答性能と特徴を調べた。Llama3とGeminiProdevが興味深かった。

1:「銀河英雄伝説について、日本語で詳しく教えて下さい。」https://www.perplexity.ai/se

もっとみる
11種のLLMでのPythonコード生成(ダイスアプリ作成)の簡易テストをしました。

11種のLLMでのPythonコード生成(ダイスアプリ作成)の簡易テストをしました。

様々なコード生成専用のものも含めて、自分の使用可能な範囲のLLMを使用し、簡単なダイスアプリを作らせることで、実際の簡単なコード生成がどの程度できるか調査してみました。
題材が簡単すぎたせいか、どれも作成自体は成功しました(codellama-70b-instructのみ、一部機能が保存場所の指示を聞いてくれなかったのですが、使う人ももはやいないLLMなので、粘らずにテストを終了しました)が、ゆら

もっとみる
bartimerというタイマーとインターバルタイマーがバーの増加で経過時間がわかりやすいアプリ(exe版もあり)をGithubで公開しました。

bartimerというタイマーとインターバルタイマーがバーの増加で経過時間がわかりやすいアプリ(exe版もあり)をGithubで公開しました。

 bartimerというタイマーとインターバルタイマーがバーの増加で経過時間がわかりやすいアプリ(exe版もあり)をClaude3-OpusとGPT4-Turboを使用して、ところどころ修正して作成しました。

配布はhttps://github.com/willailora/bartimerで行っています。

特徴bartimer は、カスタマイズ可能なタイマーとインターバルタイマー機能を備えた

もっとみる
CommandR+量子化の簡易比較テスト(dranger氏のtxtを使用)追記ローカルでのiq1_sテスト

CommandR+量子化の簡易比較テスト(dranger氏のtxtを使用)追記ローカルでのiq1_sテスト

 CommandR+の量子化を作成してくれたdranger氏が各量子化ごとでの出力結果のtxtを公開してくれました。
 同じシード、温度は0の設定で、「Write an essay about AI in the style of a senior PhD researcher in artificial intelligence without any mention of your ident

もっとみる
llama.cppのserver.exeに起動オプションを送って起動できるPythonコードを公開しました。

llama.cppのserver.exeに起動オプションを送って起動できるPythonコードを公開しました。

残念ながら、2024年4月6日時点のKoboldcppではc4ai-command-r-v01-GGUFが起動できないので、llama.cppで起動するしか無いのですが、cuiで動かすのは嫌なので、server.exeでブラウザーで遊ぶわけですが、いちいち起動因数を付けてコマンドプロンプトなどにコピペするのも面倒なので、Claude3-Opusと相談しながら、簡単にするコードを作成しました。
追記

もっとみる
Koboldcpp用pngメタデータ編集コード公開しました

Koboldcpp用pngメタデータ編集コード公開しました

 GUI付きでKoboldcppにインポート可能なchub.aiとPygmalionAIのダウンロードしたキャラクターのPNGファイルのメタデータを編集できて保存ができるコードを作成しました。

 一応、既存のでないかは探したのですが、長期間メンテされてないソフトしかありませんでしたので、Claude3-Opusと相談しながらコードを生成しました。Koboldcppに編集機能がついていれば、こんな

もっとみる
PerplexityのProSearchなどの日本語変換の確定でクエリが送信される問題を解決するユーザースクリプトの公開(ホームでたまに送信される問題が発生してるようなので、再度対応)

PerplexityのProSearchなどの日本語変換の確定でクエリが送信される問題を解決するユーザースクリプトの公開(ホームでたまに送信される問題が発生してるようなので、再度対応)

@toshikawaさんが、labs.Perplexityでの日本語入力問題を解決するコードを作成してくれました!
Labs.perplexity.aiでの日本語入力中のEnterで送信されないようにする。
自分がClaude3-Opusと相談しながらやっても、だんだん変な方向に行ってReactの問題か?みたいになって解決できなかったので、助かりましたm(_ _)m

 Claude3-Opusに

もっとみる
Claudeに定型文挿入ボタンを追加するユーザースクリプトを公開しました

Claudeに定型文挿入ボタンを追加するユーザースクリプトを公開しました

 Claude本家サイトのChatに定型文挿入のボタンを追加するユーザースクリプトを公開しました。基本はClaude3-Opusに作成してもらって、動作しなかったので私が適宜修正しました。

使用方法 アドオンとしてまず、TamperMonkeyやGreasemonkeyなど、ユーザースクリプトを使用できるアドオンが必要となります。
 このコードには問題ないことは確認していますが、セキュリティ上の

もっとみる
Perplexityの検索ボックスに定型文を入力できるコードを公開しました

Perplexityの検索ボックスに定型文を入力できるコードを公開しました

 残念ながら、Perplexityの検索のバックエンドはおそらくBingを使用(訂正Bingではなくhttps://www.reddit.com/r/LocalLLaMA/comments/1bh6o3e/reverse_engineering_perplexity/によると、Googleのもののようです。普段DuckDuckGo使用しているので、気づきませんでした)していて、日本語の検索だとかな

もっとみる