川本達郎

国立研究所の主任研究員ですが、今は休職してスタートアップをやっています。 https:…

川本達郎

国立研究所の主任研究員ですが、今は休職してスタートアップをやっています。 https://aska-intelligence.com/ja LLM/機械学習・統計・アンケート調査・可視化・AI動画制作

マガジン

  • ライトニング・サマリー ブログ

    主にLLM論文のまとめです。YouTubeチャンネル『Lightning Summary』の動画を制作する上で整理した内容をまとめたものです。動画には入れられなかった内容も含まれています。

  • ちょっとディープなデータ可視化の話

    入門書には載っていないような少しディープなデータ可視化の内容について解説していきます(比較的詳しい洋書や学術論文の抜粋解説、独自の解説記事など)。 ディープといっても雑学的な内容が多めです。(一部数学寄りの内容あり) 可視化の入門書はたくさんありますが、その手の書籍で少し物足りないなと感じたと感じた方は楽しんでいただけると思います。

最近の記事

1000人のAIエージェントに「炎上してしまったアーティストはどうするべきか」考えてもらいました

Mrs. GREEN APPLEの「コロンブス」のMVがこの記事を書いている時点では直近の大きな炎上ですが、SNSでの炎上は定期的に起きています。 今回は、「炎上してしまったアーティストはどうするべきか」を1,000人分のAIエージェント(GPT-4o + GPT-3turbo)に考えてもらいました。使用するツールは弊社のAskaに搭載されているAIアンケートシミュレーターです。 Askaについての説明はこちらをご覧ください: 普通にChatGPTに聞いてみた結果100

    • 【7/1まで無料】マルチ・エージェントプロンプトでLLMのパフォーマンスは向上するのか

      AIエージェントたちによる"クラウドソーシング"LLMの性能向上には、本質的にアーキテクチャーを改良するものから、Chain of Thoughtのようにプロンプトの工夫まで様々ですが、今回はLLMエージェントを組み合わせる(同じLLMを複数回処理させたり同じLLMで複数人のエージェントを設置する場合も含む)ことでより良いパフォーマンスを引き出そうとする試みについてまとめていきます。 LLMの出力は多様なので、それが”良い”かどうかは一般には判断は難しいですが、ここではなん

      • ChatGPTはヘイトスピーチを理解できるのか

        YouTube動画ヘイトスピーチ問題今回の記事は、以下のWWW'23の論文の内容です。 LLMが倫理的問題にどう対処するかはかなり初期からの問題ですが、今回はChatGPTはヘイトスピーチを判定できるかという問題を検証した内容です。

        • AIに書いてもらった文章であることはバレるのか

          このタイトルを見てドキっとする人もいるかもしれません。 AIが生成した文章は、実際のところ、それがAIによって書かれたとバレるのでしょうか。 結論勿体ぶってもいいんですが、結論から言うと、現状はバレません。 ただし、「おそらくAIが書いたもの」と判定するポイントは存在します。 「AI判定器」は存在するウソ発見器のように、ある文章がAIによって書かれたかどうかを判定するソフトウェア(AI)はあります。 問題はこれがどれくらい正しく判定できるかということなんですが、世に出回

        1000人のAIエージェントに「炎上してしまったアーティストはどうするべきか」考えてもらいました

        マガジン

        • ライトニング・サマリー ブログ
          3本
          ¥100
        • ちょっとディープなデータ可視化の話
          11本
          ¥500

        記事

          LLMのキャリブレーション:"logprob"の値が高ければ結果を信頼できるのか?

          YouTube動画LLMのキャリブレーション(Calibration)MMLUという超メジャーベンチマークの原論文で結構強調されているにも関わらず、MMLU関連で言及している人があまり見当たらないキャリブレーションについて説明していきます。

          LLMのキャリブレーション:"logprob"の値が高ければ結果を信頼できるのか?

          300人のAIエージェントに「カスハラ対策」について考えてもらった結果...

          カスタマーハラスメント(いわゆるカスハラ)が連日ニュースで話題になっていますね。Askaを用いて、300人のAIエージェントに「カスハラ対策」について回答してもらいました。 Askaについては以下の記事をご参照ください。 質問結果細かいデータはこちらに掲載してあります。 🈺 「お客様第一主義」はマイノリティ 顧客理解に努めるというような、あくまで「お客様第一主義」を支持する回答者が一定数いますが、これはマイノリティですね。 最も過激な意見としては「顧客満足度を向上さ

          300人のAIエージェントに「カスハラ対策」について考えてもらった結果...

          300人のAIが「労働と経済成長」について考えたらオーバーツーリズムの話題が出てきた

          こんにちは、今回はSDGsの8番目の課題である「労働と経済成長」について、Askaを用いて300人のAIエージェントに回答してもらった結果をご紹介します。 質問内容元アンケートは英語ですが、ここでは翻訳してご紹介します。 処理手順 このアンケートでは、最初に選択肢としての初期回答が自動生成されます。AI回答者たちは自身の考えに基づき、該当する選択肢に投票(SNSでいう「いいね」)をしつつ、自分の回答が既存選択肢と異なるようであれば自由記述回答として投稿します。投稿された

          300人のAIが「労働と経済成長」について考えたらオーバーツーリズムの話題が出てきた

          タイ語翻訳とプロの英文添削で気づいたChatGPT翻訳の微妙な困難

          ChatGPTの翻訳精度はどうなのかという話は、もうみなさん耳タコな話だと思いますが、ちょっと違う視点で書けるかもと思ったので書いてみます。 事の始まりうちの会社で運営しているAskaというSaaSですが、実は15ヶ国語に対応しています。なんでそんなに対応しているかはさておき、英語以外の翻訳は完全にChatGPT頼みです。 そのうちの1つがタイ語で、私はまったくタイ語は分かりませんが、文字がそれっぽいと出来た気になります(盛大な気のせい)。 先日とあるタイの会社の副社長

          タイ語翻訳とプロの英文添削で気づいたChatGPT翻訳の微妙な困難

          MMLUデータセットとは何か: LLMの性能測定

          YouTube動画noteで日本語記事にしていない動画もありますので、よかったらYouTubeも高評価やチャンネル登録していただけると励みになります! MMLULLMのベンチマークデータセットは多数ありますが、今回はHendrycks et al. ICLR (2021)によるデータセット MMLU (Massive Multitask Language Understanding) について、原論文の内容を追う形でまとめていきたいと思います。

          MMLUデータセットとは何か: LLMの性能測定

          AIアンケートシミュレーターとその周辺

          この記事は、以下の記事とペアになっています。 前回の記事で、「大量のAIたちの意見を取りまとめるツール」のAskaをご紹介をしましたが、今回はもう少し技術的な背景の話をしていきたいと思います。 といっても実装の中身を説明するというより業界地図的な技術背景です。 Aska自体の概要は、前回の記事をご参照ください。 Askaでは人々から回答を集めるような通常のアンケートの側面もありますが、今回はAIアンケートシミュレーターとしての側面に限定します。 そもそもなぜたくさんの

          AIアンケートシミュレーターとその周辺

          大量のAIエージェント(と人間)の意見を取りまとめて視覚化するツール

          この記事は、弊社で運営しているシステム『Aska』の紹介です。 タイトルのとおり、 大量のAIエージェントの意見を取りまとめて視覚化 するツールなんですが、順を追って概要を説明していきたいと思います。 背景いくらかの人は「ChatGPTにアイディア出しやダメ出しをしてもらう」ことを日常的にやっているかと思います。 1回ChatGPTに尋ねたあと、気に入らないのでもう一回尋ねると、他の提案をしてくれたりしますよね。 もう一度尋ねたら、さらに新たな提案をしてくれるかもしれ

          大量のAIエージェント(と人間)の意見を取りまとめて視覚化するツール

          PandasAIのメモ(v1.xからv2.xでの変更点)

          この記事を書いている時期PandasAIはほぼ毎日更新されているので、この記事の賞味期限はどれくらいか全然わかりませんが、作業ログ的にまとめていきます。 Disclaimer v1.x (1.4.6)からv2.x (2.0.30)への変更で私が認知したものをまとめていきますが、具体的にどのバージョンで変更されたかまでは追っていません。 この記事は、網羅的に調べてまとめたものではありません。 ダウングレードでは粘れません 昔のバージョンのpandasaiを指定して粘ろ

          PandasAIのメモ(v1.xからv2.xでの変更点)

          1.6 「折れ線グラフは"読めない"」論争

          折れ線グラフ論争の元ネタ 2023年の夏、Nightingaleという可視化に関するサイトに "Connected Scatterplots Make Me Feel Dumb"(折れ線グラフは私を愚かに感じさせる) という記事が公開されましたが、一方でそれに反論する形でMediumに "Are Connected Scatterplots Unreadable?"(折れ線グラフは読めないのか?) という記事が投稿されました。 それなりに盛り上がっている話題のようなので、

          1.6 「折れ線グラフは"読めない"」論争

          3.1 高次元データの可視化:Parallel Coordinate Plotを理解する

          Parallel Coordinate Plot(並行座標プロット)は、ひと言でいうと「高次元データを2次元平面で表現する可視化法」です。 見た目はこんなかんじです。 Parallel Coordinate Plotは、円グラフや棒グラフなどの標準的な可視化に比べるとマイナーなので、聞いたことがない人もいるかもしれません。ただ、それなりに昔からあり、研究も多くあるので、「知る人ぞ知る」というよりは知名度のある可視化です。 似たような可視化として、slope chart(

          有料
          0〜
          割引あり

          3.1 高次元データの可視化:Parallel Coordinate Plotを理…

          3.0 関係データの可視化:Hierarchical Edge Bundleを理解する

          今回はHierarchical Edge Bundle(Bundlingとも書かれます)について解説していきます。 一般的な可視化パッケージには入っていないことが多いので、実際に描いたことがある人は少ないかもしれません。 似たような可視化として、コードダイアグラム(cord diagram、もしくはradial network diagram)があります。 コードダイアグラムは、円形にデータ要素を並べ、関係がある要素間を曲線(コード)で結んでいます。要素の集合や領域をまと

          有料
          0〜
          割引あり

          3.0 関係データの可視化:Hierarchical Edge Bundleを理解…

          2.1 色の重ね合わせ:Alpha blendingを理解する

          今回は、半透明な色の重ね合わせ手法であるalpha blending(alpha compositing)について説明します。 色の指定方法にはRGBやCMYKやHSVなどいろいろありますが、RGBにはよく不透明度(opacity)の自由度を追加したRGBAが用いられます。 最後のAはalphaの意味で、不透明度はよく"alpha"と呼ばれているためです(*1)。 不透明度というのは、色自体の指定とは別の自由度ですが、完全に不透明でない場合は、2つの色を重ね合わせた時に色

          有料
          0〜
          割引あり

          2.1 色の重ね合わせ:Alpha blendingを理解する