Mat'zの好奇心爆発

興味赴くままにいろんなことをやって、いろんなものを作っています。 2020年から興味の…

Mat'zの好奇心爆発

興味赴くままにいろんなことをやって、いろんなものを作っています。 2020年から興味の対象がものづくりから価値づくりへとシフトしてきています。

マガジン

  • Avatarian

    Web会議アプリに映る顔をアバターに変換するアプリを作る過程をまとめます。 着想からgithubで公開、その後の展開まで、時々更新。

  • NPU

    最新技術、NPUが実現するAIが身近な世界をテクノロジー面からのぞいて見ます

  • 【私の働き方実験】スマートグラスで〇〇する

    Lenovoのスマートグラスを遊び尽くす

  • 【私の働き方実験】バーチャル人間が稼ぐ

    ランサーズの研究員制度の自主企画として参加している「バーチャル人間が稼ぐ」シリーズの記事です

  • スピーカーを作る

    気軽に自作スピーカーを楽しみましょう

最近の記事

Avatarian v2.0が出た!

AvatarianとはAvatarian(アバタリアン)はオンライン会議の参加者の顔をアバターに変換するアプリです。 Google Meet以外のオンライン会議で相手のカメラを個別にOFFにする機能がないようなので、顔を見ないといけない人は苦痛かも知れません。そこで、顔をアバター(画像)に変換するPC用アプリを作りました。 Avatarianを公開しました|Mat'zの好奇心爆発 (note.com) 顔を識別してアバターに置き換えるので、置き換わった後もどのアバターが誰か

    • 今話題のNPUを使ってAvatarianしてみた

      以前Lenovo Pro Communityでお借りしたNPU搭載PC(AI PC)で本格的にNPUを使ってみたレポートです。 AI PCとはAI PCとは、NPU(Neural Network Processing Unit)を搭載したPCのことで、Intel Core UltraシリーズはこのNPUを搭載している。 お借りしたモデルは ThinkBook 13x Gen4 Core Ultra 5 125H・16GBメモリー・512GB SSD・13.5型2.8K液晶

      • 法律は法治国家の正しさを決めるけど不変ではない

        国の法律って、成長途中なんだろうな。 法治国家にするために法律作って、7,8割の国民の暮らしをカバー出来るようにした。そこからマジョリティが変わったり(高齢化)しつつ、2,3割のマイノリティをカバーし始めている感じ。 例えば日本の国民のマジョリティは生まれた時から日本国民だったりするので、途中から日本国民になった人やなろうとしている人がカバーできてなかったりする。 法律はそういう変化すべきものなので、国会議員を代表者として選挙で当選させ、法律を変えていく(国会に立法権があるた

        • 再認が得意な人間と再生が得意なAIの関係

          どらえもんの表記がドラエモンではないのは分かるけど、書けと言われてすぐに書けない。 アンパンマンも、似顔絵を描けと言われても描けない。けど見るとどれが正しいか分かる。 生成AIはそういうところで使えるものだと考えると納得感が増した。 欲しいものを生み出すことは出来ないけど、出来たものが欲しかったものかどうかは分かる、ということ。 記憶と照合して認識することを再認という。 脳は再認は得意だけど再生は苦手ということが前提にあるけど、解明はされてないみたい。 ただし、観察結果か

        Avatarian v2.0が出た!

        マガジン

        • Avatarian
          5本
        • NPU
          0本
        • 【私の働き方実験】スマートグラスで〇〇する
          6本
        • 【私の働き方実験】バーチャル人間が稼ぐ
          4本
        • スピーカーを作る
          7本

        記事

          LLMの知識を編集する

          Claude 3 SonnetにLLMのこと聞いてアイデア広げてもらっている。 よく知らないので宇宙際タイヒミューラー理論を応用してくれとか話しながら、全然意味不明だろうなと思うこと聞いてもポジティブな回答ばかりなので楽しくなってくる。 実装力欲しい。 はい、御提案の概念表現アプローチは非常に興味深いものです。ナレッジグラフに概念を表現し、補助記号で同じ単語の異なる意味合いを区別する点が重要な工夫だと思われます。 このアプローチの長所は以下のようなものが考えられます:

          LLMの知識を編集する

          AGIのこと考えていたけど、政策失敗して政府の信頼が下がった時、価値を保つのは関係資産だと思う。しかし関係資産には税金をかけられない。税金を納めたくない人たちは法定通貨でもなく仮想通貨でもなく、関係性による取引を行うだろう。 もしかしたら、石貨が復活する世界があるのでは(ない)

          AGIのこと考えていたけど、政策失敗して政府の信頼が下がった時、価値を保つのは関係資産だと思う。しかし関係資産には税金をかけられない。税金を納めたくない人たちは法定通貨でもなく仮想通貨でもなく、関係性による取引を行うだろう。 もしかしたら、石貨が復活する世界があるのでは(ない)

          BPMN Sketch Minerという、テキストの並びだけでBPMNをかけるサービスがあり、よく出来ている。LLMと相性良さそう。直接BPMNのXMLをLLMから出力するのではなく、こういった専用のアプリに任せるのがよいな。 https://www.bpmn-sketch-miner.ai/tutorial/1-02-one-handover.html

          BPMN Sketch Minerという、テキストの並びだけでBPMNをかけるサービスがあり、よく出来ている。LLMと相性良さそう。直接BPMNのXMLをLLMから出力するのではなく、こういった専用のアプリに任せるのがよいな。 https://www.bpmn-sketch-miner.ai/tutorial/1-02-one-handover.html

          AGI Readyな社会についての考察①

          自分は、好奇心を持って新しいことを開拓していくことが、AGI時代の人間が価値を生む基本的な要素だと思っていた。 けど、人工知能は人間より大量の情報を同時に記録し処理できるので、好奇心も人間より強く、新しいことも思考し発見できるはずだ。 そうすると、新しく調べたり、自分で生み出したことを記録し、知識として取り入れられる(大量の学習を必要としない)AIの処理方式がAGIには必要なのではないか。 また、その時代には、人間はAGIの「発見」を(理由も理解できないまま)検証して教え

          AGI Readyな社会についての考察①

          AI PC ”Lenovo ThinkBook” Core Ultra 5 がうちに来た!

          Avatarianを作っていたおかげで、Lenovo Pro Communityにて最新のLenovo ThinkBookをお借りすることができました。 これは、AI PCと呼ばれる、「Copilot」ボタン付きのPCです。 Copilotボタンがついているだけではなく、NPUがあります。 NPUというのはNeural Processing Unitの略で、CPUやGPUとともにPCの中に入っている部品で、AIの処理に特化した計算機能を担う部分です。CPUやGPUでAIの処

          AI PC ”Lenovo ThinkBook” Core Ultra 5 がうちに来た!

          ノートテイキングアプリ(ナレッジ構築アプリ)のRefrect、使う暇なくフリープランの1ヶ月が経過していた。 GPT-4を使って先端的かと思ったけど、知識の紐付けや新しい知識の推奨があるわけでもなかった。 https://reflect.app/

          ノートテイキングアプリ(ナレッジ構築アプリ)のRefrect、使う暇なくフリープランの1ヶ月が経過していた。 GPT-4を使って先端的かと思ったけど、知識の紐付けや新しい知識の推奨があるわけでもなかった。 https://reflect.app/

          ChatGPTにBPMNのフロー図を描かせてみた

          最近BPMN2.0の勉強を始めたのだけれど、図形がたくさんあって適切に使うのにまず困るということが分かった。 また、業務の単位を大まかにしたり、細かくしたりもできるので適切な記載も慣れるまでは難しい。(下記のサイトはとても参考になります) そこで、業務を自然言語で記述したら、自動でプロセスができるようにすれば困らないのではないかと思って、ChatGPT(GPT-4-turbo)、Claude3 Opus、Gemini Advancedにお願いしてみた。 出来た! <?x

          ChatGPTにBPMNのフロー図を描かせてみた

          真空3Dプリンタおよびガス充填3Dプリンタ

          2024年3月16日、夜の買い物に行く途中閃いた。 真空成型3Dプリンタだ!と。 3Dプリンタは、フィラメントを溶かして固める熱溶解積層方式(FDM)、紫外線硬化樹脂に紫外線を当てて固める光造形方式、粉末をレーザーで焼き固める粉末造形方式がある。 この成型機内を真空にして中空構造のもの、例えばボールを作ると、中が真空のものが出来る。 粉末造形は中空部分に粉が残るから使えない。 光造形は紫外線硬化しながら液面を下げていく方式なら液が抜けて実現可能かもしれない。 そうすると

          真空3Dプリンタおよびガス充填3Dプリンタ

          ChatGPTはヒエログリフの翻訳ができなかった。言語分野でまだ人間にしかできない分野の一つだな。そう思うと、画像、音声、フォントがなかったら何もできないな。

          ChatGPTはヒエログリフの翻訳ができなかった。言語分野でまだ人間にしかできない分野の一つだな。そう思うと、画像、音声、フォントがなかったら何もできないな。

          VS Codeで音声入力&GPTでプログラミング

          VS Code がFebruary 2024 v1.87から音声入力(日本語もあり)に対応していた。 Visual Studio Code February 2024 VS Code Speech extension をインストールして 設定のaccessibility.voice.speechLanguage の画面で日本語を選択して追加の拡張パッケージをインストールするだけ。 Ctrl + Alt + Vで音声入力が開始できる。 音声入力後はEscキーを入力。 モード

          VS Codeで音声入力&GPTでプログラミング

          かつてなく快適なオンライン会議のやり方を見つけた。そう、オーディオミキサーである。

          在宅ワークが世の中に広まってからはや4年が経過した。 当初は手探りで在宅スタイルを模索してきたが、オーディオ環境には全然着手してこなかった。 理由は、音楽を聴きながらオンライン会議が出来ないので、会議だけなら手持ちのiPhone付属のマイク付きイヤフォンで充分だったからだ。 それでも、BGM聴きながら会議もできたらいいなと思って4年目にしてオーディオミキサーとか探してみたところ、ベストな製品を見つけた。 これだ。 エレコム オーディオミキサー アナログ 【 PS5 / P

          かつてなく快適なオンライン会議のやり方を見つけた。そう、オーディオミキサーである。

          検索してて日本語のつながりを可視化するサイトJapanese Graphみつけた。 面白い。 https://japanesegraph.com/

          検索してて日本語のつながりを可視化するサイトJapanese Graphみつけた。 面白い。 https://japanesegraph.com/