jniimi

大学でデータ分析とかAI開発とかやってます。音楽とかアートの仕事もたまに。(Assoc…

jniimi

大学でデータ分析とかAI開発とかやってます。音楽とかアートの仕事もたまに。(Assoc. Prof., Ph.D. in Economics)

マガジン

  • Python超基礎

    大学で持っているPython実習の資料を共有しています。

最近の記事

  • 固定された記事

右耳に耳管ピンを入れた話

これは耳管開放症 (Patulous Eustachian tube) というかなりふざけた病の患者の話です。 まずは前提の話僕自身の基本情報として、2024年4月現在33歳で身長185cm、体重48kg。かれこれ10年ぐらいこんな感じ。耳管開放症には中学時代から悩まされてきて、大学時代にたまたま行った病院で相談したところ難治性耳管開放症の診断をいただきました。一時期、『耳管開放症と10年付き合って』というブログをやっていました。 症状の程度としては、横になるか、頭を真下に

    • 過去の天気予報データを蓄積するリポジトリを作りました

      jniimi/weather_forecast_japan (Huggingface Datasets) 7日間先までの気象予測の値を取得しています。 まだ蓄積し始めなのでしばらくは使い物にならないと思いますが。 1. データ作成の背景仕事の関係で気象関係のデータを使う必要ができたのだけれど、いい感じに使えるものがいまいちなかったので自分で作った。 完全データを使って変数間の関係性を事後的に明らかにするような類の解析なら観測値を使えばいいわけなのだけれど、もし天気が影響し

      • Google Colabでユーザーのメールアドレスを取得

        大学の課題としてGoogle Colabを使ったデータ分析レポートを課しているわけですが、それに関して前からやってみたかったこととして、Colabを操作しているGoogleアカウントの情報を取得するというのがあった。メールアドレスの取得に基づいて実現したいことは主に3つ。 本人のアカウントで(最終的には)操作されたことを確認したい セキュリティの観点から大学発行のGoogleアカウントで利用していることを確認したい 分析データを人によって違うものにするため、データ生成時

        • 映画『ペルシャ猫を誰も知らない』を観て音楽がさらに好きになった話

          イランの映画監督Bahman Ghobadi(バフマン・ゴバディ)の2009年の映画”No One Knows About Persian Cats”(邦題:『ペルシャ猫を誰も知らない』, Kasi Az Gorbehaveh Irani Khabar Nadareh)を今さら観た。amazonでは中古DVDにプレミア価格がついていて、普通ならDVDボックスが買えるぐらいの金額を支払って購入した。 予告編冒頭から"In Iran, there are laws agains

        • 固定された記事

        右耳に耳管ピンを入れた話

        • 過去の天気予報データを蓄積するリポジトリを作りました

        • Google Colabでユーザーのメールアドレスを取得

        • 映画『ペルシャ猫を誰も知らない』を観て音楽がさらに好きになった話

        マガジン

        • Python超基礎
          1本

        記事

          量子化したローカルLLMによるセンチメント分析モデルのpreprintを公開しました

          arXivにローカルLLMを用いたモデル提案のpreprintを公開しました。大規模言語モデル、今回はLLaMA-3を量子化したローカルモデルを使ったセンチメント分析手法の提案ですね。 1. タイトルなどTitle: Dynamic Sentiment Analysis with Local Large Language Models using Majority Voting: A Study on Factors Affecting Restaurant Evaluat

          量子化したローカルLLMによるセンチメント分析モデルのpreprintを公開しました

          AIの線引きが変わる日

          眠剤を飲んでも寝つけないのでこれを書いています。朝から会議です。 どこからどこまでがAIなのだろうかAIに関して、本当に日進月歩で新手法やサービスが出てくる。すごい。そんななかで、僕らは今あれもこれもAIと呼んでいるけど、AIと呼ばれるものの範囲がこの勢いで広がっていることを考えると、実際のところもう一部のものはAIとは呼べなくなってくるんじゃないか。 そしてその代表例は画像生成なんじゃないかと思う。 今の世の中において、AIをAIたらしめる要素は生成性(generati

          AIの線引きが変わる日

          宅録用ボーカルブースの改造

          1. 吸音性能の低さに困っていた今の家に引っ越してからどうもボーカルの反響のコントロールができていないのが気に食わなかった。これまではMarantz ProfessionalのリフレクションフィルターSound Shield Iをマイクスタンドに刺して使っていて、見た目はスタイリッシュなのだけれど、上方向のエネルギーが吸収できていないから天井からの反響を拾っている感じがしていた。 これはマイク周り全てを厚めの吸音材で埋め尽くさないとダメそうだなということで、リフレクションフ

          宅録用ボーカルブースの改造

          NLPの諸手法としてTextBlob、VADER、SO-CALをPythonでサクッと実行するための備忘録

          0. とにかく参照モデルを作り続ける…いま書いているLLM系の応用論文の参照モデルとして有名なルールベース系の手法でひたすら精度を比較をしているので、ついでにコードを(非常に簡単ながら)共有しておこうかと思う。手法は今のところ、TextBlob、VADER、SO-CALの3つ。本当はSupport Vector Machine、k-Nearest Neighbor、Naive Bayesでも比較してるんだけど、学習の過程を示すのが面倒なのでその辺はまた今度にします。 それら

          NLPの諸手法としてTextBlob、VADER、SO-CALをPythonでサクッと実行するための備忘録

          NotebookLMに論文を食わせて質問攻めにしてみた

          1. NotebookLM日本公開!GoogleのGeminiベースのサービスであるNotebookLMが日本でも利用可能になったので、早速触ってみた。 NotebookLMについて簡単に説明しておくと、こちらが提示したソースに従って情報の抽出や要約、議論ができるサービス。これが必要とされる背景として、生成AIを検索サービスに絡めると、LLM一般で問題とされるハルシネーションだけではなく、Redditなどに落ちてる真偽不明な情報に引っ張られるという問題があって(代表例として

          NotebookLMに論文を食わせて質問攻めにしてみた

          StreamlitでUser-Agentなどのユーザー情報を取得する(ただし面倒なJavaScriptは書かずに)

          1. streamlit_js_evalとかいう便利すぎるやつちょっと作りたいものがあってStreamlit (https://streamlit.io) をいじっていたのだけれど、Python以外は長らく書いていない人間なのでフロントエンドがどうも触りづらくて困っていた(まあフロントエンドなんか触らなくていいのがstreamlitの良さなのでその辺の根本を間違えているといえばそうなのだけれど)。特にUser-Agentなんかを取得するには、これまでstreamlitのbi-

          StreamlitでUser-Agentなどのユーザー情報を取得する(ただし面倒なJavaScriptは書かずに)

          JSAI2024で研究発表してきました

          JSAI2024: 2024年度 人工知能学会全国大会(第38回)に参加してきました。1週間の授業をほとんど全部休講にして。埋め合わせで大変な思いをしそうだ。https://www.ai-gakkai.or.jp/jsai2024/ 1. 自分の発表について[1F5-GS-10-04] レビュー文書・ユーザープロフィール・店舗情報を考慮したマルチモーダル深層学習による飲食店の評価予測手法の提案 そもそもJSAIでの発表は6年ぶりだったし、しかもこの学会では初めての単独発表

          JSAI2024で研究発表してきました

          「真のデジタルネイティブ」こと現30代に襲い来るAI変革の大波

          1. 「真のデジタルネイティブ」たるぼくら僕は以前から、真のデジタルネイティブは90年代前半(とその前後あたり)に生まれた世代なのではないかという漠然とした考えを持っています。 たとえば僕は1991年生まれの現33歳で、小学校低学年にISDNによるパソコンでのインターネット世界を経験し(ネットのやり過ぎで家の固定電話が使えずよく怒られた)、中学時代におもしろフラッシュ倉庫に入り浸り、高校時代はガラケーで連絡を取りながらWord/Excelで生徒会の仕事をこなし、大学時代に日本

          「真のデジタルネイティブ」こと現30代に襲い来るAI変革の大波

          Colabのkerasとtransformers最新版で出る変なエラーへの対処メモ

          情報が少ないのでメモを残しておく。 1. 問題の再現最近いよいよスパコンで計算することが多くなってきてColabはあんまり触ってなかったんだけど、ちょっと個人的なプロジェクトのために触ってみたら変なエラーが出た。 2024年4月26日現在、ColabでKeras + transformersでBERTあたりを組み込んだモデルを構築する場合、デフォルトの環境は - tensorflow: 2.15.0 - transformers: 4.40.0 になっている。 impor

          Colabのkerasとtransformers最新版で出る変なエラーへの対処メモ

          ファイルのアップロードから短縮URL取得まで一気に行うPythonスクリプトの作成

          僕はクラウドストレージの同期ソフトを常駐させるのがとにかく嫌いなので、特にGoogle Driveはブラウザーで使っています。というのも、クラウドで触るのはデータ周りが多いのでローカルと同期する必要はほとんどなくて、たまにちょっとしたファイルをサクッと共有する必要があるぐらいなんですよね。するとファイルをクラウドストレージに(一方的に)アップロードしつつ短縮した共有リンクがすぐ返ってきたら便利だなーなんて思っていて、しかしなかなか一気通貫のコードを書く余裕がなかったんですよね

          ファイルのアップロードから短縮URL取得まで一気に行うPythonスクリプトの作成

          Python超基礎1: 変数型と変数化

          *授業資料をnoteに移植することにしたので、改訂しつつ上げていきます。 *この授業の目的はプログラミングを習得することではないため、情報学的な観点から見るとかなり大雑把な内容になっています。 今回はインターネット環境さえあれば誰でも簡単にプログラミング言語Python(パイソン)を用いて解析を行うことができるGoogle Colaboratory(以後 Colab)を利用した解析例を示す。(使用にはGoogleアカウントでのログインが必要だが、名城生はメイネットIDを用い

          Python超基礎1: 変数型と変数化

          音楽業界のブロックチェーン活用に関する一考察:KENDRIXの事例から考える

          僕は大学で深層学習(いわゆる今のAIの基盤技術というか)の研究をしている身なのでブロックチェーンは専門外なんだけど、一方で楽曲をリリースしたりライブ活動したりする中で音楽関係の企業さんとの付き合いも多い(一応アドバイザー的なポジションにいる)ので、音楽テック関係の情報はそれなりに追い続けてきた。 なんだか知らないけど、生成AIが話題になる一瞬前までのほんの一時期に限っては、AIとブロックチェーンが各種メディアで一緒に取り上げられることがとても多かった。今思えばそう大した関係

          音楽業界のブロックチェーン活用に関する一考察:KENDRIXの事例から考える