jniimi

大学でデータ分析とかAI開発とかやってます。音楽とかアートの仕事もたまに。(Assoc…

jniimi

大学でデータ分析とかAI開発とかやってます。音楽とかアートの仕事もたまに。(Assoc. Prof., Ph.D. in Economics)

マガジン

  • Python超基礎

    大学で持っているPython実習の資料を共有しています。

記事一覧

固定された記事

右耳に耳管ピンを入れた話

これは耳管開放症 (Patulous Eustachian tube) というかなりふざけた病の患者の話です。 まずは前提の話僕自身の基本情報として、2024年4月現在33歳で身長185cm、体重48kg…

jniimi
4か月前
14

量子化したローカルLLMによるセンチメント分析モデルのpreprintを公開しました

arXivにローカルLLMを用いたモデル提案のpreprintを公開しました。大規模言語モデル、今回はLLaMA-3を量子化したローカルモデルを使ったセンチメント分析手法の提案ですね…

jniimi
8日前

AIの線引きが変わる日

眠剤を飲んでも寝つけないのでこれを書いています。朝から会議です。 どこからどこまでがAIなのだろうかAIに関して、本当に日進月歩で新手法やサービスが出てくる。すごい…

jniimi
2週間前

宅録用ボーカルブースの改造

1. 吸音性能の低さに困っていた今の家に引っ越してからどうもボーカルの反響のコントロールができていないのが気に食わなかった。これまではMarantz Professionalのリフレ…

jniimi
2週間前
2

NLPの諸手法としてTextBlob、VADER、SO-CALをPythonでサクッと実行するための備忘録

0. とにかく参照モデルを作り続ける…いま書いているLLM系の応用論文の参照モデルとして有名なルールベース系の手法でひたすら精度を比較をしているので、ついでにコードを…

jniimi
1か月前
4

NotebookLMに論文を食わせて質問攻めにしてみた

1. NotebookLM日本公開!GoogleのGeminiベースのサービスであるNotebookLMが日本でも利用可能になったので、早速触ってみた。 NotebookLMについて簡単に説明しておくと、…

jniimi
1か月前
12

StreamlitでUser-Agentなどのユーザー情報を取得する(ただし面倒なJavaScriptは書かずに)

1. streamlit_js_evalとかいう便利すぎるやつちょっと作りたいものがあってStreamlit (https://streamlit.io) をいじっていたのだけれど、Python以外は長らく書いていない…

jniimi
1か月前
4

JSAI2024で研究発表してきました

JSAI2024: 2024年度 人工知能学会全国大会(第38回)に参加してきました。1週間の授業をほとんど全部休講にして。埋め合わせで大変な思いをしそうだ。https://www.ai-gakka

jniimi
1か月前
5

「真のデジタルネイティブ」こと現30代に襲い来るAI変革の大波

1. 「真のデジタルネイティブ」たるぼくら僕は以前から、真のデジタルネイティブは90年代前半(とその前後あたり)に生まれた世代なのではないかという漠然とした考えを持…

jniimi
2か月前
4

Colabのkerasとtransformers最新版で出る変なエラーへの対処メモ

情報が少ないのでメモを残しておく。 1. 問題の再現最近いよいよスパコンで計算することが多くなってきてColabはあんまり触ってなかったんだけど、ちょっと個人的なプロジ…

jniimi
3か月前
6

ファイルのアップロードから短縮URL取得まで一気に行うPythonスクリプトの作成

僕はクラウドストレージの同期ソフトを常駐させるのがとにかく嫌いなので、特にGoogle Driveはブラウザーで使っています。というのも、クラウドで触るのはデータ周りが多い…

jniimi
3か月前

Python超基礎1: 変数型と変数化

*授業資料をnoteに移植することにしたので、改訂しつつ上げていきます。 *この授業の目的はプログラミングを習得することではないため、情報学的な観点から見るとかなり…

jniimi
3か月前
2

音楽業界のブロックチェーン活用に関する一考察:KENDRIXの事例から考える

僕は大学で深層学習(いわゆる今のAIの基盤技術というか)の研究をしている身なのでブロックチェーンは専門外なんだけど、一方で楽曲をリリースしたりライブ活動したりする…

jniimi
3か月前
3

何ごともアルゴリズム次第だなと思った話

『アルゴリズムが世界を支配する』なんて本もあったように、現代はビッグデータというよりアルゴリズムの方が重要だと思う。もちろんデータが下支えになって初めて現代のAI…

jniimi
3か月前
4

EditageのJournal Selectionを使ってみた

Editageに英文校正をお願いするついでに、ものは試しということでJournal Selectionのオプションもつけてみたところ、校正から数日してPDFとdocmの2つのファイルでレポート…

jniimi
3か月前
1

ColabでWeights & BiasesのAPI KEY入力を自動化する

Weights & Biases (wandb) をColab上で使う場合、(いちいち環境変数を登録しない限りは)wandb.login()でトークンを入力する形が多いように思う。こんなふうに。 しかし…

jniimi
5か月前
右耳に耳管ピンを入れた話

右耳に耳管ピンを入れた話

これは耳管開放症 (Patulous Eustachian tube) というかなりふざけた病の患者の話です。

まずは前提の話僕自身の基本情報として、2024年4月現在33歳で身長185cm、体重48kg。かれこれ10年ぐらいこんな感じ。耳管開放症には中学時代から悩まされてきて、大学時代にたまたま行った病院で相談したところ難治性耳管開放症の診断をいただきました。一時期、『耳管開放症と10年付き合

もっとみる
量子化したローカルLLMによるセンチメント分析モデルのpreprintを公開しました

量子化したローカルLLMによるセンチメント分析モデルのpreprintを公開しました

arXivにローカルLLMを用いたモデル提案のpreprintを公開しました。大規模言語モデル、今回はLLaMA-3を量子化したローカルモデルを使ったセンチメント分析手法の提案ですね。

1. タイトルなどTitle: Dynamic Sentiment Analysis with Local Large Language Models using Majority Voting: A Study

もっとみる
AIの線引きが変わる日

AIの線引きが変わる日

眠剤を飲んでも寝つけないのでこれを書いています。朝から会議です。

どこからどこまでがAIなのだろうかAIに関して、本当に日進月歩で新手法やサービスが出てくる。すごい。そんななかで、僕らは今あれもこれもAIと呼んでいるけど、AIと呼ばれるものの範囲がこの勢いで広がっていることを考えると、実際のところもう一部のものはAIとは呼べなくなってくるんじゃないか。
そしてその代表例は画像生成なんじゃないかと

もっとみる
宅録用ボーカルブースの改造

宅録用ボーカルブースの改造

1. 吸音性能の低さに困っていた今の家に引っ越してからどうもボーカルの反響のコントロールができていないのが気に食わなかった。これまではMarantz ProfessionalのリフレクションフィルターSound Shield Iをマイクスタンドに刺して使っていて、見た目はスタイリッシュなのだけれど、上方向のエネルギーが吸収できていないから天井からの反響を拾っている感じがしていた。

これはマイク周

もっとみる
NLPの諸手法としてTextBlob、VADER、SO-CALをPythonでサクッと実行するための備忘録

NLPの諸手法としてTextBlob、VADER、SO-CALをPythonでサクッと実行するための備忘録

0. とにかく参照モデルを作り続ける…いま書いているLLM系の応用論文の参照モデルとして有名なルールベース系の手法でひたすら精度を比較をしているので、ついでにコードを(非常に簡単ながら)共有しておこうかと思う。手法は今のところ、TextBlob、VADER、SO-CALの3つ。本当はSupport Vector Machine、k-Nearest Neighbor、Naive Bayesでも比較し

もっとみる
NotebookLMに論文を食わせて質問攻めにしてみた

NotebookLMに論文を食わせて質問攻めにしてみた

1. NotebookLM日本公開!GoogleのGeminiベースのサービスであるNotebookLMが日本でも利用可能になったので、早速触ってみた。

NotebookLMについて簡単に説明しておくと、こちらが提示したソースに従って情報の抽出や要約、議論ができるサービス。これが必要とされる背景として、生成AIを検索サービスに絡めると、LLM一般で問題とされるハルシネーションだけではなく、Red

もっとみる
StreamlitでUser-Agentなどのユーザー情報を取得する(ただし面倒なJavaScriptは書かずに)

StreamlitでUser-Agentなどのユーザー情報を取得する(ただし面倒なJavaScriptは書かずに)

1. streamlit_js_evalとかいう便利すぎるやつちょっと作りたいものがあってStreamlit (https://streamlit.io) をいじっていたのだけれど、Python以外は長らく書いていない人間なのでフロントエンドがどうも触りづらくて困っていた(まあフロントエンドなんか触らなくていいのがstreamlitの良さなのでその辺の根本を間違えているといえばそうなのだけれど)。

もっとみる
JSAI2024で研究発表してきました

JSAI2024で研究発表してきました

JSAI2024: 2024年度 人工知能学会全国大会(第38回)に参加してきました。1週間の授業をほとんど全部休講にして。埋め合わせで大変な思いをしそうだ。https://www.ai-gakkai.or.jp/jsai2024/

1. 自分の発表について[1F5-GS-10-04] レビュー文書・ユーザープロフィール・店舗情報を考慮したマルチモーダル深層学習による飲食店の評価予測手法の提案

もっとみる
「真のデジタルネイティブ」こと現30代に襲い来るAI変革の大波

「真のデジタルネイティブ」こと現30代に襲い来るAI変革の大波

1. 「真のデジタルネイティブ」たるぼくら僕は以前から、真のデジタルネイティブは90年代前半(とその前後あたり)に生まれた世代なのではないかという漠然とした考えを持っています。
たとえば僕は1991年生まれの現33歳で、小学校低学年にISDNによるパソコンでのインターネット世界を経験し(ネットのやり過ぎで家の固定電話が使えずよく怒られた)、中学時代におもしろフラッシュ倉庫に入り浸り、高校時代はガラ

もっとみる
Colabのkerasとtransformers最新版で出る変なエラーへの対処メモ

Colabのkerasとtransformers最新版で出る変なエラーへの対処メモ

情報が少ないのでメモを残しておく。

1. 問題の再現最近いよいよスパコンで計算することが多くなってきてColabはあんまり触ってなかったんだけど、ちょっと個人的なプロジェクトのために触ってみたら変なエラーが出た。
2024年4月26日現在、ColabでKeras + transformersでBERTあたりを組み込んだモデルを構築する場合、デフォルトの環境は
- tensorflow: 2.15

もっとみる
ファイルのアップロードから短縮URL取得まで一気に行うPythonスクリプトの作成

ファイルのアップロードから短縮URL取得まで一気に行うPythonスクリプトの作成

僕はクラウドストレージの同期ソフトを常駐させるのがとにかく嫌いなので、特にGoogle Driveはブラウザーで使っています。というのも、クラウドで触るのはデータ周りが多いのでローカルと同期する必要はほとんどなくて、たまにちょっとしたファイルをサクッと共有する必要があるぐらいなんですよね。するとファイルをクラウドストレージに(一方的に)アップロードしつつ短縮した共有リンクがすぐ返ってきたら便利だな

もっとみる
Python超基礎1: 変数型と変数化

Python超基礎1: 変数型と変数化

*授業資料をnoteに移植することにしたので、改訂しつつ上げていきます。
*この授業の目的はプログラミングを習得することではないため、情報学的な観点から見るとかなり大雑把な内容になっています。

今回はインターネット環境さえあれば誰でも簡単にプログラミング言語Python(パイソン)を用いて解析を行うことができるGoogle Colaboratory(以後
Colab)を利用した解析例を示す。(使

もっとみる
音楽業界のブロックチェーン活用に関する一考察:KENDRIXの事例から考える

音楽業界のブロックチェーン活用に関する一考察:KENDRIXの事例から考える

僕は大学で深層学習(いわゆる今のAIの基盤技術というか)の研究をしている身なのでブロックチェーンは専門外なんだけど、一方で楽曲をリリースしたりライブ活動したりする中で音楽関係の企業さんとの付き合いも多い(一応アドバイザー的なポジションにいる)ので、音楽テック関係の情報はそれなりに追い続けてきた。

なんだか知らないけど、生成AIが話題になる一瞬前までのほんの一時期に限っては、AIとブロックチェーン

もっとみる
何ごともアルゴリズム次第だなと思った話

何ごともアルゴリズム次第だなと思った話

『アルゴリズムが世界を支配する』なんて本もあったように、現代はビッグデータというよりアルゴリズムの方が重要だと思う。もちろんデータが下支えになって初めて現代のAI系アルゴリズムが走るわけではあるんだけど。

最初に書いたコード1行に1つのJSONが並んだテキストファイルを1行ずつパースしながらpandasのDataFrameを作る作業をしなきゃいけなくて、とりあえず以下のようなコードを書いた(正確

もっとみる
EditageのJournal Selectionを使ってみた

EditageのJournal Selectionを使ってみた

Editageに英文校正をお願いするついでに、ものは試しということでJournal Selectionのオプションもつけてみたところ、校正から数日してPDFとdocmの2つのファイルでレポートが納品された。公式で公開されているサンプル(PDF)どおりのものが届いた。

すでに50件ぐらい比較検討してますので、投稿先も自分で選べないのかというのはとりあえず置いておいてください。純粋な興味なんです。

もっとみる
ColabでWeights & BiasesのAPI KEY入力を自動化する

ColabでWeights & BiasesのAPI KEY入力を自動化する

Weights & Biases (wandb) をColab上で使う場合、(いちいち環境変数を登録しない限りは)wandb.login()でトークンを入力する形が多いように思う。こんなふうに。

しかし、最近とにかくColabをちょろっと立ち上げてはモデルを組んでぶん回してノートブックを複製してまたモデルをいじって、みたいなことがとにかく多くて、インスタンス立ち上げのあといちいちログインで引っか

もっとみる