マガジンのカバー画像

shi3z note

498
運営しているクリエイター

記事一覧

【これがゲームチェンジャーか!】松尾研のTanuki-8BとTanuki-8x8Bを試す

【これがゲームチェンジャーか!】松尾研のTanuki-8BとTanuki-8x8Bを試す

東大松尾研がついに真打とも言えるべきオープンな日本語LLMを発表した。その名もTanuki

なぜタヌキなのか?
その謎は謎のままだが、とにかく日本語性能がGemini1.5Proに次ぎ、少し前のGPT-4よりも高い上に商用利用可能という太っ腹仕様なので使わない手はない。むしろこれさえあればもう誰もGPTに課金しなくて済む、そんな未来が来るのかもしれない。

しかし、Tanukiは特殊な何かをして

もっとみる
Macで完全ローカルで1万6千字の記事の作成から日本語訳まで行う

Macで完全ローカルで1万6千字の記事の作成から日本語訳まで行う

今、故あってTGVに乗っている。
TGVは、フランス版新幹線のようなものだが、日本の新幹線に比べると通信のつながりがそんなに良くない。したがって、AIに自由にアクセスするのも一苦労である。こんな時、ローカルで全て完結するLLMがあると非常に便利だ。

ちなみにコーディング支援にはmlx-community--codegemma-7b-it-8bitを使った。原稿生成と日本語訳にはshi3z/mlx

もっとみる
GPU使用率をリアルタイムで監視できるNVITOPが可愛すぎて生きるのが辛い

GPU使用率をリアルタイムで監視できるNVITOPが可愛すぎて生きるのが辛い

もうT/Oでいいくらいなんだけど。
GPU使用率を見るのに毎回nvidia-smiを実行する簡単なお仕事で年収3000万円取ってるプロンプトエンジニアはいねがー?

割と洒落にならないくらい居そうなのでまあそれはさておき。
nvidia-smiがマイ実行コマンド上位ランクに位置しそうなお父さんには朗報です。

それがnvitop。
そう、その名の通り、nvidia-smiとtopを合わせたような便

もっとみる
Macで完全ローカルでLongWriterを動かして1万6千字の原稿を生成する

Macで完全ローカルでLongWriterを動かして1万6千字の原稿を生成する

MLXがすごく簡単に作れてしかもローカルで動くのでここんとこずっと機上だったりインターネットがあまり繋がらなかったりする地域にいる我輩にとってはMLXによるAIがある意味で命綱みたいなものである。

そのMLXで、長文を書かせるLongWriterをMLXに変換して使ってみた。
結果は予想以上のものだった。

最初はちょっと苦戦したのだが、noguchi_shojiさんのヒントのおかげで長文を生成

もっとみる
 teamLab Borderless Jeddahは究極のイマーシブオーディオだ! / ど素人のピュアオーディオ入門番外編

teamLab Borderless Jeddahは究極のイマーシブオーディオだ! / ど素人のピュアオーディオ入門番外編

ド肝を抜かれた。

そう表現するしかあるまい。
今年オープンしたばかりのチームラボ・ボーダレス・ジッダ。
ジッダというのは、サウジアラビアにある紅海に面した都市で、聖地メッカに最も近い空港がある。

このジッダの空港は、メッカへの巡礼者専用のターミナルが用意されるなど世界にも例を見ない施設となっている。

渡航にはあらかじめ観光ビザを取得する必要があるが、オンラインで簡単に取れる。

最大の問題は

もっとみる
ど素人のピュアオーディオ入門 世界の空の下で一人オーディオ鑑賞する

ど素人のピュアオーディオ入門 世界の空の下で一人オーディオ鑑賞する

イスタンブールに来ている。
と言っても、美しいブルーモスクを見に立ち寄ったわけではない。それほどの時間的余裕はない。猶予は、ほんの6時間ほどだ。乗り換えというやつである。

出発がコードシェアだったので少し不安ではあったが、機内は快適そのものだった。こんなに快適なのに、僕は日本で一時保存しておいたNobrockTVをエンドレスで流していた。我ながらどうかしてる。

多少迷いはしたが、割とスムーズに

もっとみる
AMD9950X/128GB DDR5+4090によるvllmベンチマーク

AMD9950X/128GB DDR5+4090によるvllmベンチマーク

AMD9950Xと4090をせっかくインストールしたので、とりあえずvllmでどのくらいのスループットが出るのか確かめてみた。

トルコのイスタンブールから浅草橋の技研にリモートアクセスして確かめる

機材構成としては以下の通り

なのでまあ基本的にGPUのスピードだと思うが、何パターンか試してみた。

まずはvllmのデフォルトのパラメータでやってみる(プロンプト数=2)

python ben

もっとみる
Ryzen9 9950Xを買って組み上げるRTA

Ryzen9 9950Xを買って組み上げるRTA

昨日発売のRyzen9 9950Xを買ってすぐ組み立ててみた。
久々のAMDのフラグシップ。まあスレッドリッパーほどではないがご家庭で使う目的ならハイエンドと言える。

目的は 当然LLMを動かすことなのでOSはLinuxをチョイス

最初は16%ほど処理が高速と言われるClear Linuxを入れてみたのだがNVIDIAドライバの導入が2014年に里帰りしたのかというくらい面倒だったので出張まえ

もっとみる
(マジの)ご家庭にジャービス。完全 Macのみで日本語音声応答するAIを作った

(マジの)ご家庭にジャービス。完全 Macのみで日本語音声応答するAIを作った

Speech-to-speechは、NVIDIAのGPU搭載マシンがあればローカルで音声認識、応答生成、音声合成ができる画期的なオープンソースツールだった。

しかし一つだけ不満があったのは、これが日本語には対応していないということだ。

ワイはコスモポリタンである。
・・・そう名乗ってしまったから、「そういえばコスモポリタンってなんだろう」と思ってClaude-3に聞いてみた。

そう、当然、飲

もっとみる
nanoGPTにおける進化計算の実験 / 進化計算はハイパーパラメータチューニングにも有効だった

nanoGPTにおける進化計算の実験 / 進化計算はハイパーパラメータチューニングにも有効だった

AIサイエンティストに投げるため、進化計算(Evolutional Computing)をnanoGPTのハイパーパラメータチューニングに適用してみることにした。

極めていい加減な気持ちで書いたため、これで上手くいくのか我ながら疑問だったが、結論から言うと有効だった。

まず、どんないい加減なコードで進化計算をしたのか書く。
本来はDNAを定義して、DNAからプログラムを生成するコードを書くべき

もっとみる
嘘か本当か!?無限長コンテキスト対応のオイルマネーLLM、FalconMambaを試す

嘘か本当か!?無限長コンテキスト対応のオイルマネーLLM、FalconMambaを試す

アラブ首長国連邦のTIIが開発したFalconMambaは無限長コンテキストをサポートするという。

まあMambaだから当然なんだけど、果たしてその「無限長」はどのくらい無限に近いのか?

noguchi-shojiさんがいち早く日本語で試していたが、日本語はどうやら全然ダメなようだ。

そこで英語で試してみる。

# pip install acceleratefrom transformer

もっとみる
こいつを待ってた!3万字以上自動的に書いてくれるオープンLLMが登場!三回回せば本一冊分に!

こいつを待ってた!3万字以上自動的に書いてくれるオープンLLMが登場!三回回せば本一冊分に!

なんか最近、いろんな会社が「おらが村のLLMが凄いだ」と言ってるが、実際には100万トークン読めても出力が8Kまでだったり、もっとひどいと4Kだったりと、LLMの価値はパラメータ数では決まらず、むしろどのくらい長い文章を出してくれるのかということの方が大事だ。僕がLLMで本を書いたのはもう一年前だが、このときは4Kくらいしか出力してくれなくて往生したものである。

ところがなんということでしょう。

もっとみる
人間よりいいぜ!と思ってAI科学者を使ったら、人間より日給が高かった

人間よりいいぜ!と思ってAI科学者を使ったら、人間より日給が高かった

世の中そんなに甘くない。
SakanaAIの「AI科学者(AI Scientist)」を使ったら爆発的に研究が捗る!と思ったのも束の間、人間並、いや下手すると人間より日給が高くなる可能性があることがわかった。

この二日間、好き放題にAI科学者に研究させた結果がこのザマ

二日で300ドルを突破する勢いで、これはちょっと遊びでやるレベルを超えてる。

また、指示の出し方(seed_ideas.js

もっとみる
SakanaAIのAIサイエンティストで独自の実験テンプレートを作ってみる(実験中)

SakanaAIのAIサイエンティストで独自の実験テンプレートを作ってみる(実験中)

SakanaAIが昨日発表したAIサイエンティストでは、「こういう研究をしてみなせい」とAI科学者に指示できる。とりあえずサンプルは動かせるようになったので、自分で独自の実験テンプレートを作ってAI科学者に暇さえあれば研究させたい。

まず、テンプレートは「templates」というディレクトリにある。
とりあえず一番簡単なMNISTをやりたかったので、MNISTでテンプレートを作ってみる。

n

もっとみる