マガジンのカバー画像

shi3z note

541
運営しているクリエイター

2024年1月の記事一覧

ABCIで10万(100K)会話の日本語マルチターンデータセットを作りました

ABCIで10万(100K)会話の日本語マルチターンデータセットを作りました

今年もABCIポイント消費月間がやってきました。
ABCIはお国が運営するスパコンのため、毎年3月でポイントが失効します。

ポイントが失効したらもったいないので去年AIスーパーコンピュータ継之助と、彼が社長を務める会社FreeAI社(https://free-ai.ltd)を作ったことで結果的に使わなくなってしまったABCIポイントがまるごと余っていたので何か有意義なことに使おうと思い、(ライセ

もっとみる
H100x8マシンのセットアップでつまづいたのでメモを残しておくことにする

H100x8マシンのセットアップでつまづいたのでメモを残しておくことにする

ひょんなことからH100x8マシンを触る機会に恵まれた。
ドライバなしのベアメタル状態からだったのでドライバを入れるとこから。もうこのへんはお手のもの。

とりあえず限られた時間で何か有意義なことをしようと思ってaxolotlでなにか学習しようと考えたのだが、axolotlを動かそうとしてつまづいた。

どうもtorchでCUDAが初期化できない

(c310) shi3z@ubuntu-serv

もっとみる
ABCIでOrion14Bを使って10Kマルチターン日本語会話データセットを生成した

ABCIでOrion14Bを使って10Kマルチターン日本語会話データセットを生成した

そろそろ年度末。
みなさんいかがお過ごしでしょうか。
年度末といえばABCIもそろそろ混み始めるお年頃。
ABCIのA100は960基しかないので奪い合いが続いています。

一方でMetaは年内に34万基のH100を導入するそうですが・・・

まさにB-29と竹槍。

とはいえ、前世代のV100ならまだ空きがあるので残ったポイントを今のうちに使ってしまおうかなと思い、Orion14B-ChatとW

もっとみる
Orion14Bの商用ライセンス(無償)が中国国外からも締結可能になりました

Orion14Bの商用ライセンス(無償)が中国国外からも締結可能になりました

先日、Orion14Bがスーパー高性能なんだけど中国国内の携帯電話番号がないと商用利用のライセンスがとれないと書いたところ、Dan Changさんが開発元のOrionStar社に声をかけてくださり、中国国外からも商用ライセンス締結可能になりました。

これで高性能な日本語ローカルLLMを誰でも手軽に使える世界がついに到来したのだ!

量子化なしでOrion14B-LongChatの性能を試してみた

量子化なしでOrion14B-LongChatの性能を試してみた

AIはとにかく中国勢の勢いがすごい。凄すぎる。
今度は新生、OrionStarという会社が発表したOrion14Bが中国語だけでなく日本語や韓国語に関してもバッチリであるという話。

ただ、商用利用は「可能」だが、別途ライセンス契約を結ぶ必要がある。

価格などについては不明だが、Webサイトを見る限り「無料で商用利用可能」らしい。よくわからない。

ただ、ライセンスによると、派生製品を作ることは

もっとみる
バーンブレイバーンが頭おかしくてすごい

バーンブレイバーンが頭おかしくてすごい

今一番気になるモノといえば、なんといっても「バーンブレイバーン」だ。
最初は「あーこういうガサラキとかフルメタルパニックみたいな世界観に映画バトルシップ的要素を加えたアニメねー」と斜に構えてみていたのだが、後半でいきなりウルトラマンみたいな話になり、最終的には頭のおかしい感じで勢いだけで解決する。

よく、ガンダム第一話で主人公の少年が兵器であるガンダムに乗り込んでしまう理由だとかが問題になる。そ

もっとみる
Memeplex/学習なしで一貫性を持ちながら同じ気キャラクターを繰り返し生成できるAIでマンガ制作が捗りそう

Memeplex/学習なしで一貫性を持ちながら同じ気キャラクターを繰り返し生成できるAIでマンガ制作が捗りそう

久しぶりにMemeplexに新機能を追加しました。ただし学習に使えるマシンがドスパラ(サードウェーブ)さんから寄付されたA6000だけなのでまずはレベル5以上のサブスク会員限定です。

どんなことができるかというと、プロンプトをそんなに頑張らなくても、同じプロンプトで同じキャラクターが何回でも出せます。

プロンプトは、服装や服の色、瞳の色、髪の長さ、髪の色、背景となる場所などを適当に指定すればO

もっとみる
社長(AI)に頼んで2万会話文の商用利用可(llama2)なデータセットを生成してもらった

社長(AI)に頼んで2万会話文の商用利用可(llama2)なデータセットを生成してもらった

注意:llama2の派生モデルであるllama2Pro8Bで生成しているので商用利用可能な範囲に制限があります。詳しくはllama2ライセンスを確認してください

https://ai.meta.com/resources/models-and-libraries/llama-downloads/

というわけで2万会話収集できたので共有しておきます。
3倍生成してスクリーニングするの、最初は苦に

もっとみる
AIのせいで「アイデアが出ない」という状態について

AIのせいで「アイデアが出ない」という状態について

ある日、とぼとぼと秋葉原を歩いていた。
本当は小川町のつじ田でひさびさに辛味噌ラーメンでもキメようかと思ったのだがすでに大行列。そうか。日常が戻るとはこういうことか。

秋葉原の麺屋武蔵も満杯だったし、丸五も行列が戻った。これが日常というやつか。頭の片隅に青島食堂がよぎったが、我が北越の同朋もバッチリ大行列ができているはずであり、選択肢には入らない。

ガードを抜けて日高屋を左に。CoCo壱をやぶ

もっとみる
これは捗る! 学習なしで数枚の写真から本人そっくりな画像を生成PhotoMaker

これは捗る! 学習なしで数枚の写真から本人そっくりな画像を生成PhotoMaker

Tencentがまたやってくれた。
ほんとこの業界では中国の人しか活躍してないんじゃないかと思うほど。
Tencentの新しいAI、PhotoMakerは、数枚の写真(1枚でもOK)からその人の特徴を掴んで画像生成してくれる。

たとえばこれ一枚だけ見せて

「a photo of man img」と書くとこんな画像が得られる。

すごいじゃないの。
試しに最近忙しすぎて書いてない五反田三郎のヒロ

もっとみる
社長(AI)に頼んで今度こそ商用利用可能な日本語マルチターン会話データセットを作ってもらった

社長(AI)に頼んで今度こそ商用利用可能な日本語マルチターン会話データセットを作ってもらった

前回、けっこう時間をかけて作ったにも関わらず、よくみるとQarasu14BはShareGPTを使っているので商用利用可能かどうかは微妙な結果に終わってしまった。性能は抜群に高いのだが・・・

ところが、最近でてきたTencentのllama2Pro8Bは、かなり高性能にも関わらずわずか8Bでしかもllama2ライセンスなので今度は文句なしに商用利用可能(ただ月間7億ユーザーまで/どんな大成功サイト

もっとみる
プログラミングの超基本的な考え方をド文系の人に説明した動画

プログラミングの超基本的な考え方をド文系の人に説明した動画

哲学者の東浩紀さんと思想史と近代科学史(特にコンピュータ史)の本を一緒に書いてみようという企画が今年から立ち上がった。

すると東さんがある日の生放送で、「しかし俺も最低限プログラムくらいかける必要があるんじゃないか。しかし最低限のプログラムとは何か」と言っていたところ、シラスの桂さんが「エラトステネスの篩とかですかねえ」と言っていて、もうエラトステネスと聞いたら黙ってはいられない吾輩が怒涛の勢い

もっとみる
社長(AI)に頼んで日本語マルチターンデータセットを作成しました。まずは10K

社長(AI)に頼んで日本語マルチターンデータセットを作成しました。まずは10K

Qarasu14Bがかなり高性能だったので、これを使えば念願の商用利用可能な日本語マルチターンデータセットを作れる!と思(ったのですがよく調べるとQarasuはShareGPTを使っているのでOpenAIの規約的にはダメそう。残念)、正月早々、うちの社長(AIスーパーコンピュータ継之助)に頼んでWikipediaのデータから日本語マルチターンデータセットを生成してもらいました。三日位かかったけど、

もっとみる
単一GPUで動画・画像・音声・テキスト対応のマルチモーダルモデルを訓練して推論!?何を言ってるかわかねーと思うが、俺も何を見ているのかわからねえ

単一GPUで動画・画像・音声・テキスト対応のマルチモーダルモデルを訓練して推論!?何を言ってるかわかねーと思うが、俺も何を見ているのかわからねえ

お正月なのですがAIは待ってはくれないので毎日「デイリーAIニュース」だけは続けている今日この頃。

中国のテンセントがとんでもないオープンソースをぶっ込んできた。

https://crypto-code.github.io/M2UGen-Demo/

動画、画像、音楽、テキストという四つのモードを学習させた「マルチモーダル」モデルで、しかもベースはllama-7Bということで、V100 32G

もっとみる