となかい

学生、のんびりLLMとか機械学習とかの研究をしてます。 ブログ調の記事は読みづらいと思…

となかい

学生、のんびりLLMとか機械学習とかの研究をしてます。 ブログ調の記事は読みづらいと思ってるので箇条書きで淡々とした手順メモを目指します。

記事一覧

ABCI上でDeepSpeedを使ったLLMの学習を実行するまで

7~8Bのフルパラメタチューニングは残念ながらA100 x 1枚(40GB VRAM)でも乗らない。 そこでDeepSpeedに頼ることに。 基本的にはこちらのnoteに従うと良い。 1. mpi4py…

となかい
9日前

Mixture of Agents(MoA) 実践!

何かと話題の「LLMをたくさん用意して組み合わせる系」の研究。 Mixture of Experts(MoE)に続き。 AlpacaEval2.0ベンチマークでGPT-4にオープンソースの組み合わせで勝利…

となかい
1か月前

lit-gptでLlama2を学習してみたい

注)結局学習が上手く行ったわけではないです。悪しからず。 (参考記事) https://zenn.dev/if001/articles/6c507e15cd958b https://zenn.dev/syoyo/articles/52f1d0d62fc

となかい
6か月前

arXivへの論文投稿!

手順arXivにログイン. Submission. Overleafの右上の「Submit」からarXivを選択し, 1. Download zipをクリック. zipファイルをarXivのページからアップロード いらない…

となかい
9か月前
1

RetNetを動かしてみる

まずはこちらのブログの再現を試みる. 環境はUbuntu, GPUは80GB VRAMのNVIDIA A100x4台(全ては使ってない) 学習(18時間程度)学習データはfairseqのwikiText-103. 2023…

となかい
9か月前

ChatGPTに聞いてみた!究極の質問

なんかグダグダ言ってますねーひとことで答えさせると…模範回答っぽいものが得られました。

となかい
9か月前
1

【寝落ち電話】iPhoneで通話を自動で切る裏技

寝る前のLINE通話….朝までつなぎっぱだと電池, 通信がもったいなかったり, 意図せぬいびきを恋人に聞かれたりします…そんな時の裏技。 1. 「ショートカット」アプリを開…

となかい
10か月前
7

自作モデル/データセットをHuggingFaceにアップロードする手順の例

このやり方は, huggingface-cliであらかじめloginしておいてからコード内でpush_to_hubを実行することでHugging Faceリポジトリにアップロードする方法(便利). 他にもブ…

となかい
10か月前
5

論文管理ツールZoteroのインストール

2023年時点, 論文管理ツールはZotero一択らしいので実際に使ってみる. 他のツールとの比較Zotero … ほぼ無料で使える. 事前設定がやや面倒. Mendeley … 2022.8に終了 Pa…

となかい
10か月前
3

ABCI上でDeepSpeedを使ったLLMの学習を実行するまで

7~8Bのフルパラメタチューニングは残念ながらA100 x 1枚(40GB VRAM)でも乗らない。
そこでDeepSpeedに頼ることに。

基本的にはこちらのnoteに従うと良い。

1. mpi4pyのinstallについて

pip でinstallしようとするとwheel関係のエラーが生じた。元記事ではcondaでinstallしているが、ABCI上ではそうも行かない。

module

もっとみる

Mixture of Agents(MoA) 実践!

何かと話題の「LLMをたくさん用意して組み合わせる系」の研究。
Mixture of Experts(MoE)に続き。
AlpacaEval2.0ベンチマークでGPT-4にオープンソースの組み合わせで勝利したとか何とか。https://github.com/togethercomputer/MoA

論文:https://arxiv.org/abs/2406.04692, Together AI

もっとみる

arXivへの論文投稿!

手順arXivにログイン. Submission.

Overleafの右上の「Submit」からarXivを選択し, 1. Download zipをクリック.

zipファイルをarXivのページからアップロード

いらないファイルはDeleteボタンで削除する. Macの場合, .DSStoreとかは児童削除される.

画像ファイル(PNGなど)がある場合は, 追加でアップロードする必要があ

もっとみる
RetNetを動かしてみる

RetNetを動かしてみる

まずはこちらのブログの再現を試みる.
環境はUbuntu, GPUは80GB VRAMのNVIDIA A100x4台(全ては使ってない)

学習(18時間程度)学習データはfairseqのwikiText-103.

2023-10-02 05:22:01 | INFO | fairseq_cli.train | done training in 65489.0 secondsEnd Time:

もっとみる

ChatGPTに聞いてみた!究極の質問

なんかグダグダ言ってますねーひとことで答えさせると…模範回答っぽいものが得られました。

【寝落ち電話】iPhoneで通話を自動で切る裏技

寝る前のLINE通話….朝までつなぎっぱだと電池, 通信がもったいなかったり, 意図せぬいびきを恋人に聞かれたりします…そんな時の裏技。

1. 「ショートカット」アプリを開く
iPhone(iOS13以上)に標準でインストールされているApp「ショートカット」を開きます。

下のタブの中央「オートメーション」をタップしてこのような画面を開きます。

「個人用オートメーションを作成」をタップ。

もっとみる
自作モデル/データセットをHuggingFaceにアップロードする手順の例

自作モデル/データセットをHuggingFaceにアップロードする手順の例

このやり方は, huggingface-cliであらかじめloginしておいてからコード内でpush_to_hubを実行することでHugging Faceリポジトリにアップロードする方法(便利). 他にもブラウザでアップロードする方法とかもあるにはありそう.

モデルのシェア手順

Huggingface上でリポジトリを作っておく.
自分のページ >「New +」 > Model > model_

もっとみる

論文管理ツールZoteroのインストール

2023年時点, 論文管理ツールはZotero一択らしいので実際に使ってみる.

他のツールとの比較Zotero … ほぼ無料で使える. 事前設定がやや面倒.
Mendeley … 2022.8に終了
Paperpile … 月額約3ドル
Notion … 論文管理に特化されていない. 無料.

想定・ブラウザはSafari, PCはMacbook.
・iPadでも見たり, Goodnotesで書

もっとみる