マガジン

  • 技術畑でつかまえて

    徒然なるままに技術関連の投稿をします

最近の記事

自作キーボード沼に片足が沈み始めたログ

(キャプション画像、キーボード教の踏み絵みたいになっている) 誰に言われたわけでもなく突然自作のキーボードを作りたいという思いが湧き上がったので、秋葉原の遊舎工房に行き、corone cherry v3のキットを手に入れました。 キットは自分で1から組み立てる方式のため、はんだ付け作業に挑戦することになりました。中学校や高校での授業で学んだ程度の知識しか持ち合わせていなかったのでどうしようかと思いましたが、巷でおすすめされているはんだ付けセットを購入し、早速組み立て作業に

    • 【論文メモ】LLMへの"モノの尋ね方"はLLMにきこう

      Large Language Models Are Human-Level Prompt Engineers論文リンク: https://arxiv.org/abs/2211.01910 公開日時: Submitted on 3 Nov 2022 prompt engineeringの自動化やOpenAIなどの提供するLLMを用いた場合のtuningのコスパについて調べていたら発見 概要大規模言語モデル(LLM)におけるタスク性能はモデルの制御に用いるpromptに大きく

      • それなりにいい感じの画像がでるtxt2imgのpipelineを整えたのでまとめておく

        お気持ち最近、個人的に画像生成AI(diffusionベース)を用いて画像生成をしている。 はじめの頃はwebuiを用いて一つ一つimg2imgなり、inpaintingなりを繰り返して頑張っていたのだが、画像生成技術の優位性はなんと言ってもその試行回数であると思っている。 故に、なるべくautoで好みの画像が生成されてくれれば好ましい。しかしながら闇雲に生成しつづけるだけでは大量に生成された画像に良質な画像が埋もれ、結局好みの画像に出会えない、という悲しい現象に遭遇してし

        • 【論文メモ】Transformerを用いた高速なtxt2img

          Muse: Text-To-Image Generation via Masked Generative Transformers論文リンク: https://arxiv.org/abs/2301.00704 公開日時: Submitted on 2 Jan 2023 概要離散トークンを使用し、サンプリングの反復回数が少ないため拡散モデルより効率的。 並列デコードを使用するため自己回帰モデルより効率的。 900MパラメータモデルにおいてCC3MでFID score: 6

        自作キーボード沼に片足が沈み始めたログ

        • 【論文メモ】LLMへの"モノの尋ね方"はLLMにきこう

        • それなりにいい感じの画像がでるtxt2imgのpipelineを整えたのでまとめておく

        • 【論文メモ】Transformerを用いた高速なtxt2img

        マガジン

        • 技術畑でつかまえて
          5本

        記事

          インスタントにGCPでStableDiffusionWebUIを動かす

          きっかけ最近画像生成AIをいじることが多くなってきた。 モデルを動かすにあたって簡易にパラメータをいじりながら画像生成できることから、webuiを重宝している。 ローカル環境で環境構築をしていたが、gpuのスペックがもう少し欲しいだとか、環境をリモートからも動かしたいだとか様々な理由からwebuiをgcp上で実行できるようにすることにした。 手順まずはGCP上にGCEのVMを作成する。GPUなどの設定に関してはおまかせするが、今回のケースでは以下の環境で実行することができた

          インスタントにGCPでStableDiffusionWebUIを動かす