記事一覧

生成AIカレンダーの振り返りと来年の展望

今年もあとわずかになりました。 いかがお過ごしでしょうか。 本記事では今年の生成AIアドベントカレンダーを振り返り、来年の展望を想像していきます。 本記事は生成AIア…

あるふ
6か月前
15

未来を発明するための壁

こんばんは、あるふです。 もともとはロボットビジョンを用いたインタラクションの研究者でした。ただ、現状を見ると、画像生成AIエンジニアが正しいのではないかと思い、…

あるふ
6か月前
7

DALL-E 3もどきの作り方

みなさんはChatGPTを使いますか? ChatGPT、特にChatGPT 4は主に返答する文章を生成してくれる機能がありますが、最近では場合に応じて画像を生成してくれるようになりまし…

あるふ
7か月前
32

今年の生成AIの振り返り

みなさんは今年の流行語大賞を知っていますか? 実はそのトップテンに生成AIが含まれています。 いまや時代を象徴する言葉になった生成AI。 今年はどんな活躍をしてきたの…

あるふ
7か月前
33

画像生成にまつわるTips

こんばんは、あるふです。 今回は【第2回】生成AIなんでもLT会に参加してきたので、その内容と感想をつらつら書こうと思います。 発表内容まずは自己紹介です。 お題目は…

あるふ
7か月前
9

CALM2で長い文章をまるごと取り扱う

こんばんは、あるふです。 GPTQ版CALM2が長い文章に思ったよりか強かったので、これは宣伝と忘備録がてら、使い方を整理していきます。 まず動かしてみるCALM2とはサイバ…

あるふ
8か月前
45
生成AIカレンダーの振り返りと来年の展望

生成AIカレンダーの振り返りと来年の展望

今年もあとわずかになりました。
いかがお過ごしでしょうか。
本記事では今年の生成AIアドベントカレンダーを振り返り、来年の展望を想像していきます。
本記事は生成AIアドベントカレンダー最終日にあたります。

生成AIアドベントカレンダーの振り返り今年のカレンダーを振り返ると、アメリカや中国が主軸となって、画像、言語、音楽などの多くの範囲で技術発展したことがわかります。また、その技術発展とともに、芸

もっとみる
未来を発明するための壁

未来を発明するための壁

こんばんは、あるふです。
もともとはロボットビジョンを用いたインタラクションの研究者でした。ただ、現状を見ると、画像生成AIエンジニアが正しいのではないかと思い、そのように自称しています。
このように、最近、画像生成AIをはじめとした生成AIに手をつけているのですが、あまりに発展のスピードが速すぎて不安になってきます。生成AIという技術は無くなることはないでしょうから、どうにかして共存をはかったほ

もっとみる
DALL-E 3もどきの作り方

DALL-E 3もどきの作り方

みなさんはChatGPTを使いますか?
ChatGPT、特にChatGPT 4は主に返答する文章を生成してくれる機能がありますが、最近では場合に応じて画像を生成してくれるようになりました。その画像を生成してくれる機能はDALL-E 3と呼ばれる画像生成AIによって実現されています。ChatGPTのDALL-E 3は入力した文章を具体化してくれて、画像を生成してくれる機能があるため、非常に便利です。

もっとみる
今年の生成AIの振り返り

今年の生成AIの振り返り

みなさんは今年の流行語大賞を知っていますか?
実はそのトップテンに生成AIが含まれています。
いまや時代を象徴する言葉になった生成AI。
今年はどんな活躍をしてきたのでしょうか。
また、せっかくなので、昨年のアドベントカレンダーを振り返りながら、今年のアドベントカレンダーを始めていきましょう
本記事は生成AIアドベントカレンダー2023の初日になります。

今年の生成AI振り返り今年は昨年よりも激

もっとみる
画像生成にまつわるTips

画像生成にまつわるTips

こんばんは、あるふです。
今回は【第2回】生成AIなんでもLT会に参加してきたので、その内容と感想をつらつら書こうと思います。

発表内容まずは自己紹介です。

お題目は次のとおりです。

AIいらすとや

早速AIいらすとやについて説明します。

AIいらすとやとは、いらすとや風の画像をAIが生成してくれるサービスです。ちなみに他の人が生成したものも利用できます。

赤松Diffusion

もっとみる
CALM2で長い文章をまるごと取り扱う

CALM2で長い文章をまるごと取り扱う

こんばんは、あるふです。
GPTQ版CALM2が長い文章に思ったよりか強かったので、これは宣伝と忘備録がてら、使い方を整理していきます。

まず動かしてみるCALM2とはサイバーエージェントが作った大規模言語モデルのことです。
GPTQとは大規模言語モデルを4bit量子化する技術です。
transformersのload_in_4bitと違うところは、モデルだけではなく、読み込む文章も*1、VRA

もっとみる