報酬モデルの言語モデル?ほか全5本 機械学習デイリーダイジェスト(2023/05/31)

こんにちは!アイブン編集部です。
Arxiv新着論文のダイジェストをお届けいたします。
どうぞ楽しんでお読み下さい!

目次:

  1. RAPHAEL:大規模な拡散パスの混合を通じたテキストから画像生成

  2. Mix-of-Show:拡散モデルのマルチコンセプトカスタマイズのための分散型低ランク適応

  3. 逆共分散行列を通じた行列分解による大規模因果構造の学習

  4. 直接的な好み最適化:あなたの言語モデルは密かに報酬モデルである

  5. LaFTer:言語と未ラベル化画像コレクションを使用したラベルフリーチューニングによるゼロショットクラシファイアの調整


RAPHAEL:大規模な拡散パスの混合を通じたテキストから画像生成


論文タイトル:RAPHAEL: Text-to-Image Generation via Large Mixture of Diffusion Paths
URL:http://arxiv.org/abs/2305.18295v1

・RAPHAELは、テキストからリアルな画像を生成する新しい手法です。
・RAPHAELは、大規模な拡散パスの混合を使用し、テキストの表現を構築しています。
・RAPHAELは、多様な画像を生成するために、多様な拡散パスで学習することができます。
・RAPHAELは、既存の手法に比べて、より高品質で多様な画像を生成します。


Mix-of-Show:拡散モデルのマルチコンセプトカスタマイズのための分散型低ランク適応


論文タイトル:Mix-of-Show: Decentralized Low-Rank Adaptation for Multi-Concept Customization of Diffusion Models
URL:http://arxiv.org/abs/2305.18292v1

・拡散モデルは、ネットワークの動的な状態を表現するために使用されます
・この論文では、Mix-of-Showアルゴリズムを使用して、マルチコンセプトカスタマイズされた拡散モデルを開発しました
・Mix-of-Showは、複数の概念をモデル化し、分散化された低ランク適応を実行することにより、高い予測性能を提供します
・提案されたアルゴリズムは、実験において既存の手法よりも優れた精度を示しました。


逆共分散行列を通じた行列分解による大規模因果構造の学習


論文タイトル:Learning Large Causal Structures from Inverse Covariance Matrix via Matrix Decomposition
URL:http://arxiv.org/abs/2211.14221v2

・本論文は、逆共分散行列を通じた行列分解を使用して、大規模な因果構造を学習する方法を紹介する。
・逆共分散行列は、変数間の相関を測定するために使用され、因果構造を捉えるのに役立つ。
・行列分解の手法を使用することで、因果関係の方向性を推定することができる。
・提案された手法は、他の手法と比較して、より高精度な因果構造の学習が可能であることが示されている。


直接的な好み最適化:あなたの言語モデルは密かに報酬モデルである


論文タイトル:Direct Preference Optimization: Your Language Model is Secretly a Reward Model
URL:http://arxiv.org/abs/2305.18290v1

・ 通常の言語モデルは、文の単語確率を生成するだけで、直接的な報酬を示すことができません。
・ この論文では、言語モデルを報酬関数の近似器として使用することが提案されています。
・ この方法では、言語モデルのパラメータを最適化して、報酬モデルを最大化し、さまざまな分野のタスクを実行できます。
・ この手法は、機械翻訳、自然言語処理などのタスクに適用されることが示されています。


LaFTer:言語と未ラベル化画像コレクションを使用したラベルフリーチューニングによるゼロショットクラシファイアの調整


論文タイトル:LaFTer: Label-Free Tuning of Zero-shot Classifier using Language and Unlabeled Image Collections
URL:http://arxiv.org/abs/2305.18287v1

・従来のゼロショット学習は、未知のクラスを分類するために言語認識を使用する方法であるが、ラベルつきデータが必要であり汎用性に欠ける。
・提案手法LaFTerは、ラベルフリーの画像と言語コーパスから学習して、未知のクラスを認識するためのゼロショットクラシファイアを調整する。
・LaFTerは、ポジティブおよびネガティブサンプル集合から得られる応答スコアを用いることで、調整を実現する。
・LaFTerは、従来手法よりも高い分類性能を示し、ラベルつきデータ不足の状況でも有効であることが示された。



気になる論文があったら読んでみて下さいね!
それでは、また明日のデイリーダイジェストをお楽しみに!

アイブン編集部
https://aiboom.net/
ツイッター
https://twitter.com/AIBoom_net

ここから先は

0字

この記事は現在販売されていません

より良質な記事をお届けするための取材費に使います!