JSAI2023 4日目メモ
拡散モデルによる画像生成の基礎と最新研究動向
拡散モデルの進展 (DALLE-2 Imagen)
[1] 拡散モデルの基礎
生成モデル -> データ分布からサンプリングしたい
簡単なデータ分布からサンプルし、変換することで複雑なデータにする
Diffusion Model長所: 定式化が単純、多様なデータが出せる、理論的背景が明確、制御しやすい
短所:生成が遅い(順番にノイズを除くので)
DDPM が基本モデル
(1)拡散過程: 標準正規分布をベータを係数にして徐々に足していく
-> 1時刻ごとにサンプリングする。これを繰り返す
ベータは付加するノイズの強度。アルファは「残っている強度」
(2) 逆拡散過程
-> ノイズを1個減らすと、ベータが小さければ逆側もガウス分布推定
-> KLD で減らす。上界を押さえていく
[2] 拡散モデルの応用
Classifier-free Guidance 多様性と忠実性のトレードオフ
グループインタラクション
いけずでイケてる京歩き
京子さんという肩載せ案内ロボットで観光案内を支援
詳しい人の情報
対話的
スマホに頼らない街歩き
ふれあい
を目標とする
共有ホワイトボードにおける協調を円滑にするインタフェースの提案
ビデオ対話システム + 共有ホワイトボード
遠隔インターフェースの課題:アウェアネス(他者の様子が認識しづらい)
共有ホワイトボード with 排他制御にするとよいのでは?
画面上の顔の位置にカメラを置くと、その方向を見ているようにみえる
-> 画面上で視線を共有する
オフィススペースのレイアウトを決めるタスクで評価
-> ペンのやり取りや、書記がでてきた。
グループ・ディスカッションの熟達による目標設定の視点の変化
グループディスカッションの知見の蓄積が困難
参加者の主観的効果の認識
相互理解指向
拡散指思考指向
合意形成指向
個人・知識・集団に分けた視点
対立構造を作ると、視点が変化した
ディスカッション初学者のスキル学習を支援するシステムの提案
グループディスカッションの支援に関するこれまでの活動と、
アバターを使ったトレーニングシステムの紹介
この記事が気に入ったらサポートをしてみませんか?