ログイン
会員登録
マルチモーダル理解
書いてみる
関連タグ
#3D表現学習 (1)
#CVPR (12)
#GUIエージェント (1)
#Github (1,829)
#NeurIPS (5)
#SMILEデータセット (1)
#VideoLaughReasoning (1)
人気
急上昇
新着
定番
有料のみ
2件
人気の記事一覧
Ferret-v2: An Improved Baseline for Referring and Grounding with Large Language Models
Ikemen Mas Kot
6か月前
2
SMILE: Multimodal Dataset for Understanding Laughter in Video with Language Models
Ikemen Mas Kot
9か月前