GPT-4Vを使って図から技術を推論してみる
はじめに
ネット情報で、GPT-4VはVisual Promptingするとめちゃ賢くなるという情報を目にしました。
https://x.com/k3ntar0/status/1722619223896367150?s=20
Visual Promptingとは、画像の要素に符号を振ってあげることのようです。これにより、GPT-4Vの推論能力が飛躍的に向上するようです。
符号を振った図面といえば、特許図面ですので、早速試してみました。
作業
ここから先は
2,993字
/
1画像
¥ 300
この記事が気に入ったらサポートをしてみませんか?