錯視とアルゴリズム

2021年11月6日 10:21

０）進化のために刻むということ

　・遺伝子として刻むということ
　・文化として刻むということ
　・知識として刻むということ
　　良い説明ができる汎化された知識ほどリーチが広い

　適用範囲が広い汎用的なプログラムにできないものは
　原理原則レベルで理解できていない。

１）人の知覚は大きな制約を受けている

　・システム構成
　　ａ）センサー　　：目
　　ｂ）コンピュータ：脳神経細胞ネットワーク
　　ｃ）ソフトウェア：解釈のアルゴリズム

・人の視覚は以下のように構成されている
　１：視覚情報を元にした認識対象の解釈をする（既知な記憶による予測）
　２：未知な認識対象があれば、外部情報を高解像度に取り入れて解釈をする

・脳の消費エネルギーは大きいため、人の知覚における脳内アルゴリズムを汎用的なソフトウェアであるアルゴリズム、できる限り高速・大容量処理であり省エネなコンピュータである脳神経細胞ネットワークを確立することは人類進化に於いて重要である。

２）錯視メカニズム（参考文献[１]の抜粋）とアルゴリズムの解明

　＜画像の曖昧さによる影響＞
　２ー１）
　・脳は立体に関する情報があいまいなとき
　　『現実世界で起こりうる可能性が高い』解釈をする。
　・脳は立体に対してあり得ない矛盾した画像を目にすると
　　物体が動いたという解釈をする。

　　アルゴリズム
　　→ 立体に特化した処理機能が用意されている。
　　→ 見えている対象の特徴（影がついているか等）に応じて、
　　　立体であるかどうかを識別する機能が用意されている。
　　→ 既知であると認識されてしまうと、
　　　物理的に矛盾しない立体であることを前提として解釈の処理が動作する。
　　→ 認識対象の情報が曖昧である場合には、既知なものに置き換えて解釈される。
　　　認識対象である立体が物理的にあり得ない矛盾したものである場合には、
　　　そのようなケースのために用意された解釈処理が動作する。

　＜センサーの限界＞
　２ー２）
　・人間の目を動かす筋肉は常にぴくぴく震えていて、
　　たとえ目を動かさなくともたえず眼球を揺らしています。
　　その揺れを脳が画面の動きとして認識してしまう。
　　脳の中には手振れ補正機能のようなものがあって、
　　いつもは目の揺れを勝手に補正してくれるんです。
　　しかしオオウチ錯視のような無機質なパターンでは
　　目の揺れを補正してくれる機能がうまく働かないということですね。

　　アルゴリズム
　　→見えている対象の特徴に応じて、
　　　目の揺れの補正機能はON/OFFが切り替えられる。
　　→ [見えている対象の分類機能]の後に[補正機能]が作動している。

　＜コンピュータとソフトウェアの限界＞
　２ー３）
　・ピンナ錯視
　　この画像を顔から遠ざけたり近づけたりするとサークルが回転して見える。
物体の動きを捉える神経細胞それぞれが見ている光景は実はとても狭いため、
　　全体の動きは捉えきれず回転して見えてしまうというもの。

　　アルゴリズム
　　→視神経信号の脳内処理は並列分散処理になっている。
　　→各領域ごとに、見えている対象の特徴に応じて、
　　　高解像度で局所的に凝視するのか、
　　　低解像度で対極的に俯瞰するのかが切り替えられる。
　　→各領域ごとの処理結果の統合機能において、
　　　ピンナ錯視が生じるような画像に対しては、全体を捉えることが難しい。
　　　そして何らかの理由により動いているものであると解釈される。

　２ー４）
　・中心へと伸びる線がグニャグニャ歪んでいるように見えますが、実はすべて直線。
　　これはカフェウォール錯視というもので、傾きを判断する脳のメカニズムが、
　　明るい色と暗い色によってかく乱されているためこのように見えます。

　　アルゴリズム
　　→ 人は色の色相や濃淡の勾配を元にして対象物を認識している。
　　→ 各領域ごとに決まった範囲（面積）の画像を処理しているため、
　　　細い線以外の明るい色や暗い色の画素も含めて解釈の処理が作動するため、
　　　細い線の解釈に影響を与えてしまう。

３）参考文献
　　[１] https://www.e-aidem.com/ch/jimocoro/entry/kouda002

この記事が気に入ったらサポートをしてみませんか？