メタヒューリスティクスと深層強化学習の融合

メタヒューリスティクスの基本的な挙動は,近傍の中から確率的に1つの解を選択し,それに移行することを繰り返すだけだ.これを強化学習の方策最適化と考えると,メタヒューリスティクスの挙動を強化学習によって学習することが可能になる.

さらには,方策最適化の最近の進展である深層学習を入れることによって,メタヒューリスティクスの探索の自動学習ができるようになる.

この枠組みで,メタヒューリスティクスの学習を行うためには,入力であるインスタンスと,今までに求められた最良解(できれば最適解)が必要になる.多くの入力と出力の組を準備し,十分な時間を学習に費やしたメタヒューリスティクスは,人間が手作業でチューニングしたものより,良い結果を出すことが期待される.

この記事が気に入ったらサポートをしてみませんか?