強化学習

 人工知能の1つの手法として強化学習というものがある。ある目的のために行動するとき、選択肢の中で最も良さそうな行動を基本的には繰り返すが、確率的に、例えば5%の割合で他の行動も試して、より良さそうな選択肢を探索していくアルゴリズムが基本的な強化学習のε‐greedy法と呼ばれている。(かなり説明を端折っているが)
例えば100%の割合で前回とは異なる行動を選択したら、より良い選択肢を見つけられる可能性は減るだろうし、1%の割合でもより良い選択肢を見つけられる可能性は減るであろうから、どのくらいの割合で探索したら良いのかは試行錯誤である。
 強化学習について考えているのは、私の会社をどうやって成長させようかと頭の中でいろいろとシミュレーションしているのだが、どの選択肢がいいのか行動してみないことには分からないわけで、この強化学習の手法を参考にしようとしているからである。
 人のスキルに依存したサービスを提供するか、ソフトウェアを使ったサービスを提供するか方向性は定まっていないのだけれど。
 人を増やさずに一人親方でやって行っても飯は食えるんですがね。せっかく法人というバーチャルキャラクターがいるわけで育成したいなと思っているわけです。
 

この記事が気に入ったらサポートをしてみませんか?