見出し画像

ランダムフォレストでTwitter分析!? O先輩インタビューの感想(代表ver)

こんにちは。経済学AI研究会 マシンエコノミクスの代表のSです。

三月の某日、立命館大学院MOT研究科に進学予定のO先輩にお話を聞かせてもらうという企画が行われました。

O先輩

 その先輩は機会学習を用いた研究で卒業論文を書いたそうで、プログラミングや機会学習の研究への活用についてのお話を聞かせてもらいました。

 O先輩は大学院では売上予測やレコメンドエンジン等AIのビジネスへの活用やオンライン通話を活用いた会話型マーケティング、動画コンテンツによる営業の代替等についての研究を行う予定だそうです。

画像1

 その先輩は経済学部の出身者にも関わらずプログラミングも身に着けており、プログラミングを始めたきっかけはゲームを作りたかったからとのことです。
 swiftを使いゲームを制作していたそうですがそれでは物足りず、unityでより質の高いゲームを作るためC言語も学び始めたそうです。
さらに競技プログラミングを通じてプログラミング能力を向上させたそうです。
 競技プログラミングは楽しく、それを用いてプログラミングの学習をすることがおすすめとのことです。

 O先輩はプログラミングが出来るということもあり、その優位性を存分に活かして機会学習を用いた研究を卒業論文のテーマに選びました。

 研究のテーマは「SNSでのアクションと売上との因果関係についての分析」だそうです。

 近年は情報収集の手段としてSNSがTVよりもメジャーになってきていることに着目しこのテーマに決めたそうです。

 TwintというTwitterのデータを抜き出すライブラリを使用しTwitter上のデータを収集し、Pythonを用いてランダムフォレストという機械学習の手法を使って因果分析を行ったそうです。またGoogle Colaboratoryを利用すれば手持ちのパソコンのスペックが低くても処理の重い学習モデルを使えるという有用な情報も教えてもらえました。

 O先輩は需要があるのならば将来的にAIを用いたSNSデータの分析・活用事業を立ち上げるかもしれないと将来の構想を教えてくれました。

ランダムフォレストとは

 複数の機械学習のモデルを組み合わせて、個々のモデルでは到達できない性能を実現することをアンサンブル学習と呼びます。
 その一種にバギングという手法があります。学習を行いたいデータからランダムにデータを復元抽出し、いくつかの新しい学習データを作成します。そして各々のデータに対して一つずつモデル(弱学習器)を作成し、それを集約して最終的なモデルを作ります。
 これがバギングなのですがランダムフォレストはこのバギングの一種で決定木という手法を弱学習器とする方法です。
 決定「木」を沢山集めるからランダム「フォレスト」というのはなかなか洒落た名前ですね。


この記事が気に入ったらサポートをしてみませんか?