見出し画像

Day6_時系列予測と因果推論・問いの力と未来予測の技術【AI人材育成講座・備忘録】

質問から出てきたChatGPTの上手い利用方法

ナカマコ氏の指摘によれば、ChatGPTを上手く使えない原因の一つは、ユーザー自身が「何を聞きたいか」という具体的な問いを明確にできていないこと、つまり「決定木」がしっかり構築されていないことにあります。

この考えを踏まえ、AIとのインタラクションにおいて、どのようにして効果的な問いを形成し、求める情報を正確に引き出すかについて考察してみましょう。

※インタラクション(相互作用・ユーザーが何か操作をしたときにシステムや機器が応じて反応を返すを意味する)

AIを使いこなすための「問い」の構築

まず、AIとのコミュニケーションにおいて、ユーザーが明確な問いを持つことは極めて重要です。

これは、情報の正確さや関連性を保証するための「出発点」となります。

決定木という概念は、この過程を体系化し、明確にするための有力なツールです。決定木とは、選択肢を「枝分かれ」させ、最終的な目標に向かって導くための手順を可視化する手段です。
(以前の講座でも取り扱われました)

ユーザーがどのような情報を求めているのか、その過程でどのような選択肢が存在するのかを明確にすることで、AIに対してより具体的で有効な質問を投げかけることができます。

決定木を使った具体的な問いの精錬

異なる出力が得られた場合でも、それを出発点としてさらに細かい質問を形成していくことが必要です。

例えば、AIに質問を投げかけ、その答えが期待したものでなかった場合、その答えを分析し、何が不足しているのか、どのような情報が追加で必要なのかを判断します。
このプロセスを繰り返すことで、質問の焦点が徐々に絞られ、最終的に求める情報にたどり着くことが可能になります。

ここで重要なのは、「なぜこの質問をしているのか」という目的意識を持つことです。
単に情報を得るだけでなく、その情報が何に役立つのか、どのように使用するのかという目的を明確にすることが、AIの出力の有用性を高める鍵となります。

目的を持つことで、質問を「改善」し続けることが可能になり、最終的には非常に精度の高い情報に到達することができるようになります。

ユーザーの役割とAIの活用

結局のところ、AIの活用は、ユーザー自身の「問い」の質と直接的に関連しています。

AIは与えられた入力に基づいて出力を生成するツールであり、その出力の質は、入力される質問のクオリティによって決まります。したがって、ユーザーはまず自分が何を知りたいのか、どのような情報を得たいのかをはっきりと定義し、そのための決定木を頭の中で構築する必要があると言えるでしょう。

こうすることで、AIとのインタラクションが単なる情報のやり取りに留まらず、より効果的かつ実用的な情報収集の手段となります。

ナカマコ氏の示唆に従い、ユーザーがAIとの対話を通じて得られる情報の質を向上させるためには、自分自身の目的と問いを明確に定義し、その問いを進化させ続ける姿勢が不可欠です。
これにより、AIは単なる道具としてではなく、知識や洞察を深めるための強力なパートナーとなり得ます。

未来を予測するということ

未来を予測することは、まだ見ぬ世界への窓を開けるようなものです。

私たちは、見えない明日に対して何を感じ、何を知ることができるのでしょうか。
いずくね先生が好む「時系列予測」というテーマは、この未知の領域へのひとつの答えを導く道であると言えます。

たとえば、下記のような数字の並びがあります。

「1、2、3、1、2、3、1、2、3、1、?」

?に入る数字は何でしょうか。

答えは「2」です。
では、なぜ「2」なのかを考えてみましょう。

その数字の並びからパターンを見つけ出したと言えます。
それは毎年同じ時期に運動会が開かれ、そのたびに同じお弁当屋さんが屋台を出している事実を知っている状態に近いものです。誰もが無意識に「今年もお弁当屋さんが来るだろう」と期待するのは、過去の出来事が未来を示唆するというシンプルな論理が働いているからです。

時間とともに変化する風景

時系列予測とは、時間とともに変化するものの中から規則性やパターンを見つけ出し、次に何が起こるかを予測することです。

たとえば、気温の変化を考えてみましょう。
夏が来れば気温は上がり、冬になれば下がります。その変化は年々繰り返されます。よって10月くらいになると「もうすぐ寒くなるなぁ」と日本に住む誰もが予想できるのではないでしょうか。

このように、時間という縦糸にデータという横糸を織り込み、未来の姿を予見することが時系列予測の本質なのです。

誰だって真夏に突然雪が降ることはないと分かるでしょう。
なぜなら過去の膨大なデータから、夏は暑く冬は寒いというパターンがすでに確立されていることを知っているからです。
時系列データは、過去のデータの繰り返しや変化を通じて、未来を「予測する」手がかりを私たちに提供してくれます。

予測という名の旅

もう一度、数字の並びに戻りましょう。
「1、2、3、1、2、3、1、2、3、1、?」
この並びを見て、未来を予測するとはどういうことでしょうか。

答えが「2」である理由は、私たちが過去のパターンを見て、次に来るものを「感じる」からです。この予測は、単なる理論だけではなく、人間の経験と直感に基づいています。
時系列予測とは、まさにそのような「感じ取る力」を数字の並びの中に見い出す行為なのです。

お弁当屋さんの例で言えば、運動会が毎年開催され、そのたびに同じようにお弁当が売られるという過去のパターンがあれば、今年も同じことが起こると期待するのが自然です。
その期待の裏には、日常の規則的な出来事が繰り返されることへの安心感と、予測可能な未来に対する信頼があるのもまた事実です。

繰り返しの中に見る一瞬の変化

しかし、時系列予測は必ずしも単純な繰り返しだけを意味しません。

日々の気温は確かに季節ごとのパターンに従いますが、その中には例外や異常気象もあります。
突然の予測を裏切る出来事は私たちを驚かせます。未来を予測するということは、この変化をも含んだうえでの「全体像」を描く試みでもあるのです。

「1、2、3」と続く中で、次に「2」が来ると予想するのは、過去のデータに忠実だからです。
しかし、何かしらの変動要因が加われば、その次に来るのが「4」や「5」である可能性も否定できません。

時系列予測は、過去の規則性を理解するだけでなく、その規則性がどこで破られるのか、その「兆し」をも読み取ろうとする行為でもあると理解しておくと良いでしょう。

結論としての予測

時系列予測とは、過去の出来事の中に未来の影を見出す行為です。
いずくね先生の「1、2、3、1、2、3…」という問いも、私たちがどれだけ過去のデータに目を凝らし、未来を読み解く力を鍛えているかの証です。

「2」という答えは、ただの数字の並びではなく、私たちが日常の中に見る繰り返しのパターンと、その中に隠された真実を探し当てる旅の始まりとも取れるでしょう。
意識してみると「なぜその予想が出来たのか」「なぜ同じ周期がまた来ると思ったのか」を考えるきっかけになるのではないでしょうか。

未来を予測するという行為は、過去と現在を結びつけることで、まだ見ぬ未来への扉を開けるものだと言えるでしょう。

繰り返されるGoogleColaboとChatGPT利用の手作業

いずくね先生が提供してくれた小売店のデータを使って、私たちはGoogle Colabでの分析を始めました。

データの山に向き合い、コードを書き、実行して結果を確認する。
その一連の作業は何度も繰り返しています。
はじめは何か難しいように感じたものでも幾度となく手を動かしているうちに、徐々に親しみを感じ、躊躇なく実施できるようになります。

繰り返し同じような操作を続けることが、単なる作業ではなく、自分の力になっていくのが分かるのではないでしょうか。
学びは真似る、そしてその繰り返しの波に押し流されながらも、次第に水面に浮かび上がるように理解が深まっていきます。

ChatGPTにコードを作成してもらうことも、GoogleColaboにそれを貼り付けて、出たエラーを確認し、修正していくことも反復の一部です。
何度も質問を投げかけ、修正を加えながら、繰り返せば自然とコードの動きやその背後にあるロジックも見えてきます。

この反復こそが、私にとって効果的な訓練法と言えます。
手を動かし、何度も試すことで、単に操作に慣れるだけでなく、その先にある未知の領域にも少しずつアクセスできるようになっていきます。

日常的にGoogle ColabやChatGPTを使いこなしていくことで、より高度な分析や新しい挑戦にも対応できる力がついてくるのではないかと感じています。
だからこそ、繰り返しを恐れず、日々の作業を学びの機会に変えていくのです。

※実作業部分はアーカイブを参照の上で、各自GoogleColaboとChatGPTを利用してみて下さい。

覚えておきたい時系列予測の基本『ARモデル』とは

データ分析の世界には、未来を予測するためのさまざまな手法があります。

その中でも「ARモデル」という時系列予測の方法は、特に重要なものとして知られています。
未来の姿を知りたいと願う私たちにとって、ARモデルはその扉を開くための一つの道しるべと言えるでしょう。

ARモデルとは何か

ARモデル、正式には「自己回帰モデル(AutoRegressive Model)」と言います。これは過去のデータを基にして未来のデータを予測するための手法です。

例えば、気温の変動や株価の動きなど、時間の経過に沿って変化するデータに対して適用されます。ARモデルは、過去のデータを「自己回帰」させることによって、そのデータの「流れ」を予測しようとするものです。

ARモデルは、過去の売上データを基に、次に起こる可能性の高い結果を予測することで、仕入れや生産計画、広告戦略などの意思決定をサポートします。
つまり、ARモデルは経営者が過去の売上実績を見ながら、未来の経済活動を計画するための「羅針盤」のような役割を果たすのです。

ARモデルのプログラムで重要な部分

ARモデルを実際に使って予測を行うためには、プログラムを書く必要があります。

その中で重要になるのが、model = AutoReg(sales_data, lags=1)という部分です。このコードでは、sales_dataというデータを使って予測を行いますが、ポイントはlags=1の部分です。ここでは「ラグ(lags)」という設定が、予測の精度を大きく左右します。

lags=1というのは、直前のデータを基に次の予測を行うという意味です。
例えば、前月の売上データを使って翌月の売上を予測する場合、この設定が役立ちます。

lags=1の場合の予測

これをlags=12に変更すると、過去12ヶ月分のデータを使って予測を行うことになります。つまり、12ヶ月の季節変動を考慮した長期的な予測が可能になるのです。

lags=12の場合の予測

lagsの最適化に向けた研究

この「lags」の設定が適切であるかどうか、予測の精度に大きな影響を与えることが上記のグラフでよく分かったはずです。
そのため、どのlagsが最も予測に適しているかを見つけるのは非常に重要な要素となります。このための研究が日々行われているほどだと、いずくね先生は言っています。

最適なlagsを見つけることでデータ分析の精度を飛躍的に向上させることができるのです。

ARモデルのまとめ

ARモデルは、時系列予測の基礎を学ぶ上で欠かせない手法です。

ラグの設定一つで予測の方向性が変わるこの手法は、データの奥深さとその可能性を私たちに示してくれます。

ARモデルを使いこなすことは、未来を予測する力を手に入れることであり、そのためには何度も繰り返し使ってその感覚を掴むことが大切です。
データの流れを読み解き、未来の姿を鮮明に描くための一歩として、ARモデルを心に刻んでおきましょう。

予測の確かさを測るもの『信頼区間』とは

データ分析において、未来を予測することはとても魅力的なことです。

なぜ魅力的に感じるのか、それは「明日何をすればいいのか」が見えてくるからでしょう。
暗闇のトンネルに光が差すのと相違ない状況が予測によって生まれるというのは、この上ない喜びでもあります。
経営をやっていて「明日何をすればいいのかが明確」となるようなツールがあれば、誰もが欲するはずです。

しかし、その予測がどれほど正しいのかを判断するためには、何かしらの基準が必要となります。
ここで登場するのが「信頼区間」という概念です。

これは、予測がどれほど信頼できるものであるかを示す大切な指標となります。

信頼区間とは何か

以前の講座にも登場した「信頼区間」について、改めて説明しましょう。

信頼区間とは、予測された値が真の値を含む可能性が高い範囲を示すものです。

例えば、天気予報で「明日の気温は20度±2度」と聞くことがありますが、これは信頼区間の一例です。
この場合、気温が18度から22度の間に収まる可能性が高いという意味になります。使われる信頼区画は95%や99%が一般的です。つまり、信頼区間は、未来の出来事がどの程度の範囲内で起こるかを示す「安全地帯」のようなものなのです。

面積のように見える部分が信頼区間95%の部分

信頼区間が広いとき

では、信頼区間が広く出るとはどういうことでしょうか?

それはぼんやりとした遠景を見ているようなものと言えます。
例えば、霧のかかった山を見て「たぶんあの辺に頂上があるだろう」と予想するようなものです。
山の全体像が見えていないため、その位置は曖昧で不確実です。
同じように、信頼区間が広いと、その予測がどれだけ不確かであるかを意味します。

広い信頼区間は、データが少なかったり、データのばらつきが大きかったりするときに現れやすく、これは予測が信頼できるものではない可能性を示しています。

まるで霧の中で道を探すように、予測の精度が低く、それを信じて取り組む危険性を示唆しているとも言えるでしょう。

信頼区間を狭めるためには

では、信頼区間を狭め、予測をより正確にするためにはどうすればよいのでしょうか?

その答えはシンプルです。
「データ量を増やす」こと。

ここで注意すべき点は、これは単に過去の参照データ数(lags)を増やすことではありません。
例えば、予測モデルでlagsを増やしても、データそのものの信頼性が低ければ、信頼区間が狭くなることはありません。
必要なのは予測を促すための正確なデータです。新たなデータを取り入れ、量と質の両面からデータを豊富にすることが求められます。

データを増やすとは、新たな視点を加えることでもあります。
たとえば、売上予測をする場合、単に過去の売上データだけでなく、その期間の天候や経済状況、さらには季節的な要因なども考慮することで、予測の精度を高めることができます。
山頂の霧はそのままでも、向かうべき方向を示す標識があったり、先に行くガイドの背中が見えたり、山道を示す鎖などがあったりすれば、「この先に頂上がある」ことが分かるのと同じです。
データが増えれば増えるほど、信頼区間は狭まり、予測は確かなものとなります。

信頼区間まとめ

信頼区間は、私たちが行った予測の確かさを測るための重要な指標です。

予測の精度を高めるためには、データの量と質を豊かにすることが必要となります。そして、そのための努力は、未来をより鮮明に見るための一歩となるでしょう。

データの持つ可能性を信じ、信頼区間を狭めるために、私たちはより多くの正確なデータを集め、分析し続ける必要があります。
未来を描く絵の輪郭を、よりはっきりと浮かび上がらせるために常に予測するために必要なデータに目を配りましょう。

因果推論を実践するための旅

データ分析の世界では、未来を予測することだけが目的ではありません。
その未来がなぜ訪れるのか、その「原因と結果」を探ることもまた重要です。

この探求の過程を「因果推論」と呼びます。

因果推論は、まるで未知の土地を旅するようなものです。
地図を片手に、その土地に隠された真実を見つけ出すために、私たちは道を進んでいきます。
途中で新しい発見があり、予期せぬ障害に出くわすこともあるでしょう。
時に、その障害こそが新たな知見を得るための手がかりとなることもあります。この旅路において、私たちはデータという地図を頼りに、目に見えない因果関係を探し求めます。

販売数の変動という大きな川の流れを観察し、その流れに影響を与える小さな支流を見つけ出すのです。
どの道を選ぶべきか、どの曲がり角で何を探すべきか、それを見定めるのが因果推論の醍醐味です。

旅の途中、私たちは地図にない道を見つけることもあるでしょう。

その道こそが新たな因果関係を示す可能性のあるものかもしれません。未知の道を進む勇気を持ち、データという旅の道連れとともに、その先にある真実を探し求めることが因果推論の旅なのです。

データの中から因子を探す

販売数に影響を与える要因が何であるかを考えるとき、私たちはまず「どのデータが販売数に影響しているのか?」という問いを立てます。

この問いは森の中で果実の生る理由を探し出すようなものです。
木々の中には、高い木や低い木、太い木や細い木などさまざまな種類が存在しますが、その中で「販売数」という果実を実らせるために、「どの木」「どの環境」「どの土壌」が重要なのかを見極める必要があるのです。

この時に有効な手段として、ChatGPTに相談してみることも一つの方法でしょう。
生成AIを利用して、どのデータが重要な因子となり得るのかのヒントを得ることができます。生成AIは多くのデータを学習しているため、人間では気付かないような関連性やパターンを見つけ出してくれるかもしれません。

グレンジャー因果検定の活用

販売数に影響を与える因子を特定するためには、「グレンジャー因果検定(Granger Causality Test)」という手法を使うことが有効です。

グレンジャー因果検定とは、一つの時系列データが他の時系列データをどの程度予測できるかを検証するための方法です。
簡単に言えば、「ある出来事が別の出来事の原因であるかどうか」を判断するための仮説検定です。

グレンジャー因果検定の基本的な手順
1.データの準備:
検定を行うためには、まず2つの時系列データ(例えば「販売数」と「広告費」)を用意します。これらのデータは、一定の時間間隔で記録されたものが必要です(例えば、日次、週次、月次など)。
2.データの前処理
時系列データの単位根(非定常性)を確認します。もしデータが非定常であれば、差分を取るなどして定常データに変換する必要があります。
定常性とはデータのパターンが時間の経過にかかわらず変わらないことです。例えば機械の稼働音のデシベルを1時間ごとに記録したデータ。通常、機械が正常に動作している限り、その音量の平均と変動は時間に関係なく一定であるため、データは定常的です。
非定常性とはデータのパターンが時間の経過に応じて変動することです。例えば国のインフレ率は、経済政策、世界的な出来事、マネーサプライの変化などの影響を受けて時間とともに増減します。これにより平均や分散が時間によって変化するため、非定常的です。
3.ラグの設定
検定に使用するラグ(遅れ)の数を決定します。ラグの数とは、何期間分の過去のデータを使用して因果関係を検定するかを意味します。この設定は、データの特性やモデルの目的に応じて選択します。(先のlagsと同じ)
4.グレンジャー因果検定の実行
選定したラグの数に基づいて、検定を実行します。この検定では、仮説として「一方の変数がもう一方の変数の予測に役立たない(無因果性)」を設定し、それが否定されるかどうかを判断します。
5.結果の解釈
検定の結果として得られるp値を確認します。p値が小さい(一般的には0.05未満)場合、仮説が棄却され、「一方の変数がもう一方の変数の予測に役立つ」と判断されます。

グレンジャー因果検定の基礎概要はWikipediaにて理解を深められます

例えば、雨の日には傘の売り上げが増えるかもしれません。
このとき、「雨の日のデータ」が「傘の売り上げデータ」に対してグレンジャー因果を持つかどうかを検証することができます。
もし、雨の日のデータが傘の売り上げを高い確率で予測できるのであれば、これらの間に因果関係があると判断されるのです。

では、講座内で出されたデータを元にグレンジャー因果検定を行うとどうなるでしょうか。下記がそのデータとなります。

### グレンジャー因果検定の結果(p値の小さい順にランキング)###
1. 来店数: p値 = 8.23567653600948e-05(e-05が0.1×5を意味する)
2. webアクセス数: p値 = 0.0006041377736078682
3. 気温: p値 = 0.0026120801707171025
4. 湿度: p値 = 0.0076752168388599575
5. 通行人: p値 = 0.03146643145144101

今回のデータでGoogleColaboで出したグレンジャー因果検定の結果

p値の小ささが示すもの

グレンジャー因果検定では、仮説検定の結果として「p値」が算出されます。
p値が小さいほど、その因果関係が存在する確率が高いと言えます。

たとえば、もし「広告費」と「販売数」の間にグレンジャー因果関係を検定した場合、p値が非常に小さければ、それは広告費が販売数に強い影響を与えている可能性が高いと考えられます。
一方で、p値が大きければ、その影響は少ないか、全くないと言えるでしょう。

因果推論の先に見えるもの

因果推論を実践することで、私たちは単なるデータの羅列ではなく、そのデータの背後にある真実を見つけ出すことができます。

どのデータがどのようにして販売数に影響を与えているのか、その「因子」を見極めることができれば、あなたはより効果的な戦略を立てることができるでしょう。
まるでパズルのピースが一つ一つはまっていくように、全体像が徐々に明らかになっていく感覚を得るはずです。

グレンジャー因果検定というツールを使いこなすことで、データに隠された因果関係を解き明かし、未来をより正確に描き出すことができるでしょう。

因果推論の旅は、データという地図を手に、新たな真実の扉を開ける挑戦なのです。

もう一つの予測手法『VARモデル』とは

データの未来を予測するためにはさまざまな手法があります。
その中でも、ぜひ覚えておきたいものの一つが「VARモデル」だと、いずくね先生は言います。

VARモデルは、複数の変数が互いにどのように影響し合っているのかを見つけ出し、それらの未来を同時に予測するための手法となります。

VARモデルとは何か

VARモデルとは、「ベクトル自己回帰モデル(Vector Autoregressive Model)」の略で、複数の時系列データが相互に関連し合う関係を考慮して予測を行う手法です。

従来のARモデルが一つの時系列データを用いて予測するのに対し、VARモデルは複数のデータを同時に扱います。
例えば、「販売数」と「来店数」という二つの変数があるとき、これらがどのように影響し合いながら変動するのかを解析し、それぞれの未来の姿を予測するのです。

サッカーで言えば、VARモデルは「チーム全体の戦術を決める監督」のようなものです。
監督は、各選手の動きがチーム全体にどう影響するかを見極めながら、フォーメーションを決めたり、選手を配置します。例えば、フォワードの動きが変われば、ミッドフィルダーやディフェンダーの動きもそれに応じて調整されるでしょう。
一つのポジションの変化が全体のプレイに影響を与えるように、VARモデルも複数のデータの関係性を把握し、どう影響し合いながら変動するのかを解析して、チーム全体の動き(未来のデータ)を予測します。

つまり、VARモデルは、サッカーの監督が全体のパフォーマンスを高めるために各選手の役割を調整するように、複数の時系列データの相互作用を理解し、未来の動きを予測していきます。

販売数と来店数を同時に予測する

VARモデルの大きな強みは、「販売数」と「来店数」のように、複数の要素を同時に予測できることです。

たとえば、ある店舗での販売数を予測する際に、その店舗への来店数が影響することがグレンジャー因果検定で判明していたとします。
よってこのデータから来店者が多ければ販売数も増える可能性が高く、逆に少なければ販売も減少するということが分かります。

VARモデルを使うことで、これら二つのデータがどのように連動して動くのかを解析し、未来の傾向をより正確に予測することが可能になります。

先のようにサッカーで言えば、VARモデルは「チーム全体のパスワークを予測する戦術コーチ」のようなものです。
例えば、攻撃の際に、フォワード(販売数)が多くのゴールチャンスを作るためには、ミッドフィールダー(来店数)からの正確なパス供給が必要です。
ミッドフィールダーが相手のディフェンスを突破し、多くのパスを出せば、フォワードが得点するチャンス(販売数)が増えます。逆に、ミッドフィールダーのパスが少なければ、フォワードが得点するチャンスも減少すると予測できるでしょう。

VARモデルを使うことで、ミッドフィールダーとフォワードの動きがどのように連動しているのかを解析し、ゴール数をより正確に予測することが可能になります。

言い換えれば、VARモデルを使うことは、同時に複数の選手の動きを見ながら、その連携の変化を予測し、試合の展開をコントロールするようなものです。
VARモデルは、複雑なチーム内の関係性を整理し、次のプレイを描き出すための戦術ツールとして活用されるのです。

VARモデルでの予想(信頼区画95%アリ)

VARモデルを使いこなすために

VARモデルを使いこなすためには、データ同士の相互関係をしっかりと理解することが重要です。

販売数が来店数に依存するように、他の変数もまた、さまざまな要因に影響を受けています。
そのため、VARモデルを使う際には、それぞれのデータがどのように関連し合っているのか、データの背後にあるメカニズムを理解することが求められます。

VARモデルは、複数の要因が絡み合う複雑なシナリオを解析し、予測するための強力な手法であるというのが分かったでしょうか。
このモデルを覚えておけば、販売数と来店数の両方を同時に予測し、ビジネスの未来をより具体的に描き出すことができるでしょう。

データの背後に隠された関係性を探る旅において、VARモデルは頼りになるコンパスとなるはずです。

Day6の総括

AIを効果的に活用するためには、まず「何を知りたいのか」をはっきりと定める必要があります。
ナカマコ氏は、ChatGPTのようなAIを上手く使いこなせない理由の一つに、ユーザー自身が具体的な問いを明確にできていないことにあると言います。
「問いの決定木」を構築しない限り、求める情報を正確に引き出すことは難しいのです。

AIとのインタラクションにおいて、まず大切なのは「何を知りたいのか」を明確にし、目的意識を持つことです。
決定木を用いることで、情報を引き出すための道筋を具体的に描くことができます。仮にAIから得られた回答が期待通りでなかったとしても、その結果を分析し、どこに情報の不足があるのかを見極め、さらに具体的な質問を形成することが重要です。
このプロセスを繰り返すことで、質問の焦点を絞り、目的にかなった回答にたどり着くことが可能になります。問いの質を高めることで、AIは私たちの「知のパートナー」として、その可能性を最大限に引き出すことができるのです。

未来を予測することは、まだ見ぬ世界への窓を開ける行為に似ています。
時系列予測や因果推論、そしてVARモデルのような手法を活用することで、データから見えない未来を見つけ出すことができます。
例えば、「1、2、3、1、2、3…」という数字のパターンを見て未来を予測する時、私たちはその繰り返しの中に潜む規則性を見つけ出し、次に来る数字を推測できるでしょう。
これは、毎年同じ時期に訪れる運動会で同じお弁当屋が出店することを予期するようなものです。
しかし、未来予測は単純な繰り返しの先にあるものだけを意味しません。
気候変動のように、日常のパターンに異常が現れることもあります。AIやデータ分析の技術を駆使することで、その変化の兆しをも捉え、予測の精度をさらに高めることが可能です。

時系列予測にとどまらず、因果推論やVARモデルの手法を学ぶことも、AIの利用において重要です。
例えば、販売数と来店数のように複数の要素がどのように相互に影響し合うかを理解するためには、グレンジャー因果検定を用いることが有効となります。この検定により、どのデータがどのように関係し合っているかを明らかにし、次に起こる出来事をより正確に予測することができるからです。

VARモデルの活用によって、複数の変数が連動して変動する様子を解析し、同時にそれらの未来を予測することが可能です。
サッカーで例えるなら、VARモデルは試合中のチーム全体の動きを把握し、最適な戦術を決定する監督のようなものでしょう。一人のプレイヤーの動きが全体に影響を与えるように、各データの相互関係を理解することが、より高度なゴール予測を実現することも出来ます。

AIやデータ分析のスキルを磨くためには、反復的な作業も重要です。
Google ColabやChatGPTを使ってデータを分析し、得られた結果をもとにコードを改善するプロセスを繰り返すことで、自然とその手法の裏にあるロジックが見えてきます。
この反復の中で得られる気づきが、新たな課題に挑むための基礎となり、より高度な問題にも対応できる力を養うのです。

AIを効果的に利用するためには、ユーザー自身が目的意識を持ち、具体的な問いを洗練させることが不可欠です。
問いの質を高めることで、AIは単なる情報の提供者から、より深い知識と洞察を引き出すためのパートナーへと変わっていきます。

また、データ分析の手法やモデルを駆使して未来を予測する力を磨くことで、私たちはより正確で信頼性の高い情報を手に入れることができるでしょう。
これは単なる技術の向上だけでなく、未知の世界を探るための新たな扉を開くことにもつながります。

<AI講座の受講期間で行っている予習はこちらです>
「他人の学びを覗き見してみる?」


この記事が気に入ったらサポートをしてみませんか?