SQL分析データ準備と基礎統計#09:相対日付時刻
例えば顧客におけるなにがしかの行動ログを分析するとして、利用開始タイミングは顧客によって異なります。分析によってはこの利用開始タイミングからn期間における行動を分析したいという場合があり、この場合にログの一番最初のタイムスタンプを1900年1月1日0時0分0秒にして、以降のログも同様にずらしてあげるということを行います。もちろん他の方法もあるかもしれませんが、これにより、最初の一カ月、最初の10ログ、半年後の行動といった分析が容易になります。計算としては該当の日付時刻から最小の(最初の)日付時刻を差し引き、日数と時分秒のインターバル型データを取得し、これを1900年..に対して足しこんであげています。あまりないとは思いますが、当然ながら絶対日付に1900年代のログがある場合は使えません。
一方、相対日付時刻においては本来のカレンダーに基づく属性がスポイルされるため、これに反応する顧客の行動傾向を理解することは難しくなります。例えば昼夜、時間帯における違い、平日休日、曜日における違い、月内のタイミングにおける違い(給料日直前直後とか)、季節における違い、単発イベントの影響(リーマンショックとか)などを理解するためには、絶対日付時刻を利用する必要があり、両方分析する場合には併用が必要です。
///
この記事が気に入ったらサポートをしてみませんか?