見出し画像

【JKI】036_Implementing_Custom_Time_Alignment

【JKI_036】課題を確認

Just KNIME It! (JKI)

今回の挑戦はこちら

問題文のところだけをGoogle翻訳し少し加筆して以下に

課題36: カスタムタイムアライメントの実装
レベル: 中程度
説明:
KNIME は時系列に関する新しい教科書をリリースしました。これを記念して、この課題で少し時系列分析を行います。
ここで本をチェックしてください(割引もあります!).
 
この課題では、データの性質による通常の欠損値と不規則な欠損値の2種類の欠損値を含むデータに対してタイムアライメントを実行します。
たとえば、毎日の株式市場のデータは定期的に土曜日と日曜日をスキップし、祝日のために他の平日を不定期にスキップします。
この課題の具体的なタスクは、欠落している平日に対応するタイムスタンプを指定されたデータに導入し、週末のタイムスタンプを省略することです。
データには、1980年から1998年までの米ドルとスイス フランの毎日の為替レートが含まれています。

ヒント: 時系列分析の検証済みコンポーネントを確認してください。
ヒント 2: 参考までに、書籍にアクセスできる場合は、この課題の基になっている第3章 (時系列分析用のデータの準備) を確認してください。

【カスタムタイムアライメントってなんだ】

GoogleでもDeepLでもCustom Time Alignmentはカスタムタイムアライメントで、日本語に変換しにくいようです。要するに自分たちで好きなように時間軸の調整ができると言うことなのかなぁと推測します。
今回の場合は与えられたデータに日時データの欠損があるのでそれを自分たちが思う通り、平日だけは全て解析対象にしたいのでデータ前処理をすると言う体験をするようです。

サンプルデータをいつも通りWF内のdataフォルダに格納し相対パスで読み込みました。

設定:

結果:

なるほど元旦と土日が欠損しているなってわかります。これを祝日だけは埋めると言うことですね。それにしても新年は元旦しか休まないのか。

【String to Date&Time】

時間に関するデータを処理したいとき、KNIMEではDate&Time型にしてから扱うのが便利です。

設定:

結果:

プログラムがOBSカラムは日時データであると認識するように変わりました。

【Timestamp Alignmentコンポーネント】

ヒントにある通り、下記サイトにいけばこれが答えだろうと名前で分かると思います。

逆に他のコンプ―ネントが多数ありますが、私には何をするものかわかりませんでした。興味があれば宣伝されていた本を買うしかないな。JKIもとうとう宣伝が入るようになったなと面白く思っています。

「番宣かよ!」

さて、本題に戻ります。

設定:

結果:

確かに日付の欠損していた部分に新たに行が追加されています。よくできているなぁ。
コンポーネントの中が気になり見てみました。

これ、さらにメタノードの中も丁寧に分岐処理など作りこまれていまして、よく考えられているなぁと感心します。
入力データの最大と最小の時点を元に連続した日時データを作成するのですが、日時データは複数の種類があるため分岐処理していたりします。

KNIMEでの時系列データ処理技術はきっと多くの方の努力によって充実したライブラリが作られているのだろうと思われました。宣伝ぐらいしたっていいですよね!

【土日のデータを削除】

Timestamp Alignmentコンポーネントで連続した日付データが作成されましたので、あとは上記2つのノードで曜日データを付与したのちに土日の行を削除すればよいでしょう。

設定:

結果:

時系列データを処理する際に、Day of week (number)で数値データとして曜日を扱えるようにしてくれているのも便利なんですよね。KNIME社の皆さんの心配りが嬉しいです。

これで解答は終わりだと思うのですが、興味のおもむくままに追加で可視化もしてみました。

【USドルとスイスフランの為替レート可視化】

折角整形したので、データをプロットしてみました。

設定:

結果:

最近円安がそれなりに話題になりますが、為替って本当に動きますよね。

KNIME Hubに解答は上げています。


おまけ:

【JKI_035 感想戦】

先週のJust KNIME It! 第35回はグラフでのネットワーク可視化を体験しました。

公式解答はこちらです。

コンポーネントあるんだ、やられたーって思いましたが、これは今回の課題用の新作のようです。LinkedInのconnections.csv専用というマニアックな仕様と言えるでしょう。

公式解答は今回も遊び心があって、皆さんの多様なデータを入力したとしてもKNIMEで働いている人だけは必ず黄色に色分けされるらしいです。

さらに

Peter 👋 さん、絵文字がミドルネームになってる。

って私もコメントしましたが、そこも対応するという芸の細かさ。

これはなかなか見ごたえのある公式解答です。課題には書かれてなかったことばかりで感心してしまいました。
解答者がドヤ顔でほくそ笑む表情を想像しました。
解答者のAlineさん、なかなか変わり者だなぁ。ファンです。


記事を読んでいただきありがとうございます。 先人の智慧をお借りしつつ、みなさんに役立つ情報が届けられたらと願っています。 もしサポートいただけるなら、そのお金はKNIMEの無料勉強会の開催資金に充てようと思います。