Dataikuでデータコンペに参加する会 #4 データ探索もくもく会!「お弁当の需要予測」
こんにちは! #Dataiku ユーザー会企画メンバー、Data Haiker Rikaです!
お弁当の需要予測の精度を上げる事を目標に再び集った Data Haikerたち。
とはいえ、まだまだひよっこの私達…
今回は、データサイエンスの知見のある先輩と一緒に、より精度の高い予測モデルに向けて、こんな気付きを得ました。
・課題の理解が不十分だった…!
・特徴量エンジニアリングには、「仮説」が不可欠!
・事前のデータ探索はやっぱり大事…(Tableauって便利だな…)
そして、お弁当の課題に立ち返り、どんな仮説に基づき、どんな特徴量を作るべきか、議論しました。
給料日:給料日前・給料日後
懐の温かさを測るなら、給料日当日か否かより、給料日前後の方がニュアンスとして正しいのでは?
メニュー名を基に、メニューフラグ・カテゴリフラグを立てる
個別のメニュー名ではなく、特定のメニューや原料をスポットする。
カレーフラグ
肉フラグ
売上上位から、人気商品フラグを作る
「人気」というカテゴリで個別のメニューをくくってみる。
前の日の天気
前の日が雨だったら、朝食や弁当用の材料を買いに行けないから、社内で弁当を買うのでは?
勉強会の時間と、私たちのDataikuを扱う力がまだまだ足りないことが理由で、勉強会中には限られた特徴量の追加しかできなかったこともあり、勉強会の中では、少しの改善は見られたものの、劇的なスコアアップには至りませんでした。
しかし、ここであきらめないのがData Haiker!
勉強会終了後も、粘り強く課題に取り組んでくれた中村さんより、スコアが大幅に改善した、という嬉しい報告が!(すごいぜ)
今回の気づきの通り、やっぱり、
・課題の理解は大事!
・特徴量エンジニアリングには、「仮説」が不可欠!!
・事前のデータ探索はやっぱり大事!!!
というわけで、次回は、「作業」が中心のもくもく会を実施します!
テーマ
Dataikuでデータコンペに参加する会 #4 データ探索もくもく会!「お弁当の需要予測」
11/3(金)祝 10:00 ~ 12:00ごろ
・オンライン開催 ※時間になったら適宜入場ください!
Google Meet URL
https://meet.google.com/xsz-asqo-xna
お題
SIGNATE 【練習問題】お弁当の需要予測↓
https://signate.jp/competitions/24
やること
・前回ご参加の皆様:
前回に引き続き、お題:SIGNATE 【練習問題】お弁当の需要予測 の精度アップに挑戦。(前回作成したプロジェクトをご利用ください)
・前回参加していない方
①お題:SIGNATE 【練習問題】お弁当の需要予測 に合わせてプロジェクトを作成してご参加ください。
or
②前回作成したプロジェクトのエクスポートファイルを、↓からダウンロードし、インポートしてご参加ください。
※インポート手順
+NEW PROJECT > Import project
↑のzipファイルをそのままインポートしてください。
(地味に、無料版でエクスポートとインポートまでできちゃうってすごい。)
課題の各種告知は イベントホストのX(Twitter)で積極発信中です!
マエスhttps://twitter.com/maes_data
Rikahttps://twitter.com/Rika_Olga_F
当日みなさまとお会いできることを楽しみにしています!
ホストもDataikuを始めたばかり。Data Haikerとして一緒にポップに楽しくアップスキルしましょう!
環境:Dataiku無料版を使用します!
まだダウンロードしていない方はこちら↓から!
無料版はフリートライアルと異なり、ずっと無料で使用できます。
どんな会なのかな?と気になる方へ
これまでのイベントのレポートやお役立ち情報をマガジンにまとめています。御覧ください!
Dataikuは初めて…
初心者の方には、Dataikuさんが不定期に開催している、公式のハンズオンイベントがオススメです。本職のセールスエンジニアさんが、丁寧に解説してくれます!
独学希望の方は、Dataikuの初心者向けラーニングパス・認定資格、「コアデザイナー」を目指すのがおすすめですよ!
Dataikuって、説明会とかイベントってやってるの?→最近すごいです。
各種イベント情報は、↓のTableau Publicのリンクより。
直近のイベントスケジュールが、がTableauで機能的に可視化されていてわかりやすいです!
Dataikuって、日本語対応してないって聞いたんだけど…
Dataikuコミュニティに、日本語化の要望が上がっています。
日本語版が欲しいよ!という方は、是非↓のリンクからログイン後、↑(やじるし)マークをクリックして、Vote(投票)しましょう!
日本の熱いローカライズ要望よ、届け!
Dataikuについてもっと知りたい方へ
Data Haikerって何?という方へ
この記事が気に入ったらサポートをしてみませんか?