見出し画像

Dataikuでデータコンペに参加する会 #4 データ探索もくもく会!「お弁当の需要予測」

こんにちは! #Dataiku ユーザー会企画メンバー、Data Haiker Rikaです!

お弁当の需要予測の精度を上げる事を目標に再び集った Data Haikerたち。

とはいえ、まだまだひよっこの私達…
今回は、データサイエンスの知見のある先輩と一緒に、より精度の高い予測モデルに向けて、こんな気付きを得ました。

・課題の理解が不十分だった…!
・特徴量エンジニアリングには、「仮説」が不可欠!
・事前のデータ探索はやっぱり大事…
(Tableauって便利だな…)

そして、お弁当の課題に立ち返り、どんな仮説に基づき、どんな特徴量を作るべきか、議論しました。

  • 給料日:給料日前・給料日後

    • 懐の温かさを測るなら、給料日当日か否かより、給料日前後の方がニュアンスとして正しいのでは?

  • メニュー名を基に、メニューフラグ・カテゴリフラグを立てる

    • 個別のメニュー名ではなく、特定のメニューや原料をスポットする。

      • カレーフラグ

      • 肉フラグ

  • 売上上位から、人気商品フラグを作る

    • 「人気」というカテゴリで個別のメニューをくくってみる。

  • 前の日の天気

    • 前の日が雨だったら、朝食や弁当用の材料を買いに行けないから、社内で弁当を買うのでは?

勉強会の時間と、私たちのDataikuを扱う力がまだまだ足りないことが理由で、勉強会中には限られた特徴量の追加しかできなかったこともあり、勉強会の中では、少しの改善は見られたものの、劇的なスコアアップには至りませんでした。

しかし、ここであきらめないのがData Haiker!
勉強会終了後も、粘り強く課題に取り組んでくれた中村さんより、スコアが大幅に改善した、という嬉しい報告が!(すごいぜ)

今回の気づきの通り、やっぱり、
課題の理解は大事!
・特徴量エンジニアリングには、「仮説」が不可欠!!
・事前のデータ探索はやっぱり大事!!!

というわけで、次回は、「作業」が中心のもくもく会を実施します!

テーマ
Dataikuでデータコンペに参加する会 #4 データ探索もくもく会!「お弁当の需要予測」

11/3(金)祝 10:00 ~ 12:00ごろ

・オンライン開催 ※時間になったら適宜入場ください!
Google Meet URL
https://meet.google.com/xsz-asqo-xna

お題 

SIGNATE 【練習問題】お弁当の需要予測↓

https://signate.jp/competitions/24

やること

・前回ご参加の皆様:
前回に引き続き、お題:SIGNATE 【練習問題】お弁当の需要予測 の精度アップに挑戦。(前回作成したプロジェクトをご利用ください)

・前回参加していない方
①お題:SIGNATE 【練習問題】お弁当の需要予測 に合わせてプロジェクトを作成してご参加ください。
or
②前回作成したプロジェクトのエクスポートファイルを、↓からダウンロードし、インポートしてご参加ください。

※インポート手順
+NEW PROJECT > Import project

↑のzipファイルをそのままインポートしてください。

(地味に、無料版でエクスポートとインポートまでできちゃうってすごい。)

課題の各種告知は イベントホストのX(Twitter)で積極発信中です!
マエスhttps://twitter.com/maes_data
Rikahttps://twitter.com/Rika_Olga_F

当日みなさまとお会いできることを楽しみにしています!
ホストもDataikuを始めたばかり。Data Haikerとして一緒にポップに楽しくアップスキルしましょう!


環境:Dataiku無料版を使用します!

まだダウンロードしていない方はこちら↓から! 
無料版はフリートライアルと異なり、ずっと無料で使用できます。

どんな会なのかな?と気になる方へ

これまでのイベントのレポートやお役立ち情報をマガジンにまとめています。御覧ください!

Dataikuは初めて…

初心者の方には、Dataikuさんが不定期に開催している、公式のハンズオンイベントがオススメです。本職のセールスエンジニアさんが、丁寧に解説してくれます!

独学希望の方は、Dataikuの初心者向けラーニングパス・認定資格、「コアデザイナー」を目指すのがおすすめですよ!

Dataikuって、説明会とかイベントってやってるの?→最近すごいです。
各種イベント情報は、↓のTableau Publicのリンクより。
直近のイベントスケジュールが、がTableauで機能的に可視化されていてわかりやすいです!

Dataikuって、日本語対応してないって聞いたんだけど…

Dataikuコミュニティに、日本語化の要望が上がっています。
日本語版が欲しいよ!という方は、是非↓のリンクからログイン後、↑(やじるし)マークをクリックして、Vote(投票)しましょう!
日本の熱いローカライズ要望よ、届け!

Dataikuについてもっと知りたい方へ

Data Haikerって何?という方へ

Data Haiker 🥾 とは

「データ領域のアップスキルをしていく人たち」を意味する造語で、データの専門家であれ、ビジネスの専門家であれ、誰もがデータを活用してより良い社会、より良い働き方を求めて、楽しくアップスキルをしていく仲間を意味しています。
メンバー絶賛募集中です!

Dataiku様主催イベント告知HPより引用


この記事が気に入ったらサポートをしてみませんか?