見出し画像

【11/12開催】Dataikuでデータコンペに参加する会#5 11/24 Data Hikerイベント予習 Kaggle"従業員の退職予測"に挑戦!

こんにちは! #Dataiku ユーザー会企画メンバー、Data Haiker Rikaです!

お弁当の需要予測に取り組んで早4回目。
課題の理解は大事!
・特徴量エンジニアリングには、「仮説」が不可欠!!
・事前のデータ探索はやっぱり大事!!!

というわけで、第4回では、データ探索ともくもく作業を行いました!
前半:グループディスカッション
お弁当屋さん・購入者の立場に基づいて、問題文やチュートリアルを改めて見直し、仮説を議論。Tableauも駆使してデータを探索。
・そもそも売上って全体的に下がってたんだね。
・お楽しみメニューって、売上数が「跳ねる」特性があるね。
・お楽しみメニューって、最初からあったわけじゃないんだ!
・予測したいのは通年ではなくて、10月、11月の2か月分だけなんだ。
・人気メニューかどうか、って大事じゃない?
・通年を期間で区切って、重みづけってできないのかな?
など、の気づきを得て、

後半:グループディスカッションでの気づきを反映したフローを作成。得られたアウトプットをSignateに投稿
・日時のデータを、年・月・日に分解、特徴量に含める
・人気メニュー(平均よりも売り上げの高いメニュー)にフラグを付ける
・カレーにフラグを付ける
・お楽しみメニューにフラグを付ける
など、気付きをフローに実装しました。
Dataikuの操作に四苦八苦して、ホストの私は投稿までたどり着けませんでしたが、参加者の中には、人気メニューやお楽しみメニューのフラグを実装し、スコアアップに成功した方も!

引き続き、「どうやったら、この時系列での減少をうまくモデルに伝えられるのだろうか?」「どんなモデルが最適なのだろうか?」など、改善の余地はありつつも、次回から、Data Haikerは新たな課題に取り組みます!

テーマ
11/24 Data Hikerイベント予習 Kaggle"従業員の退職予測"に挑戦!

11/12(日) 10:00 ~ 12:00ごろ

・オンライン開催 ※時間になったら適宜入場ください!
Google Meet URL
https://meet.google.com/xsz-asqo-xna

お題 

Kaggle 退職者予測 

SE NanaeさんからのTips!

  • 最初に自分でSplitして、モデルを作るデータとスコアリングするデータに分ける

  • スコアリングするデータに正解の列も存在しているので、ScoreではなくEvaluateのレシピを使う

やること

11/24(金)Dataikuさん主催のハンズオンイベント 第二部 15:15-16:45のData Haikerチャレンジのお題の予習をします!(鳥越 希氏/株式会社キーウォーカー データサイエンス部 チームリーダーによるゲストトークもあるとのこと!専門家から直接学べるのは貴重ですね!)

環境:Dataiku無料版を使用します!

まだダウンロードしていない方はこちら↓から! 
無料版はフリートライアルと異なり、ずっと無料で使用できます。

課題の各種告知は イベントホストのX(Twitter)で積極発信中です!
マエスhttps://twitter.com/maes_data
Rikahttps://twitter.com/Rika_Olga_F

当日みなさまとお会いできることを楽しみにしています!
ホストもDataikuを始めたばかり。Data Haikerとして一緒にポップに楽しくアップスキルしましょう!


どんな会なのかな?と気になる方へ

これまでのイベントのレポートやお役立ち情報をマガジンにまとめています。御覧ください!

Dataikuは初めて…

初心者の方には、Dataikuさんが不定期に開催している、公式のハンズオンイベントがオススメです。本職のセールスエンジニアさんが、丁寧に解説してくれます!

独学希望の方は、Dataikuの初心者向けラーニングパス・認定資格、「コアデザイナー」を目指すのがおすすめですよ!

Dataikuって、説明会とかイベントってやってるの?→最近すごいです。
各種イベント情報は、↓のTableau Publicのリンクより。
直近のイベントスケジュールが、がTableauで機能的に可視化されていてわかりやすいです!

Dataikuの操作、気になる事、聞きたいなぁ。→公式コミュニティのJapan User Groupでの質問がオススメ!
日本語で質問OK! 質問・情報共有自体が、User Groupの盛り上がりに貢献します。どんどん質問していきましょう!

Dataikuって、日本語対応してないって聞いたんだけど…

Dataikuコミュニティに、日本語化の要望が上がっています。
日本語版が欲しいよ!という方は、是非↓のリンクからログイン後、↑(やじるし)マークをクリックして、Vote(投票)しましょう!
日本の熱いローカライズ要望よ、届け!

Dataikuについてもっと知りたい方へ

Data Haikerって何?という方へ

Data Haiker 🥾 とは

「データ領域のアップスキルをしていく人たち」を意味する造語で、データの専門家であれ、ビジネスの専門家であれ、誰もがデータを活用してより良い社会、より良い働き方を求めて、楽しくアップスキルをしていく仲間を意味しています。
メンバー絶賛募集中です!

Dataiku様主催イベント告知HPより引用


この記事が気に入ったらサポートをしてみませんか?