シティズンデータサイエンス

第19回 ズルのできない予測精度の検証方法(2)

第19回 ズルのできない予測精度の検証方法(2)

シティズンデータサイエンスラボは「データサイエンスを全ての人に」を掲げる株式会社データビークル(https://www.dtvcl.com/)が運営する公式noteです。 過学習を見抜くためのフェアな評価方法 過学習がなぜ問題になるかというと、今あるデータに対してもっとも予測値と実際の値のズレが小さくなるように計算した状態で、その計算に使ったデータにおける「予測値と実際の値のズレ」を評価しようとしていたからでした。本当に知りたいことは「いまあるデータにおけるズレ」ではなく

スキ
10
第8回 アウトカムを設定するコツ(2)

第8回 アウトカムを設定するコツ(2)

シティズンデータサイエンスラボは「データサイエンスを全ての人に」を掲げる株式会社データビークル(https://www.dtvcl.com/)が運営する公式noteです。 そのアウトカムでズルはできるか 前回示したように、まずは利益に直結するか、ということを考えて通貨の単位で記録されているデータ、日常的に大きなコストがかかっているデータに着目すればアウトカムの目星がつけられます。 ただ「長期的に確実に」ついては難しいところです。それがわかれば苦労しないよと思われる方もい

スキ
2
[イベントレポート]待望の大型アップデート!dataDiver/dataFerryバージョンアップ特別内覧会を開催しました

[イベントレポート]待望の大型アップデート!dataDiver/dataFerryバージョンアップ特別内覧会を開催しました

シティズンデータサイエンスラボは「データサイエンスを全ての人に」を掲げる株式会社データビークル(https://www.dtvcl.com/)が市民データサイエンスを広めるために発信しているnoteです。 2019年4月19日、都内にてdataDiver、dataFerryの製品特別内覧会を開催しました。 6月3日に大型のバージョンアップをいたします。本イベントはデータビークルの開発パートナーやメディアを対象とした先行イベントで、開発者自らが今回の大型バージョンアップの内

スキ
2
「リーダーに学ぶ姿勢がなければ、道具を使いこなす文化は育たない」グッデイ 柳瀬隆志氏×西内啓対談 Vol.3

「リーダーに学ぶ姿勢がなければ、道具を使いこなす文化は育たない」グッデイ 柳瀬隆志氏×西内啓対談 Vol.3

西内啓の対談シリーズ。株式会社グッデイ 柳瀬隆志さんの第3弾です。社内にデータ分析活用を文化として根づかせるには何が重要なのか?。データ分析を生真面目に終わらせないための「ハック」する姿勢などについて語り合います。 シティズンデータサイエンスラボは「データサイエンスを全ての人に」を掲げる株式会社データビークル(https://www.dtvcl.com/)が運営する公式noteです。 リーダーが自ら学ばなければ、便利なツールを使いこなす文化は育たない 柳瀬 私は、自分が

スキ
6
「データ分析はコミュニケーションツールである」グッデイ 柳瀬隆志氏×西内啓対談 Vol.2

「データ分析はコミュニケーションツールである」グッデイ 柳瀬隆志氏×西内啓対談 Vol.2

西内啓の対談シリーズ。ホームセンター「グッデイ」の柳瀬隆志さんの第2回目です。実際に小売業ではどのようなデータ分析が行われているのかという基本的なお話から、同社が実験している音声認識技術を搭載した売場案内ボットによって見えてきたことまで、話は広がります。 シティズンデータサイエンスラボは「データサイエンスを全ての人に」を掲げる株式会社データビークル(https://www.dtvcl.com/)が運営する公式noteです。 データ分析によって話の齟齬がなくなった 西内 

スキ
16
「今まで自分がデータ分析だと思っていた作業は、データ分析ではなかった」グッデイ 柳瀬隆志氏×西内啓対談 Vol.1

「今まで自分がデータ分析だと思っていた作業は、データ分析ではなかった」グッデイ 柳瀬隆志氏×西内啓対談 Vol.1

データビークルの最高製品責任者であり統計家の西内啓がデータ活用で成果をあげている企業・組織のキーパーソンの方とデータサイエンスの現実について語り合う対談シリーズ。第二弾は北部九州・山口を中心に「ホームセンターGooDay」を展開する株式会社グッデイ 代表取締役社長 柳瀬隆志氏。データ活用で躍進を続ける同社の取り組みについて、お話を伺います。 シティズンデータサイエンスラボは「データサイエンスを全ての人に」を掲げる株式会社データビークル(https://www.dtvcl.c

スキ
9
第5回 継続的なデータ活用プロセスにおけるデータ整備の位置づけ

第5回 継続的なデータ活用プロセスにおけるデータ整備の位置づけ

シティズンデータサイエンスラボは「データサイエンスを全ての人に」を掲げる株式会社データビークル(https://www.dtvcl.com/)が運営する公式noteです。 データ整備のサグラダファミリア ここまで「業務のためのデータ」をどう「活用のためのデータ」に加工するかを詳しく説明してきました。複数の表を結合するためのキーを確認し、それぞれの表の中に含まれる対象のデータを確認し、最終的にどのような切り口で1行ずつにまとめるのかを決めて、それぞれの項目を数値化したり分類

スキ
21
[イベントレポート]4時間半でロジスティック回帰まで!「統計マラソン」を走りぬく

[イベントレポート]4時間半でロジスティック回帰まで!「統計マラソン」を走りぬく

データビークルは、オウンドメディア「シティズンデータサイエンスラボ」のスタートを記念して、2019年3月3日にnoteのユーザーさんを対象として「ビジネスマンのための統計学ワークショップ」を開催いたしました。短時間で統計学のエッセンスをぎゅっと詰め込んだ内容になりました。 このイベントは、「データ分析をしたいがなかなか手につかないし分からない…」「データドリブンのマーケティングに興味がある」といったビジネスに携わる方々を対象として、実際に手を動かしながら統計学を学ぶというも

スキ
1
「人でなければできないこと、データを使って進めるべきこと」RIZAPグループ株式会社 鎌谷賢之×西内啓対談 vol.2

「人でなければできないこと、データを使って進めるべきこと」RIZAPグループ株式会社 鎌谷賢之×西内啓対談 vol.2

西内啓の対談シリーズ。RIZAP(ライザップ)グループの鎌谷賢之さんの後編です。RIZAPグループの成長戦略や、教育産業とRIZAPの意外な共通点、RIZAP GOLFの革新性などについて語ります。 シティズンデータサイエンスラボは「データサイエンスを全ての人に」を掲げる株式会社データビークル(https://www.dtvcl.com/)が運営する公式noteです。 前編はこちら https://blog.dtvcl.com/n/n40d726c12249 「10キロ

スキ
3
「データの活用でさらに結果にコミットするサービスに進化したRIZAP」RIZAPグループ株式会社 鎌谷賢之×西内啓対談 vol.1

「データの活用でさらに結果にコミットするサービスに進化したRIZAP」RIZAPグループ株式会社 鎌谷賢之×西内啓対談 vol.1

データビークルの最高製品責任者であり統計家の西内啓がデータ活用で成果をあげている企業・組織のキーパーソンの方とデータサイエンスの現実について語り合う対談シリーズ。第一弾は「結果にコミットする」でおなじみのプライベートジム「RIZAP」(ライザップ)を中心に、さまざまな企業とのM&Aで成長を続けてきたRIZAPグループで成長戦略を描く要として活躍する鎌谷賢之氏にお話を伺います。 シティズンデータサイエンスラボは「データサイエンスを全ての人に」を掲げる株式会社データビークル(h

スキ
4