見出し画像

人事データ活用の実践ハンドブック①:「その差は偶然なのか」をExcelで検定してみる

読書ノート(31日目)
今日からは今まで紹介してこなかった
統計学の本からピックアップしてみます

というのも、直近で僕自身が
データ分析の仕事をしており
いま最も関心が高いということ

データ分析を人事領域で活用するなら
どんな切り口があるかを整理しておきたい…
そんな思いからピックアップしてみました

では今日も始めていきます。
統計学で計算できる事は大まかにはこの4つ

・データ分析の4つのアプローチ
 ①差を見る
 ②関連性を見る
 ③似たもの同士で分類する
 ④予測する

「人事データ活用の実践ハンドブック」入江 崇介

人事領域でデータ利活用をするなら
人材採用、社員教育(研修)、
昇進昇格、人事異動などの場面で
既にデータが溜まっている事が多く
分析事例としてもよく登場します

具体的に人材採用での活用例だと…
内定者に共通する性格を知りたい場合」
対象を内定通知した合格者グループと
 不合格者だったグループに分けて
 性格テストの各項目別(※)に平均値を出す
 (※)積極性・外向性・リーダーシップなど
②その平均値の差が偶然なのかどうかを
 Excelのt検定で分析してみる。
 一般的に、偶然性が5%未満の項目は
 誤差ではなく確からしい可能性が高い

こんな感じで
データ分析の4つのアプローチの1つ目
「①差を見る」
についてはExcelでも分析できます

これを転用して
例えば対象者を内定者ではなく
入社後に活躍している社員と
苦戦している社員の2つに変えて
採用時の性格テストのどの項目に
差があった(もしくは差が無い)のか
を統計的に分析することもできる

さらに「④予測する」を組み合わせると
入社後に活躍している社員の特徴を
回帰分析を用いて方程式の形でモデル化し
採用する時点で将来どのくらいの確率で
活躍社員になりそうか予測することもできる

実際にデータを前にして手を動かしてみると
データに欠損値があったり、
活躍社員をどう定義するかが難しかったりと
こんな簡単にはいかないのですが…😅

…と、こんな感じで最近は統計学の本ばかり
読んでいるので備忘メモとして残しておきます。

Practical Handbook for Utilizing HR Data
Reading Notes (Day 31)

From today, I'm going to pick up a book on statistics that I haven't introduced before.

I picked up this book because I have been working on data analysis for a while now, and I am most interested in it, and I wanted to organize what kind of approach data analysis can be used in the human resource field.

Let's start today.
There are roughly four things that can be analyzed with statistics

If data is to be utilized in the human resources area, aim for statistically reliable measures since a large amount of data has already been accumulated in such areas as recruitment, employee education (training), promotions, and personnel transfers.

The following are some specific examples of applications in the recruitment process...
When I want to know the personality traits common to those who received job offers

The group of successful candidates who were notified of the job offer is divided into a group of successful candidates and a group of unsuccessful candidates, and the average value is calculated for each item (*) of the personality test.
(*)Positivity, extroversion, leadership, etc.

I use an Excel t-test to analyze whether the average difference is a coincidence.
In general, items with a chance of less than 5% have a high probability of being certain rather than an error.

The first of the four approaches to data analysis,
"(1) Look at differences," can be done with Excel.

This can be used, for example, to statistically analyze which items on the personality test at the time of hiring were different (or not different) by changing the subjects to two groups: employees who are active after joining the company and employees who are struggling, instead of those who have received job offers.

Furthermore, by combining "4) Prediction", we can model the characteristics of employees who are active after joining the company in the form of an equation using regression analysis and predict the probability of becoming an active employee in the future at the time of hiring.

It is not as easy as it sounds, but when I actually try to work with the data, there are missing values in the data, and it is difficult to define an active employee....

I've been reading a lot of books on statistics lately, so I'll leave this as a reminder.

See you tomorrow!

この記事が参加している募集

英語がすき

この記事が気に入ったらサポートをしてみませんか?