DATA MINDS編集部@ワークスアイディDS東京

ワークスアイディ(株)データサイエンス東京チームの有志メンバーによる記事サイト「DAT…

DATA MINDS編集部@ワークスアイディDS東京

ワークスアイディ(株)データサイエンス東京チームの有志メンバーによる記事サイト「DATA MINDS」の内容を投稿します。「DATA MINDS」は、数字に苦手意識がある方やデータに初めて触れる初心者の方ヘ役立つ情報を毎週更新していきますので、お楽しみに!

マガジン

記事一覧

機械学習とは?〜AIの学習方法〜

皆さんこんにちは! 今回は近年注目されている機械学習についてお伝えします。 機械学習について簡単に説明すると、「AI(人工知能)自身がデータを繰り返し学習し、デー…

迷信か、事実か?統計が語る迷信の真実~ひのえうま~

「ひのえうま」という言葉をご存じですか? 「ひのえうま」(丙午)は、干支(十干十二支)の組み合わせの一つで、60年に一度巡ってきます。 ひのえうまの年は、直近では…

相関と因果の違いを理解しよう!~「相関関係があるけど、因果関係はないよね?」の指摘を攻略しよう~

データ分析をしていると、「これは相関関係があるけど、因果関係はないよね?」と指摘をされることはありませんか? そんなとき「相関と因果の違いって何だろう?」と思い…

グラフの使い分けでデータの見え方が変わる?!~電化製品の購買データで学ぶグラフの活用法~

アンケート結果やプレゼンテーション資料、天気予報の気温や湿度の推移など、日常的にグラフを目にする機会は多いのではないでしょうか? また、グラフは何かの比較や変化…

統計学の基礎「正規分布」を理解しよう!〜確率で考える正規分布〜

こんにちは! 今回は「正規分布」について一緒に学んでいきましょう。 正規分布は、性別ごとの身長やテストの点数など身近な統計から、製造業の品質管理などのビジネス統…

データがなくても大丈夫!無料で使える学習用データを活用しよう~国外版~

こんにちは、皆さん! 前回、日本国内における誰でも無料で使えるデータセットをご紹介しました。 今回は、海外で提供されている無料のデータセットをご紹介します。 デ…

スクレイピング入門~Webサイトの情報を自由自在に手に入れよう~

スクレイピングとは? みなさんは”スクレイピング”をご存じですか? Webサイト上には非常に多くの情報が存在しますが、その情報を取得し、有効に活用できるようにする…

Tableau Publicを使ってデータサイエンスの世界に踏み込んでみよう

「Tableau Public」は無料で手軽にデータをグラフに変えることができ、分析の初心者から上級者まで、誰でも簡単に使いこなせる優れもの。 今回はTableau Publicの基本から…

前年比〇〇%と前年比〇〇%増の違い ~前年売上200%増は 売上2倍ではない!?~

ビジネスや企業の現状を前年との状態の比較で表す際、「前年比〇〇%」または「前年比〇〇%増」という表現を目にすることがあります。 2つの表現は似ているため混同され…

生産性 爆上げシリーズ~正規表現 実践編~

みなさんこんにちは! 前回の「正規表現~基礎編~」では正規表現とは何か、正規表現によって何ができるかについてお伝えしました。 今回の「正規表現~実践編~」では実…

小学生は足が速いと本当にモテるのか?~巷で噂の話題を深堀考察してみる~

突然ですが、皆さんは小さいころにモテた経験はありますか? 世間では「小学生は足が速い子がモテる」と言われていますが、それは本当なのでしょうか? 今回は、アンケー…

データがなくても大丈夫!無料で使える学習用データを活用しよう~国内版~

データの可視化やデータ分析を実際に挑戦してみたいけど、手元に使えるデータがない…とお悩みのあなたに朗報です。 実はインターネット上などに誰でも無料で使えるデータ…

自分の業務の影響範囲、意識していますか?~偏差値の計算方法と数値の因数分解~

みなさんこんにちは! 以前の「偏差値を正しく理解する-自分の価値って何?偏差値の読み方を楽しく解説-」では偏差値とは何か、偏差値の考え方をどのように応用できるのか…

生産性爆上げシリーズ!~正規表現 基礎編~

皆さんは、デスクワークで作業をしている際に文章の最後に句点「。」を忘れてしまったり、英数字の半角や全角が混在していたりと細かい作業ミスに悩まされたことはありませ…

あなたは富豪?それとも… ~年収でみる平均値と中央値の違いと使い方~

はじめに こんにちは! 皆さんが普段もらっているお給料、「平均年収って聞くけど、実際のところ自分の年収ってどうなの?」と思ったことはありませんか? そんな時に…

%とpt(ポイント)の使い分けは? ~ワンランク上の表現を身に着けましょう~

%とpt(ポイント)とは 洋服のセールの広告の「50%オフ」、ニュースの「政党の支持率が10pt(ポイント)上昇」など… 普段の生活で何気なく「%(パーセント)」や「pt(ポイ…

機械学習とは?〜AIの学習方法〜

機械学習とは?〜AIの学習方法〜

皆さんこんにちは!
今回は近年注目されている機械学習についてお伝えします。

機械学習について簡単に説明すると、「AI(人工知能)自身がデータを繰り返し学習し、データの特徴を見つけ出すこと」です。
現在多くの企業ではビッグデータの利活用が進められており、機械学習はその活用方法の1つです。

今まで集計はされていたものの、あまりに膨大で放置されていたデータやオープンデータをAIに学習させることでデー

もっとみる
迷信か、事実か?統計が語る迷信の真実~ひのえうま~

迷信か、事実か?統計が語る迷信の真実~ひのえうま~

「ひのえうま」という言葉をご存じですか?
「ひのえうま」(丙午)は、干支(十干十二支)の組み合わせの一つで、60年に一度巡ってきます。
ひのえうまの年は、直近では1966年、次は2026年です。

「丙」(ひのえ)は十干の「甲・乙・丙・丁・戌・己・庚・辛・壬・癸」の一つで「火の兄」という意味があり 、「午」(うま)はおなじみの十二支の一つで、こちらも火の性質を持つといわれています。

よって

もっとみる
相関と因果の違いを理解しよう!~「相関関係があるけど、因果関係はないよね?」の指摘を攻略しよう~

相関と因果の違いを理解しよう!~「相関関係があるけど、因果関係はないよね?」の指摘を攻略しよう~

データ分析をしていると、「これは相関関係があるけど、因果関係はないよね?」と指摘をされることはありませんか?
そんなとき「相関と因果の違いって何だろう?」と思いませんでしたか?

今回は相関と因果の違いについて、具体例を交えて説明していきたいと思います!

相関とは

相関とは、「一方の値が増減したとき、もう一方の値も増減する」という関係性を言います。

左の図は「Aが増えると、Bが増える関係」で

もっとみる
グラフの使い分けでデータの見え方が変わる?!~電化製品の購買データで学ぶグラフの活用法~

グラフの使い分けでデータの見え方が変わる?!~電化製品の購買データで学ぶグラフの活用法~

アンケート結果やプレゼンテーション資料、天気予報の気温や湿度の推移など、日常的にグラフを目にする機会は多いのではないでしょうか?

また、グラフは何かの比較や変化を視覚的に伝えることができ、ビジネスやデータ分析の現場でよく使われています。

グラフには折れ線グラフや円グラフなど様々な種類がありますが、グラフそれぞれの特徴を理解し、用途に合わせて使うことで資料のクオリティが向上し、よりお客様にわかり

もっとみる
統計学の基礎「正規分布」を理解しよう!〜確率で考える正規分布〜

統計学の基礎「正規分布」を理解しよう!〜確率で考える正規分布〜

こんにちは!
今回は「正規分布」について一緒に学んでいきましょう。

正規分布は、性別ごとの身長やテストの点数など身近な統計から、製造業の品質管理などのビジネス統計まで、幅広く使われています。
正規分布を用いれば、統計的な分析を行うことができ、一段階上のデータ解釈を行うことができます。

「正規分布は聞いたことがあるけどよく分からない…」という人もいるかと思いますが、分かりやすく説明するのでぜひご

もっとみる
データがなくても大丈夫!無料で使える学習用データを活用しよう~国外版~

データがなくても大丈夫!無料で使える学習用データを活用しよう~国外版~

こんにちは、皆さん!
前回、日本国内における誰でも無料で使えるデータセットをご紹介しました。

今回は、海外で提供されている無料のデータセットをご紹介します。

データ分析において国内外のデータを比較対象とする場面はよくあるので、ぜひご一読ください!

UCI Machine Learning Repository

最初に紹介するのは「UCI Machine Learning Repositor

もっとみる
スクレイピング入門~Webサイトの情報を自由自在に手に入れよう~

スクレイピング入門~Webサイトの情報を自由自在に手に入れよう~


スクレイピングとは?

みなさんは”スクレイピング”をご存じですか?

Webサイト上には非常に多くの情報が存在しますが、その情報を取得し、有効に活用できるようにする技術、それがスクレイピングです。
データ分析業務では自社や依頼先にデータが無く、Webサイト上のテキストや画像などの情報を収集・加工して使用することがあります。

その際、手動でデータ収集すると膨大な時間がかかってしまうことがありま

もっとみる
Tableau Publicを使ってデータサイエンスの世界に踏み込んでみよう

Tableau Publicを使ってデータサイエンスの世界に踏み込んでみよう

「Tableau Public」は無料で手軽にデータをグラフに変えることができ、分析の初心者から上級者まで、誰でも簡単に使いこなせる優れもの。

今回はTableau Publicの基本から、グラフを作成する楽しさを一緒に探求していきましょう。

Tableau Publicをインストール

Tableau Publicはインターネット上で無料で提供されていて、専門的な知識がなくても直感的に操作で

もっとみる
前年比〇〇%と前年比〇〇%増の違い ~前年売上200%増は 売上2倍ではない!?~

前年比〇〇%と前年比〇〇%増の違い ~前年売上200%増は 売上2倍ではない!?~

ビジネスや企業の現状を前年との状態の比較で表す際、「前年比〇〇%」または「前年比〇〇%増」という表現を目にすることがあります。

2つの表現は似ているため混同されがちですが、実際は異なる意味を持っており、この記事では、その表現の違いについて詳しく説明します。

データ分析をする際は、正確な表現を理解し正しく数値を解釈する力が求められるので、共にデータに関するリテラシーを上げていきましょう。

「前

もっとみる
生産性 爆上げシリーズ~正規表現 実践編~

生産性 爆上げシリーズ~正規表現 実践編~

みなさんこんにちは!

前回の「正規表現~基礎編~」では正規表現とは何か、正規表現によって何ができるかについてお伝えしました。

今回の「正規表現~実践編~」では実際に正規表現を使って文字の検索や置換を行いますので、ぜひみなさんも今回の内容を参考にしてください!

正規表現とサクラエディタ

正規表現を学ぶ上で、今回はサクラエディタを使用します。
サクラエディタは無料のツールでありながら正規表現を

もっとみる
小学生は足が速いと本当にモテるのか?~巷で噂の話題を深堀考察してみる~

小学生は足が速いと本当にモテるのか?~巷で噂の話題を深堀考察してみる~

突然ですが、皆さんは小さいころにモテた経験はありますか?

世間では「小学生は足が速い子がモテる」と言われていますが、それは本当なのでしょうか?

今回は、アンケート結果をもとに深堀って考察をしていきたいと思います。

モテる小学生とは

2021年に実施された学研教育総合研究所の調査​(ソース)によると、小学生の間で人気者の条件とされるのは「面白いこと」がトップ。
これに次いで「運動神経が良いこ

もっとみる
データがなくても大丈夫!無料で使える学習用データを活用しよう~国内版~

データがなくても大丈夫!無料で使える学習用データを活用しよう~国内版~

データの可視化やデータ分析を実際に挑戦してみたいけど、手元に使えるデータがない…とお悩みのあなたに朗報です。

実はインターネット上などに誰でも無料で使えるデータセットが公開されており、気軽に実践的な分析を行うことができます。

今回は、特にデータサイエンス初心者におすすめのデータセットをご紹介します。

scikit-learnのiris

まず始めに、Pythonのライブラリ「scikit-l

もっとみる
自分の業務の影響範囲、意識していますか?~偏差値の計算方法と数値の因数分解~

自分の業務の影響範囲、意識していますか?~偏差値の計算方法と数値の因数分解~

みなさんこんにちは!

以前の「偏差値を正しく理解する-自分の価値って何?偏差値の読み方を楽しく解説-」では偏差値とは何か、偏差値の考え方をどのように応用できるのかについてお伝えしました。

今回の記事では実際にどうやって偏差値を求めるのか、また、偏差値に限らず数値を分解して理解することの重要性をお伝えしたいと思います!

データ分析者は数値を因数分解し影響度合いを語れることで、業務の幅が広がりま

もっとみる
生産性爆上げシリーズ!~正規表現 基礎編~

生産性爆上げシリーズ!~正規表現 基礎編~

皆さんは、デスクワークで作業をしている際に文章の最後に句点「。」を忘れてしまったり、英数字の半角や全角が混在していたりと細かい作業ミスに悩まされたことはありませんか?

さらにはデータ分析をしているときに、そういった表記のばらつきがあるとエラーが出てしまったり、違った結果が出力されてしまうことがあります。

こんなときに「正規表現」を使うと、一括で表記のばらつきを確認できたり、ミスを修正することが

もっとみる
あなたは富豪?それとも… ~年収でみる平均値と中央値の違いと使い方~

あなたは富豪?それとも… ~年収でみる平均値と中央値の違いと使い方~


はじめに

こんにちは!

皆さんが普段もらっているお給料、「平均年収って聞くけど、実際のところ自分の年収ってどうなの?」と思ったことはありませんか?

そんな時に役立つ数値が、「平均値」と「中央値」です。
今日は日本の年収データ(2019年 国民生活基礎調査の概況)を使って、平均値と中央値の違いを楽しく学んでいきましょう!

まず、「平均値」についてです。
「平均値」は、全部のデータの値を足し

もっとみる
%とpt(ポイント)の使い分けは? ~ワンランク上の表現を身に着けましょう~

%とpt(ポイント)の使い分けは? ~ワンランク上の表現を身に着けましょう~


%とpt(ポイント)とは

洋服のセールの広告の「50%オフ」、ニュースの「政党の支持率が10pt(ポイント)上昇」など…

普段の生活で何気なく「%(パーセント)」や「pt(ポイント)」といった単位を目にすることがあります。
「%」と「pt」はどちらも割合の増加や減少を表せる単位ですが、実はこの2つは使い方が違います。

皆さんは、その違いをご存じでしょうか。

分析業務でもこの2つの表現を使

もっとみる