マガジンのカバー画像

データサイエンス入門

30
数学者の私が、日経新聞の記事から考えられる、データサイエンスの重要性や、簡単な取り組み方について説明します。実は、データサイエンスは、探索的な手法で、高度な統計は、あまり必要とし… もっと読む
運営しているクリエイター

記事一覧

AI時代は、データサイエンス・ブーム以上に、社内データの整備が、企業の生命線

日々、生成AIの記事が登場し、しっかり「AI時代」に私達の進化というか、「ミーハー度」は高い。およそ1年前には、「ChatGPTは何?」とか、「国会答弁をChatGPTで」などという会話が発生していた。 それが、今は、企業での生成AI活用も、実用の領域に入り、新入社員の採用にAIを活用したり、新製品の開発にAIを活用したりしている。 もうしっかり、私たちはAIを使うか、使わないか、ではなくて、AIをどのように使えば、有効かを考え、実行する時代に入ったのだろう。 AIは

不足しているのは、「データサイエンティスト」よりも、「データを使った論理的な議論」では?

日本の企業は人手不足らしい 日本は、景気が良くなってきたのか、さまざまなデータで、好景気に近いデータを目にすることが増えた。 例えば、日本の企業は、大企業を中心に、賃上げも進んだ。そして好景気と、デジタルトランスフォーメーション(DX)や、デジタル化を進めるために、企業の人材確保熱が高くなっている。  この社長100人アンケートでも、 と人手不足を訴える経営者が多い。そして、 データサイエンティストの不足が、多くの経営者の課題のようである。 そこで、質問です。「あな

ビジネスパーソンも「文理融合」の視点を持ちたいですね。

久しぶりに「文理融合」という言葉に触れたかも 以下の、池上彰さんの講演の記事に、「文理融合」という言葉が登場します。私にとっては、とても懐かしい言葉でもあり、今も頭の片隅に置いてある言葉です。 記事の中に とあります。このことは、今の時代のビジネスのシーンにも当てはまるのではないでしょうか。ビジネスでも、AIの活用も必須ですし、当然世の中の変化に合わせることは重要です。  このことは、私がビジネスの場面で行う「データサイエンス」では、実行していることです。多くのデータサ

スポーツのデータ活用は、ビジネスのデータサイエンスの取り組みのヒントだ!

セイバーメトリクスは、野球の標準「データサイエンス」 先週、今週と、日本プロ野球界は、ロッテの佐々木朗希選手のピッチングの話題が熱いですね。完全試合、奪三振数、連続無得点など、佐々木朗希選手のピッチングは、記録のパレードになっています。  このように、スポーツは、数字、つまりデータとの関係が強いです。野球のピッチングでも、球速、投球数、奪三振数など、さまざまなデータが登場します。そして、そのデータの多くは、私たちにも公開されています。  この野球の試合に関するデータを活用

サイエンスにも「コミュニケーション力」が必要

桝太一さんの退職で有名になった「サイエンス・コミュニケーション」 皆さんは、「サイエンス・コミュニケーション」という言葉をご存知でしょうか?文字通り、「科学」を「伝え・対話」する仕事です。  最近、日本テレビのアナウンサーだった、桝太一さんの退社の記事で、「サイエンス・コミュニケーション」という言葉が登場し、そこで初めて触れた方も多いのではないでしょうか?  この様に、既知のように説明している私も、そんなにこの言葉との付き合いは長くありません。大学・大学院で数学を学び、その

日曜データサイエンティストのススメ(covid-19のデータ分析)

データサインエンスは誰でも行える時代以前、このnoteに、 という寄稿をしました。その中で、紹介した「R」ですが、どれくらいの人が興味を持ってくれただろうか?このRとは、多くのデータサイエンティストが使っている統計ソフトで、なんと無料だ。 日経新聞のデジタル版には、 という、データサイエンティストが参考になる、「データ・ジャーナリズム」のコーナーがあるが、これに似たことは、誰でも行える。  以前は、データを持っている人が、この世の中の勝者に近づくことが多かった。しか

プログラマーではない社会人に、統計ソフトの教育を行ってみた!

毎日のようにデータ、データサイエンスの記事が溢れる この1年間、COVID-19、コロナ感染症の影響で、私たちは毎日の報道で、データを見る。これほど、データやデータを視覚化したグラフを見た1年間はないだろう。  そして、データをこのように視覚化して「観察」した方が、様々なことを考えることも経験した。今も、いくつかの報道番組では、データを表で見せているが、実際には数値だけの「表」より、形のある「グラフ」にした方が、増加・減少やその角度が、直感的にわかりやすい。そのなことを、経

レインボーブリッジに学ぶ、データの見える化

新型コロナウイルスに関する緊急事態宣言が全国で解除  私たち、日本人は本当に頑張ったのかもしれない。新型コロナウイルスに対しての、1回戦目はそう思える。これからは、攻守交替して、私たちが第2波のための準備を万端にして、次の戦いを、なるべく私たちのペースで、私たちがイニシアティブをとって戦う順番である。  この緊急事態宣言中、つまり1回戦目の間中、私たちはいつ、宣言が解除されるかやきもきした。毎日のように報道で、患者の絶対数や、10万人あたりの患者の割合など、さまざまなデータ

泳げデータの世紀:データの取り扱いと利活用

クッキー協奏曲のようになっているが あ、クッキーといっても、お菓子のクッキーではない。Cookie(クッキー)という、Webサイトを閲覧したときに、それがわかるようにする仕組みと、そのデータのことである。インターネットの初期では、コンピューター・プログラマーは、少し余裕があり、このクッキーもセサミストリートのクッキーモンスターに関係があり、このCookieという名前になったという説がある。  このクッキーは、現在は日本の法律では、個人情報に該当しないが、クッキーが将来使えな

泳げデータの世紀:Covid 19の患者数の分析を行う

 各企業や学校では、患者の推移を見ながら、通常勤務を戻すのを「いつ」にするのか、登校再開を「いつ」にするのか、頭を悩ませていることだろう。他の企業の動向や、政府の発表を頼りにしていることだと思う。しかし、独自に判定したい方もいるだろう。その一つの方法として、公開されているデータを活用して、現在の患者数の増減を、もう少し数学的に理解する方法を説明しようと思う。 微分を離散データにも使おう そのためには、高校の数学で習う、微分を活用する。まず、以下の式を考えたい。  この式を

泳げデータの世紀:データを見て、判断する練習していますか?

このスポーツの事例、企業に置き換えてみると この「データ世紀」の記事は、とても面白い。米大リーグの選手の契約に、データが活用されているという事例である。しかも、 「ベテラン1人より、若手数人に投資する方が合理的という経営が広がっている」 という話は、とても興味深い。  ところで、このような他の組織、他人のデータ活用の事例は、とても興味を持って読めるのだが、これを自分の組織や、自分のことに置き換えたら、大きく話は異なるのかもしれない。  会社の従業員の働き方が、すべてデ

泳げデータの世紀:もっと、基本的なことを、恐れずに議論しよう!

データの世紀では、データは石油。でも、その石油は誰のもの? データの世紀になり、多くの企業は、その石油の発見に余念がない。その一つの方法に、企業のM&Aも一つの方法だろう。 このM&Aで、ヤフーとLINEの顧客データは一つになり、確かに個人データや、周辺のデータは増える。データの増加を活用して、ビジネスの成長を考えるのは、経営者にとっては当然考える戦略だろう。  ところで、M&Aを行った場合、その個人情報は、そのままM&A先に引っ越されるのだろうか?データの中でも、個人情

泳げデータの世紀:「私の情報の管理?」

日経新聞の #データの世紀 に関する、企画で、「あなたは自分の個人情報をどう管理したいですか?」という質問が出ています。皆さんは、どう考えますか? うーん、助けて専門家! この質問に対しては、事前に答えが3つ用意されています。 ① 誰に、どんな情報を渡すかを、自分で全部確かめて管理したい ② 情報銀行など、自分が信頼する専門家に自分の情報の管理を任せたい ③ 直接プライバシーに関わるようなコアな情報以外は、特に管理しなくてもいい 私の答えは、② 情報銀行など、自分が信頼

スポーツのデータ活用は、企業のデータ活用の学びの場である。

スポーツでも、データ活用は盛ん ようやく、「データの世紀」で、スポーツにおける、データ活用の話題が出てきた。私が、数学者であり、実は以前からこのテーマには興味があり、さまざまな書籍を読みこんだ。  近年、スポーツでは、データの活用が盛んである。理由は、スポーツの世界では、データが一般に公開されることが、企業活動よりも多く、誰でも分析しやすいこと。そして、企業活動よりも、大胆に、モデルが作れることがあるだろう。 スポーツ関連のデータ分析を紹介しよう。 そして、その結果、多く