マルマウンテン

データサイエンティストをしております。 キャリア:商社で技術営業とシステム開発→化粧品…

マルマウンテン

データサイエンティストをしております。 キャリア:商社で技術営業とシステム開発→化粧品会社で研究職→製造業でデータサイエンティスト

最近の記事

データサイエンティストと人材育成(第一弾)

こんにちは 最近かなり暑くなってきましたね。 今回は、人材育成について記載いたします。 自分の後輩に対してデータサイエンスの育成を行うことがあります。 また、他部署の方にも分析ノウハウをレクチャーすることもあると思います。 今回はデータサイエンスの育成で何を何をするのかを記載いたいます。 データサイエンティストには3スキル(ビジネススキル、データエンジニアスキル、データサイエンススキル)が必要になっていきます。 そのスキル各々を築き上げていくために、どのようなことを学んでいく

    • データサイエンティストまでの道のり

      はじめにマルマウンテンです。 データサイエンティストとして本格的にジョブを始めるのに2回ほど転職しました。 本投稿では、その道のりについてや身につけた技術を記載します。 「へー、こんなキャリアもあるんだ。」と理解していただければ幸いです。 1社目でのキャリアプリセールスとして入社しました。 なぜプリセールスかというと、ビジネス力を身につけるためです。 あとは、浅く広く技術を学びたかったこともあります。 展示会へ赴き、さまざまな会社と交流をすることもでき楽しかったです。 その

      • 大津の2値化について

        業務で画像処理をよく行っており、大津の2値化について記載いたします。 まず画像処理で2値化を前処理で行い、その後に画像解析をすることが多いです。 その画像処理の2値化(白黒)を行うと、不要な情報を減らすことができるのと画像の容量を減らして解析のスピードを上げることができます。 ただし、2値化する際にどの画素値を閾値にして2値化するのかなど自分で判断することが大変なことも多いです。そこで、大津の2値化を行うことで閾値を自動的に算出して、その閾値を用いて2値化することができます

        • Pythonと多重検定法

          こんにちは 暑くなってきましたね。 今回は多重比較法で用いる補正アルゴリズムについて説明します。 多重比較法は統計的仮説検定のP値を補正する際に用いるアルゴリズムです。 昨今では、デジタルマーケティングのA/Bテストなどでも使用されています。 多重比較法はさまざまな算出方法がありますが、今回はBonferroni法とHolm法について記載します。 Bonferroni法 Bonferroni法は、多重比較法の中でも最もシンプルで直感的な方法です。以下のように有意水準${

        データサイエンティストと人材育成(第一弾)

          データサイエンティストとドメイン知識

          今回はデータサイエンティストとしてドメイン知識を学ぶことや、学んだ後にどのように自分の業務に利活用するのか記載します。 ドメイン知識について ドメイン知識は自分が所属している業界や部署の知識や知見、トレンドなどの情報です。 例えば製造業だと、製品の物性や素材、設備に使用する機器などです。 そのドメイン知識を深める必要性や方法について記載いたします。 必要性について ドメイン知識はデータサイエンティストではなくても必要な知識です。 自社製品の研修や実技演習を行うこともあ

          データサイエンティストとドメイン知識

          データサイエンティストとリモートワーク

          こんにちは マルマウンテンです。 今回はリモートワークについて記載します。 リモートワークと出社の両立などを含め記載します。 リモートワーク 頻度はだいたい週に3回ほどリモートワークしています。 リモートワークで行う業務はプログラミング、データ解析、資料作成やWeb会議での打ち合わせです。 昨今は出社率を増やす割合が多くなっており、エンジニアも出社する割合が高くなっているとおもいます。 データサイエンティストのリモートワークについて記載します。 リモートワークで良かった

          データサイエンティストとリモートワーク

          今年の目標

          データサイエンティストとしての今年の目標を決意表明します。 1ヶ月経っているのですが、改めて今年の目標を考えて記載します。 ビジネススキル 簿記の資格を取得して管理職の会議にてプレゼンを行う なぜ簿記の資格を?って思われる方もいると思います。 データサイエンティストはIT戦略などにも関わっていくことが多いです。 それは、予測モデルをデジタルとして利活用していく際にIT戦略の会議に出ることもあるからです。 例えば、データ取得のデータベースの環境についてや、データ蓄積した場合の

          データサイエンティストと英語

          おはようございます。 急に寒くなってきましたね。 体調に気をつけながらデータサイエンスを行っていきたいです。 さて、今回はデータサイエンティストの私が英語を使用する業務や勉強法について記載します。 英語を使用する業務私自身が英語を用いて業務を行うことは下記のパターンが多いです。 1. 海外のデータ分析会社との打ち合わせ 2. 論文を読む 3. OSSのドキュメントを読む では、1つずつ説明していきます。 1. 海外のデータ分析会社との打ち合わせ Web会議で行っています

          データサイエンティストと英語

          データサイエンティストがデータベースの役割も行う

          こんばんは。 最近急に冷えてきましたね。 急な気温差に気をつけていきましょう。 さて、今回は最近私がデータサイエンティストの他にデータベースのような役割も行なっていることがあるため、その内容を投稿します。 とある日からのデータベース機能管理職より、 マルマウンテン、2ヶ月前の試験内容の条件と試験結果を資料に載せたいから教えて。 A.この条件と試験結果を表と箱ひげ図にしてまとめました。結果から推測される推移の計算式はこのように算出されます。 試験計画の主任より、 マルマウン

          データサイエンティストがデータベースの役割も行う

          データサイエンティストとドメイン知識習得

          こんばんは 今日もドメイン知識を吸収したマルマウンテンです。 データサイエンティストにとって必要不可欠なドメイン知識についてです。 自社サービスや自社製品について理解を深めなければいけません。 ドメインの理解を深めるために行なったことを記載します。 専門書を読む セミナー及び展示会へ行く 他部門の発表や過去の資料を徹底的に確認する 1. 専門書を読む専門書を読むことはデータサイエンティスト以外の方も多くされていると思います。 データサイエンティストの自分は今までに

          データサイエンティストとドメイン知識習得

          データサイエンティストとマーケティング

          今回はマーケティングについてです。 マーケティング活動においてデータサイエンティストの関わりもあります。 昨今ではモノ売りだけでなくコト売りも必要になっており様々な方法でデータを収集することもあります。顧客ニーズを理解して、売れるようなサービスやモノを築き上げなければいけないです。 そこで、顧客ニーズを理解するために、私のようなデータサイエンティストを登用するケースがあります。まずは、市場について情報収集するためのデータ基盤を作成します。 ポップアップの表示の仕方などでA

          データサイエンティストとマーケティング

          データサイエンティストとしてより一層大事にしようと感じた配慮

          ある日、チームメンバーから言われたことがあります。 「マルマウンテンさん、データ解析の結果をフィードバックするとき、かなり妥協して我々に依頼してますよね。だいぶ気を使っているような雰囲気ですが、お願いされたらやりますよ!」 この指摘に私にとってかなり盲点でした。 実際に、同僚の業務内容は非常に大変でお願いしにくい状況でした。 それでも、私のデータ分析の解析結果を信頼してくれたからこその発言だったと思います。 遠慮は控えるべきだなと感じたと同時に、配慮をより一層していこうと痛

          データサイエンティストとしてより一層大事にしようと感じた配慮

          現役データサイエンティストの業務(データサイエンス力編)

          こんにちは 今回はデータサイエンス力を用いた業務内容を記します。 データサイエンス力といえば、統計学や機械学習を駆使するイメージを持たれている方も多いと思います。 実際にどのような業務を担っているのか見ていきましょう。 統計学昨今ではビッグデータを解析することも多いですが、少数のデータの解析をすることもあります。ビッグデータやスモールデータどちらも、データに関して探索することも必要です。その際には統計学を活用していきます。まずは、データの特徴量ごとに基本統計量を算出します

          現役データサイエンティストの業務(データサイエンス力編)

          他チームと連携したデータサイエンティストの業務(データエンジニアリング力編)

          今回は、データエンジニア力を用いた他チームと連携した業務内容です。 データ収集するためのAPI構成やデータベース構築など幅広いチームと連携をする必要があります。自分でPoCを作成することもありますが、本番環境での実装はベンダーや開発チーム、インフラチームと協力して基本設計などをしていきます。下記のチームと連携することもあります。 フロントエンドチーム バックエンドチーム インフラチーム 組み込みエンジニアチーム 各チームでどのような連携を行うのか見ていきましょう。

          他チームと連携したデータサイエンティストの業務(データエンジニアリング力編)

          データサイエンティストの業務(ビジネス力編)

          こんにちは マルマウンテンです。 本投稿では、データサイエンティストをしている私のビジネス力を用いた業務の流れを記載します。 また、私のビジネス力を用いた業務の流れはデータサイエンティストの業務の一例なため、参考程度にしていただければと思います。 業務での割合ビジネス力:4割 データエンジニアリング力:3割 データサイエンス力:3割 ビジネス力での業務1. 分析結果のレポート作成 解析した結果をレポートにまとめて上層部へ提出します。私の場合は直属の上司も確認しますが

          データサイエンティストの業務(ビジネス力編)

          現役データサイエンティストの勉強内容

          はじめに初めまして。マルマウンテンです。 製造業にてデータサイエンティストを行なっております。 データサイエンティストといえば、ビジネス力、データサイエンス力、エンジニア力の3本柱の能力が必要とされています。 そこで、私が日々上記の3本柱の勉強内容について記します。 日々の勉強についてビジネス力  ビジネス力に関しては、業界動向や利益などの数字に強くなることです。個人的にオススメしているのは2つあります1つ目は日商簿記を勉強することです。自分たちが普段行っている経費処理な

          現役データサイエンティストの勉強内容