マガジンのカバー画像

ド文系がデータサイエンティストになれるのか

14
エンジニア経験0のド文系が果たしてデータサイエンティストになれるのか、挑戦の模様を書いていきます。また、勉強のTipsがあればそれについても書いていきます。
運営しているクリエイター

2018年11月の記事一覧

AIで橋下徹さんのメルマガを解析してみた

AIで橋下徹さんのメルマガを解析してみた

技術書店で『はじめての自然言語解析』という本を出版しました。

自然言語解析とは、この僕らが普段使っている言語を数値に落として解析をすることです!なんだそれ?と思うかもしれませんが、様々なサービスで活用されています。

例えば、Googleの検索システムだったり、Gunosyのユーザーへのウェブ記事個別化配信であったり、スマートニュースのウェブ記事の芸能やビジネスなどのタブ分類であったり。

そん

もっとみる
新しいパブリックリレーションの形

新しいパブリックリレーションの形

前回の大統領選でFacebookのビッグデータを不正入手して、トランプ大統領を生むことに貢献したケンブリッジアナリティカ社(以下CA社)の内部告発についてまとめた記事です。

CA社は、ビッグデータを活用して人種差別主義を基盤としたムーブメントを起こそうとした事が明らかになりました。

もともと、民衆を動かす上でのPR(パブリックリレーション)は、新聞・テレビなどのマスメディアをいかに動かすか、が

もっとみる
あと5〜10年で弁護士の仕事は自動化されるよ

あと5〜10年で弁護士の仕事は自動化されるよ

弁護士事務所の秘密保持契約書や業務委託契約書の自動化の仕事をしております。

弁護士さんが条文ごとにリスク判定をして、それをAIに学習させて同じような判定を出来るように調整する仕事です。

この仕事をしているから分かりますが、あと5〜10年で弁護士の仕事は自動化されることは間違いないと思います。

ただ自動化されることと、弁護士さんの仕事がなくなることはイコールではないと思います。

AIの精度が

もっとみる
予測モデルが改善しない日々は暗いトンネルを走っているよう

予測モデルが改善しない日々は暗いトンネルを走っているよう

ある案件で予測モデルの性能改善を様々なパターン試しているのですが精度が向上しません。

こんな時、暗いトンネルの中を走っているような苦しさがあります。

予測モデル作成までの工程は、
①データ収集
②予測したい数値(目的変数)に影響を与えている要素を洗い出すための基礎集計
③洗い出した要素を特徴量としたデータセットを作成
④アルゴリズムを選択して適用

という順番で行われます。予測モデルの性能を改

もっとみる