マガジンのカバー画像

#機械学習 #データサイエンティスト 記事まとめ

102
機械学習やデータサイエンティスト関連の記事を収集してまとめるマガジンです。
運営しているクリエイター

#データ分析

データサイエンティストがSlackの草スタンプから企業カルチャーを紐解いた結果www

atama plusという教育スタートアップでデータまわりのお仕事をしている内藤と申します。毎日膨大なデータの海の中で素敵なサムシングを良しなに何かできないかを企んでおります。今回、atama plusにおけるデータのお仕事ってどんな感じで自由にやっているのかの一事例を紹介しようかと思います。(※とは言いながら仕事ではなくほぼ趣味の分析です) 背景と課題さてさて。 近年様々な企業がミッション・ビジョン・バリューというのを打ち出していますね。atama plusも「ミッション

メルカリにおけるA/Bテスト標準化への取り組み

こんにちは、Analytics Infra チームの @yaginuuun です。主にA/Bテスト周りの改善や Recommendation 関連の分析を担当しています。 当ブログは 2021/07/28 に開催された Retty ✕ Mercari Analyst Talk Night! におけるLT内容を改めて少し補足を加えながらブログの形に書き起こしたものです。 当日の資料はこちらです。 A/Bテストとは A/Bテストは Randomized Controlled

事業やプロダクト開発を加速させるデータ分析

ここ数年、様々な業界でデータサイエンティストの求人を目にします。一口にデータサイエンティストと言っても内容は様々で、画像解析やレコメンド開発など機械学習エンジニア系のものもあれば、ビジネスの意思決定を支援するようなデータアナリスト系のものもあります。(データサイエンティストの分類についてはTJOさんの記事が参考になります) この記事では、ビジネスの意思決定を支援するデータ分析に絞って、事業やプロダクト開発を加速させるのに必要なことについて、自分の思考の整理を兼ねて書きたいと

【第2章因果関係】練習問題2.8.3「自然実験としての指導者暗殺の成功」

1.データセット・元論文の紹介(1)データセット  ・第2章の練習問題に取り組む際に必要になるデータセットは、第1章の練習問題と同様に以下のリンク先からダウンロードできる。 (2)元論文  ・本練習問題の作成に際して参考とした論文が脚注で紹介されている。参考のためリンクを貼っておく。 2.練習問題2.8.3「自然実験としての指導者暗殺の成功」 (1)データセットの概要把握   ①観察数250、変数11のデータ。データは250の暗殺計画を記録している   ②1度でも指導者暗

非IT企業でAI開発プロジェクトを始めたら。 ~機械学習をどう学んだか編~

本記事は機械学習をどう学んだか by 日経 xTECH ビジネスAI② Advent Calendar 2019 、12/14の記事です。 ◇ 突然上司に呼び出され、隣のチームへの異動を告げられて。 別のチームといえどほぼ同じような仕事をするんだろうと思ったら、 内容は、"AI開発"でした。 その時点でプログラミングの経験はほぼなく、理系卒ではあるもののITの知識はふつうよりちょっと疎いくらい。 それでもちょっとおもしろそうだなと思ってやってみたら、ほんとにおもしろ

【今週のAI記事厳選!】 AI界隈注目記事まとめ #15 (8/12~8/22) | AI Academy News

最新の研究でわかったこと。匿名データは実は簡単に暴けちゃう 47%のプロジェクトがPoC(実証実験)に至らない。AI活用の課題は「課題がわからない」こと。−AIに関する調査結果が公開 22歳で1億ドル集める強者現る。AIの「目」を鍛えるScale AI 「すごすぎる」――地方のパン屋が“AIレジ”で超絶進化 足かけ10年、たった20人の開発会社の苦労の物語 (1/5) GANの三つ巴バージョン!? データ増強をするためのGANモデルGAMO NTTデータ、AIを活用した渋滞予

2021年データサイエンスにオススメの本80冊!

ビッグデータの発展とともに、データサイエンスは今広く知られるようになりました。大学にデータサイエンスを学べる学部ができたり、データサイエンティストを目指している人もたくさんいるでしょう。この記事では、統計学から機械学習やマーケティングまで、初心者がデータサイエンスを学ぶのにおすすめの本を80冊紹介します! Part I: データサイエンス概論1.『データサイエンス講義 』Rachel Schutt、Cathy O'Neil 著 本書では、データサイエンスを行う上で、どのよ

第13回 予測モデルとAIの使い分け

シティズンデータサイエンスラボは「データサイエンスを全ての人に」を掲げる株式会社データビークル(https://www.dtvcl.com/)が運営する公式noteです。 正確な予測が価値を生むときまずリサーチデザインを応用して、予測モデルやAI開発の課題設定について考えてみましょう。予測モデルとは統計手法や機械学習手法を使って「とにかく正確に何かの値を予測してその結果を出力するもの」と述べました。一方AIについては「予測に基づき、最適な選択肢を提示する」ものと述べました。

「パッションを持って取り組んだら理解者が現れた」日本経済新聞 山内秀樹氏×西内啓対談 Vol.2

西内啓の対談シリーズ。日本経済新聞社の山内秀樹さんの第2回目です。パッションを持って取り組んだからこそ社内でデータ活用が認知されたという話から、データサイエンティストの育成・内製化の必要性まで、会話が広がります。 シティズンデータサイエンスラボは「データサイエンスを全ての人に」を掲げる株式会社データビークル(https://www.dtvcl.com/)が運営する公式noteです。 パッションを持って取り組んだら理解者が現れた西内 解約を防止するために読者にメールを送信す

指名検索が多い映画は興行収入も多い説(映画編)

【更新情報2024年5月26日】「その決定に根拠はありますか?」 確率思考でビジネスの成果を確実化するエビデンス・ベースド・マーケティング 戦略を導く為の「エビデンスの作り方」をテーマに、これまで体系化してきたノウハウを紹介したマーケティング・インテリジェンスの書籍を出版致しました。5問の調査でTVCM(施策)→コンビニで商品を見た(要因)→売上がいくら増えたか?→年間16.67億円(効果)の様に経路ごとに構造的に効果を把握する国際特許(PCT)を出願した分析法

データ戦略の会社が考える「データ分析・AIのビジネス導入に必要な4つのポジション」

分業チームの必要性AI.Accelerator座長の進藤さんのツイッターで以下のような内容がありました。 私の認識でも、データ分析・AI導入は、今の時点(2019年4月時点)では多くの企業に取って「チーム戦」を取らざるを得ないと考えています。それも、「社内の人間・社外の人間を含めたワンチーム」によるチーム戦です。 サッカーをするならゴールキーパー、ディフェンダー、ミッドフィルダー、フォワードが必要なように、自社にいる人材で賄えるならよいし、そうでないなら社外のチームと協力

フットボール統計学 クラスタリングを使用してビルドアップのパターンを識別する

GUEST BLOG: Identifying patterns in build-up play using clustering | OptaPro 03.04.19 Article by Kuba MichalczykKuba Michalczyk氏は2019年OptaPro Analytics Forumでポスター発表を行い、2017/18シーズン中のプレミアリーグの各チームのビルドアップを視覚化するためにクラスタリング手法を適用した。 このゲストブログで彼は発表の背

¥100

第7回 アウトカムを設定するコツ(1)

シティズンデータサイエンスラボは「データサイエンスを全ての人に」を掲げる株式会社データビークル(https://www.dtvcl.com/)が運営する公式noteです。 よいアウトカムとは何か アウトカムと解析単位という2点が適切に定まれば、「どこから手をつけていいかわからない」という問題も、「出てきた結果がナンセンス」という問題も回避することができます。これがデータを使って「よいリサーチクエスチョンを考えることができた」という状態です。 とはいえ、慣れないうちはそれが

第5回 継続的なデータ活用プロセスにおけるデータ整備の位置づけ

シティズンデータサイエンスラボは「データサイエンスを全ての人に」を掲げる株式会社データビークル(https://www.dtvcl.com/)が運営する公式noteです。 データ整備のサグラダファミリアここまで「業務のためのデータ」をどう「活用のためのデータ」に加工するかを詳しく説明してきました。複数の表を結合するためのキーを確認し、それぞれの表の中に含まれる対象のデータを確認し、最終的にどのような切り口で1行ずつにまとめるのかを決めて、それぞれの項目を数値化したり分類した