種牡馬クラスタリング再び・・ファクターを6つに増やして

6つのファクターで種牡馬をグループ分けするのが今回の目的。

種牡馬の個性を明らかにしたい欲求から、勝ち星をあげているコースの特徴からデータ整理したのが以下2つの記事でした。

またそれ以前には芝の勝利シェアと平均勝利距離の2要素から種牡馬を グループ分けしていました。

視覚的に種牡馬のイメージがつかめることを紹介しました。

6つのファクターで種牡馬をグループ分け

今回はそれらを総合し、6つ

もっとみる

【競馬】種牡馬を機械的にグループ分けする方法 ~K-means法クラスタりんぐ~

種牡馬のグループ分け

種牡馬を競馬予想のファクターとして重要視している方も多いでしょう。
私自身、血統を軸に競馬を見ているので、やはり予想の際には種牡馬をまず見ます。

当然、まずは1頭ずつの種牡馬の理解が重要にはなりますが、今年の2才世代だけを見ても、種牡馬は321頭ものバラエティがあり個別の理解では追い付かないのも事実。

そこでTargetを普段利用されている方には馴染みがあると思いますが

もっとみる

【AI】芸能人Twitterユーザーのクラスター分析(ユーザー属性による分類)

学べること

このノートでは、Twitter API を利用して、ローラさん、有吉弘行さん、ダウンタウン松本さんなどの芸能人のツイート情報を取得し、ツイートのテキストをクラスタリングすることで、ユーザーをいくつかの種類に分類(グルーピング)する方法を学ぶことができます。

・Twitter API の基本的な使い方
・MeCab を使ったツイート(文章)の形態素解析の仕方
・TF-IDF を使った

もっとみる

#088【統計】「クラスタリング」とは何か。使いどころを考える。

さて、今回から最近学んでいる知識をゆるっと整理していきたいと思います。特に社会人になってからの勉強は

“で、それ、現業のどんな時に使えるの?“

 という問いに答えられないと価値を生まない気がするので、これを留意してまとめたいと思います。

今回は「クラスタリング」の考え方についてまとめます。

▼クラスタリングとは何か

まず、google先生に聞いてみるとこんな結果が返ってきます。

”教師

もっとみる
スキありがとうございます!!🙇‍♂️
6

データサイエンティストの頭の中vol.14~機械学習(教師なし学習)のクラスタリングについて~

今回は機械学習の中の教師なし学習の一つクラスタリングについてインタビューしました。「クラスタリングってそもそも何?」「何のために使うの?」「どうやって使うの?」的な疑問に答えもらいました!!
難しい機械学習をより簡単に伝えることを心掛けました!

初学者でもわかるようにインタビューで話しましたので、是非動画もチェックしてみてください!!より詳しく話しています!

1 クラスタリングとは何か

「教

もっとみる
ありがとうございます!もっと知りたい事等あればコメントください!

とりあえずクラスタリングしたくなった時に試すコード

よくわからないデータを見ると何も考えずクラスタリングして特徴を読み取ろうとする思考停止人間です。

せっかくなら手も動かしたくないのでコピペコード作ってみました。

内容

k-means法を使用し、非階層クラスタリングを実施

クラスター数はエルボー法を使用して、何となくよさそうな数を決定

クラスタリングの性能評価関数の一つ、SSE(クラスタ内誤差平方和)値を「Distortion」として表示

もっとみる

クラスタリング(k-means法)のアルゴリズム入門

1. はじめに

 クラスタリングのアルゴリズムを理解しようと思い、本やネットで調べても数式と文章だけで書かれていて難しい。やっぱり具体例がないと分かりにくい。
 なので、数学が苦手な方でもアルゴリズムが分かるように書いていきます。クラスタリングの評価関数、使用用途を知りたい人はネットや論文に山ほどあるのでそちらを推奨します。

クラスタリングはデータを似た性質同士のグループに分類する手法で、機械

もっとみる

「プログラミング」も資産運用もしたことないわたしがAIで株価を予測するー9ー 改善しました!

こんにちは。「プログラミング」も資産運用もしたことないわたしがAIで株価を予測するの第9弾です。

さて、前回、1日後の予測結果を実際に動かしてみて、記事数が増えると、単語数が変化するので精度が下がるという問題点に直面しました。

そもそも、Fingerprintというのは、固定長でないと取り扱いが非常に難しいですが、今のやり方だと、Fingerprintの長さが変化していってしまうという難点がず

もっとみる

括りたがる人たち。

十人十色と十把一絡げ。

多種多様、かつ大量のモノ・コト・ヒトを処理する分析手段として「分類」がある。日々の生活様式や趣味・嗜好、学術・学問、業種・職種、星座・血液型に至るまで、あらゆる物事は多彩な「ジャンル」に分類され、それぞれの特色や傾向などを十把一絡げに語られたりもする。

個人的には、科学的・統計的分析アプローチとしての分類に異論があるわけではない。リサーチャーとして諸学問に対するリスペク

もっとみる
本日の運勢…【大吉】慢心は禁物 だそうです!
15