Python日記vol.23🐍お茶の香りを主成分分析してみる(パロディ🍵)
こんにちは。aliceです。
気づいたら今年も立春が過ぎていました🌺
まだまだ寒くて実感がないので、春が待ち遠しいです🌼
今日は、お茶の香りを主成分分析してみたという話です。
ふと、こちらの記事を見かけて、読んでみておもしろいなー、やってみたいなーと思ったのでやってみました。
といいつつ、主成分分析をちゃんと理解していないのでパロディです。
やってみたら楽しかったのでnoteに書いてみました。
目的
今回の目的はこちら。
私のお茶を選ぶ基準はカフェインが入っているか・いないかが80%なのです😅なので、もっといい感じに飲みたいお茶を選べるようになったら楽しいなぁと思います。
適当にデータを作る
今回はサンプルデータをCopilot(Bing Chat)に作ってもらいました。
なかなか、すごいですね。
お茶の選定
まずはサンプルデータを作ります。
Copilotちゃんがいい感じに20種類のお茶をあげてくれました。
なかなかセンスが良いです🍵
香りの細分化
お茶の香りについて特徴量を10個あげてもらいました。
私には思いつかない特徴です🍵
香りの評価
そして、それぞれのお茶についての評価もしてくれました。
なんかいい感じですね🍵
主成分分析をしてみる
さて、評価も出たところでいよいよ主成分分析をしてみます。
要約統計量をみてみる
データをpandasのデータフレームに取り込んだのでdescribeメソッドで見て見ます。
お茶って一般的に清涼感があるものなんですね。
今回は渋みや苦みのあるお茶より、甘みのあるお茶が多かったのかな?
私は甘みを感じられる緑茶が好きなので、お茶の甘みを出せたときは、ふぁぁぁとなります🍵
せっかくなので相関でも見てみますか。
草木の香り、渋み、苦み、コクに相関がありそうですね。
草木の香りって…。
標準化してみる
今回は必要ないけど、標準化してみました。
主成分分析
いよいよ、主成分分析をします。
まずは、寄与率を出してみます。
PC3までで76%でした。
主成分負荷量はこんな感じです。
結果を読んでみる
お待ちかねの結果が出たのでみてみます。
PC1:すっきり感を味わえそうなグループ🍵
チーム、すっきりのみなさんです。
ハーブティーが多いですね。
花や果物の香りで選んでみるのも楽しそうです🌺
PC2:焙煎度が高めなグループ🍵
チーム、焙煎度高めなみなさんです。
いや、レモングラスティーとかさっぱりしてそう。
たまにどうしてもほうじ茶が飲みたくなるときがあります。
PC3:クセがありそうなグループ🍵
チーム、クセのありそうなみなさんです。
なぜ、チーム名がクセありかというと、私があまり好きではないからです。
プーアル茶、ロイヤルミルクティー、ローズヒップティーは自分で買わないなぁ。
せっかくなので散布図にしてみました(微妙)
クセのあるお茶が好きだと思っていたんだけど、花系のクセは苦手というのがわかりました。ハーブティーは好みがわかれますよね。
あとは、お番茶とかマテ茶も入れてみたい。(焙煎度高めグループに入りそうだけど。)
PC1とPC2のグループ+緑茶のお茶のストックがあれば、だいぶ幸せを感じられるなぁ。
お茶を買うときに調べて買ったら好きなタイプのお茶に会えそうですね。
そんなこともできるのかな?
というnoteを白湯を飲みながら書いてみました。
おしまい。