食品のコサイン類似度

回復期リハビリテーションを担当していると嚥下機能とともに栄養管理の重要性を感じます。そのため栄養学の本も読むようにしています。
文部科学省が日本食品標準成分表2020年版(八訂)のデータを公開しています。沢山の食品について含まれている様々な栄養素の一覧表になっています。栄養士さんたちはこういったデータを参考にカロリーや栄養バランスを計算するのかな?と思いながら眺めています。
何か別な視点でデータを見れないかと考えました。
最近流行りのAIについて勉強してみると、一言でAIといっても実に多くの技術が使われていることがわかりました。その中の一つにコサイン類似度というものがあります。これは言葉等をベクトルにしてそのベクトルデータから類似度を調べるもので、ベクトルの内積からコサインを求め、その値が1に近ければ(2つのベクトルのなす角度が0°に近ければ)正の相関が強く、-1に近ければ(2つのベクトルのなす角度が180°に近ければ)負の相関が強く、コサインの値が0のときは無相関となります。
今回、日本食品標準成分表のデータを使っていくつかの食品を栄養素のベクトルにしてコサイン類似度を計算してみました。

クロワッサンとうどんは小麦粉つながりで近いことは納得でした。驚いたのは、バナナとポテトチップスが類似度が高いという結果でした。食品栄養素の類似度的にもバナナは遠足のおやつに入れるべきと考えられます。

この記事が気に入ったらサポートをしてみませんか?