インドネシアVtuverの単語出現頻度を調べたい

Halo selamat malam semuanya.Akhir-akhir saya mencari metode textmining untuk bahasa Indonesia.Tetapi…

インドネシア語対応のテキストマイニング探したんですけど、見つからなくて。ひとまず以下のサイトで頻度だけ調べてみました。
https://textmining.userlocal.jp/

一人称や前置詞を除くと以下の単語が多かったです。ざっくりと上から多かった順です。

gitu
tuh=itu
kan
kayak のようだ=seperti?
juga も、また
jadi 故に
banget 非常に
terus それでね、そしてね
sih,mah
enggak,ngga,ga tidak
udah=sudah
nih
bakalan ~すると予想される(例文Dia bakal menjadi dokter.)
kalo=kalau もしならば
kalian あなたたち
emang 当然、確かに エマン
nah 話のテンポ、つなぎ
pake=pakai パケ
aja=saja ただ~だ。の使い方が多い
loh
misalnya 例えば
aduh
waduh 感嘆詞、驚愕警戒

4人、計8動画の配信を調べてみたが大体似た結果でした。意外だったのがkayakとbakalanですね。全員で上位でしたが、参考書にはなかったような。

人によって以下の単語は高頻出でした。
anjir,anjay ヤバい
astaga まじかよ
keren クレン イケてる、クール
absen 出欠確認?

品詞ごとにもうちょっとちゃんとした分析ができればいいのですが。もし知ってる方いたら教えてください。

Sampai jumpa lagi.Jaga kesehatan baik-baik.



この記事が気に入ったらサポートをしてみませんか?