【Python】fuzzywuzzy

fuzzywuzzyの説明が少なかったので、色々実験してみました。

まずはAnaconda Promptで fuzzywuzzyをインストール。

画像1

processモジュールのextract関数

引数

query:見つけたいもの

choices : イテラブルや辞書

limit :  the number of possible matches to return ranked from highest to lowest. 高い順に並んだ、返されるpossible matchesの数


タプルのリストを返す。the matching string, スコア,イテラブルのインデックス(辞書の場合はキー)


DataCampではlimit=2でしたが、ここでは全て出力しました。

画像2

スコアは全て86ですね。

画像3

choicesを少し変更。1つ目を"A vs B"にしてみましたが、スコアは変わりませんでした。

画像4

choicesの1つ目を"A"に変更したところ、さすがにスコアが下がりました。3つ目を'Houston Rockets vs Los Angeles Lakers'にするとスコアが100になりました。スコアが高い順に並んでいます。

画像5

ここでlimit=2にすると、スコアが高い順に2つ出力されます。

この記事が気に入ったらサポートをしてみませんか?