見出し画像

日本語とかいう検索プログラムの怨敵

大変なのはわかる一方、調べたい結果を出してもほしい。

ツイッタータグ、混入事故を起こす

これ実は結構前から起こってたんだが、今日も状態が悪化して発生したらしい。具体的には、ニンジャスレイヤー公式ハッシュタグを検索するとなぜかタモリ氏が混ざるって形で。ひどすぎる。

ニンジャスレイヤー公式旧ハッシュタグは『njslyr』ってやつで、もちろんコレを検索したらコレがくっついたツイートだけが出てきていた。ちょっと前までは。※2021年10月21日時点では直ってます。このあとはわからんけど。

今これを書いている段階では一時的に治ってるんだが、# njslyrってハッシュタグ検索をかけるとなんか全然関係ないタモリ氏が混入したツイートが検索にひっかかって検索であって検索ではない残念な機能になりさがっていたらしい。以下のページによると8月22日には発生していたそうな。

このTwitterの残念な検索は流石に不具合ってことになったのか、今現在は検索結果については検索窓に打ち込んだ文字列に沿った内容になった。もちろん、ファジーな結果が返ってくるのは必ずしも悪いことではなくグッグルのやつが称賛されるみたいに超絶曖昧な表現でも探している目的のブツを用意してくれたりするならそれはありがたいことである。noteのは……まあもう少し頑張りましょうだ。ハッシュタグを検索かけて全然関係ないものがでるとまではいかないが、キーワード検索はファジー過ぎて目的のものが出ない。

しかしながら、人間側の目的を読み取って目的のものだけを出すっていうのは日本語においてはかなり難しい。単語だけ打ち込まれると前後の文脈を考慮するってのも多分出来ない。日常的なテキスト情報の内容を考慮した結果を出すとかも出来なくもないんだろうが、それも度がすぎると個人情報のホニャララになるし。

例えば、忍者とニンジャだと若干ニュアンスが違うし、忍者(現代の職業)と忍者(時代劇の職業)と忍者(ファンタジーの職業)と忍者(人名)では込められた語義がだいぶ変わってしまう。

特になんかヒットしちゃった擬人化コンテンツとかの汚染効果は凄まじく、大和とか武蔵も検索結果が美女だらけになったし曙とアケボノでもどっちも女の子が出てきかねない。日本人はクレイジーだ。

とまあ、ちょっと油断すると語義が明後日の方向に流動する日本語に対してまともな検索結果を提供し続けるってのはきっととんでもなく大変なんだが、まあだからといってハッシュタグ検索までファジーな結果になっちゃうのは仕様レベルでなんか間違えている気がしなくもない。よな。

戦場へ

ところで、インターネット大昔は言語検索かけたらキーワードとおりの結果が出てきた時期もあったんだが、今となってはウソみたいだよなぁ。思い通りの結果が出なさすぎて。

今回はここまで、またな。

現在は以下の作品を連載中!

弊アカウントゥーの投稿は毎日夜21時更新!
ロボットが出てきて戦うとか提供しているぞ!

#コラム #毎日Note #毎日投稿 #毎日更新 #エッセイ

ここから先は

0字

パルプスリンガー、遊行剣禅のパルプ小説個人誌です。 ほぼ一日一回、1200字程度の小説かコラムが届きます。 気分に寄っておやすみするので、…

ドネートは基本おれのせいかつに使われる。 生計以上のドネートはほかのパルプ・スリンガーにドネートされたり恵まれぬ人々に寄付したりする、つもりだ。 amazonのドネートまどぐちはこちらから。 https://bit.ly/2ULpdyL