見出し画像

写真検索の奥深さに震えたときの話

キャリアの中であるテーマにのめり込んだ経験って皆さんありますよね。

今回はわたしが2000年頃、20代最後の2年間にのめり込んだ“写真検索の世界”についてお話したいと思います。

当時わたしはビジュアルコミュニケーションにとても強みがある会社でシステムエンジニアとして働いていました。

この会社ではフォトグラファーやデザイナー、画像処理オペレーター、プロデューサーなどのプロフェッショナルが知恵と技術を結集して広告制作やストックフォト事業といったビジュアル関連事業を手がけていました。

この中のストックフォト事業をデジタル化して行こうという取り組みがある時からスタートしました。ストックフォト事業というのは、著作権や使用履歴を管理した写真を貸し出すビジネスです。有名なものでは“アインシュタインが舌を出している写真”などがあります。

ああいった写真を企業が広告利用する際に業種や利用媒体、利用地域などに応じて使用料をいただき、競合企業が同一の写真を類似目的で利用しないように管理していました。

このビジネスを当時は都内の一等地に数か所の店舗を借りて行っていました。来店するお客様の要望に合わせて写真に精通したスタッフが候補写真をセレクトし、貸し出しを行っていました。

これらをストックフォトECサイトを軸にリアル店舗をなくしてネットを介して事業ができる様に転換していく取り組みの中で、わたしはストックフォトECサイトの技術責任者としてシステム開発に従事していました。

この時の開発苦労話は色々あるのですが、その中でも特に印象に残っているのが写真検索の奥深い世界でした。

まず、1つ1つの写真に「キーワーダー」と呼ばれる言語学をしっかりと学んだ人材が複数のキーワードをつけていきます。

例えば、「江の島の海岸で日本人の家族が遊んでいる写真」であれば、“江の島、海岸、家族、遊ぶ、日本人、男性、女性、・・・”のような感じでキーワードをつけていくのですが、その写真の要素を分解して一般的に連想するキーワードがつけられていないと、検索結果にあがらずに機会損失となってしまいます。

こういった作業を数十万点の写真に対して複数のキーワーダーがルールを定めながら日々取り組んでいました。

そして、当時わたしがハマりにハマった写真検索の奥深い世界に入っていきます。

まず最初に調整が大変だったのが“表記ゆれの問題”でした。写真とキーワードが揃った段階で開発中のシステムに投入して動作テストを繰り返し行うのですが、ある日チームで一緒に取り組んでいたデザイナーからこんな声があがりました。

「猪目さん、“バッター”で検索したら“バッタ”が一緒に出てきました!」

バッターは野球、バッタは昆虫なので両者には全く関連性はありませんが、キーワードとしてみた場合、両者の違いは長音の「―」のみです。このケースでは「―」の有無で全く違う意味の言葉になりますが、キャンディとキャンディーは同じ意味といったように言葉によって解釈が変わってきます。

こういったケースがほかにも多々あったので、まずは表記ゆれについて検索エンジンの判定基準を見直しながら調整をかけて行きました。

表記ゆれの問題について見通しがついて来たころ、次に取り組んだのが“同義語の問題”でした。先程の事例で「江の島の海岸で日本人の家族が遊んでいる写真」を挙げましたが、キーワードのつけ方はルールを設けるとは言え、どうしても個人差がでます。

ある人は、キーワードを“江の島、海岸、家族、遊ぶ、日本人、男性、女性”とつけますが、別の人は、“江の島、湘南、砂浜、家族、楽しむ、日本人、男、女”のように変わります。

また、検索する人にとっては海の写真を検索する際に連想するのは「海岸」や「砂浜」でもなく「ビーチ」かも知れません。

こういったルールだけでは解消しきれない個人差を吸収して検索のヒット率を劇的に改善するために導入したのが“シソーラス(同義語)辞書”でした。

シソーラス辞書というものは、業界版が販売されていたり、使われるところでは使われているのですが、写真検索に適したものは当時なかったので自社開発することにしました。

“海、海岸、砂浜、ビーチ、beach、sea”といった形でよく使われるであろうキーワードの同義語データベースをつくり、キーワードに含まれていない検索ワードが入力された時でもヒットするようにしました。このシソーラス辞書に初期段階で少なくとも数千語くらいは登録していたと思います。

ほかにも写真に対する形容詞のつけ方、など挙げればキリがないのですが、こういったチューニングをしながら写真検索の精度を高めていき、開発着手から1年の期間を経て無事にシステムは完成し国内最大級のストックフォトECサイトとしてリリースすることができました。

後にも先にもあの時ほど“言葉の奥深さ”を痛感し、のめり込んだ日々はなかったと思います。おかげで今でも言葉の使い方に対しては自分なりに意識をする習慣が身についている気がします。

皆さんもキャリアの中で没頭されたテーマがあると思います。どんなテーマに没頭されてきたのか、是非教えてください!

#キャリア奮闘記 #写真検索の奥深さに震える


この記事が気に入ったらサポートをしてみませんか?