見出し画像

商品データの自動カテゴリ分類ができるようになりました。

皆様、こんにちは。Masstery部で営業を担当している六車です。
今回、Massteryにカテゴリ分類機能が追加されたので、こちらのnoteでご紹介させていただきます。

カテゴリ分類作業はどの企業様も困っている

ECサイトに訪れた方が求めている商品に迷わずたどり着けるよう、ほとんどのECでカテゴリ分類が行われていると思いますが、実はこれが非常に大変な作業なのです。

サイトごとにそれぞれ設計されたカテゴリ構造を持っているので、他企業様のカテゴリ分類を、参考にはできても、真似することはできない。
担当者によってカテゴリ分類基準が異なり、統一された分類にならない。
そもそも商品がどういったものかが分からないので、カテゴリ分類できない。そんなカテゴリ分類を自動で行なう機能が、この度Massteryに追加されました。

図形1

Massteryのカテゴリ分類

カテゴリ分類には手法として機械学習が採用されることが多いと思いますが、Massteryではあえてルールベースを採用しています。

機械学習を用いた場合、機械学習では予測結果の中に、正しいものと正しくないものが混在します。
レコメンドに代表されるように、気づきを与えたり、正解が複数存在するような場合には、この機械学習というアプローチは大変有効です。しかし、今回のように「商品が属する正しいカテゴリを1つだけ予測する」という課題に対しては、全ての予測結果の正誤を人の目で確認するという業務が新たに発生してしまうので、Masstery部としては、機械学習という手法はカテゴリ予測に対しては最適な手法ではないと考えています。

図形2

一方で、ルールベースを用いた場合、正しい予測のみが出力されます。
これはつまり、確認を必要とすることなく、予測結果をそのまま利用することを可能にするので、データ整備業務の時間を大幅に短縮することができます。
こうしたことから、Masstery部としてはこちらが実業務に適した手法であると判断し、ルールベースを手法に採用しました。

図形3

※教師データとは
「訓練データ」や「トレーニングデータ」とも呼ばれ、ルールベースでの    予測を正常に機能させるために事前にシステムに登録するデータのこと。「例題」に対応する「正解」といった形式に整理されている。

ある企業様の例では、カテゴリ階層が5層以上あり、末端カテゴリ数も数千といった、かなり細分化されたカテゴリ構造であっても、検出率90%(精度はほぼ100%)という結果を出すことができています。

(ご参考)イメージ図
ルールベースの分類による検出率70%、精度93%の例

図1

まとめ

今回の機能追加により、より一層データ整備に苦心されている方のお役に立てるツールになれたと考えています。もしまだこちらの機能をお試しでない方がおられればどんどん使っていただけますと私としてはとても嬉しいです。

私達がご提供している製品「Masstery(マスタリー)」は、多くの人手が必要だったデータ整備を自動化する画期的なデータクレンジングツールです。フォーマットの統一、カテゴリーの自動分類、独自の変換、差分情報の取得等、データ整備に必要なあらゆる機能をご提供しています。
Masstery 製品サイト:https://mstr.forcia.com/ (データクレンジング)
フォルシア株式会社 企業サイト:https://www.forcia.com/ (高速検索)
【展示会への出展のお知らせ】                   2021年11月10日(水)~11月13日(土)の4日間、16thメッセナゴヤ2021展示会にMassteryが出展予定です!実際の操作イメージを掴んで頂ける動画を投影し、詳細な製品説明をMasstery部のメンバーからさせて頂きます。ご興味を持って下さった方はぜひこの機会にお立ち寄り下さい。※11/1(月)~11/19(金)は場所に制約されることなくアクセスできるオンライン展示会にも出展中です。お気軽にご連絡下さい。

よろしければぜひこちらの記事もご覧ください。


この記事が参加している募集

#業界あるある

8,603件

この記事が気に入ったらサポートをしてみませんか?