見出し画像

商品データ整備とは?具体例と重要性について解説します

皆さん、こんにちは。高速検索の会社、フォルシア株式会社でMasstery部に所属しています、エンジニアの伊藤です。

 このnoteでは、データ整備の重要性やtipsについてご紹介していますが、「そもそもデータ整備ってどういうことをするの?」と思われている方もいらっしゃるかもしれません。

今日は、現在Massteryの最も典型的な使い方である「商品データ整備」とはどのような作業なのか、ご紹介させていただきます。

 以下のような方におすすめです。

- 商品データ整備がなぜ必要なのか、イメージがわかない方
- 商品データ整備がなぜ重要なのか、イメージがわかない方
- 自社に商品情報管理部門があるが、その仕事の内容はよくわからないという方
- Massteryが商品データ整備作業をどのようにカバーするか、知りたい方

そもそも商品データ整備とは?

商品をたくさんの仕入先から仕入れている場合、商品情報が仕入先ごとにバラバラなフォーマットで送られてきたりします。

 このとき、バラバラなフォーマットのままでは、取り扱い商品の一覧を管理できませんから、自社の商品情報フォーマットに変換するという作業が必要になります。

(取り扱い商品数が多い商社様では、商品情報を自社の業務システムに取り込んで管理し、受発注を始めとする業務で利用するので、業務システムのフォーマットに揃えることになります。)
この「仕入先ごとにバラバラな商品情報のフォーマットを、自社のフォーマットに変換する」作業が、商品データ整備です。

 また、仕入れた商品をECサイトなどで販売する場合には、業務運用に最適化した形に変換していた商品情報を、さらに「販売に最適化された情報」にする必要があります。本記事では、その際のデータの変換も「商品データ整備」と呼んでいます。

商品データ整備ってどんなことをするの?

①商品名のクレンジング

自社の商品名の管理ルールに従って、商品名を特定の書式に揃えます。
たとえば以下のように対応が必要です。

 ■特殊文字の削除
「®」や「™」のような、特殊文字が商品名に含まれることがあります。
これらは、商品名を利用するシステムによっては、取り扱い対象外であったり邪魔になるといったことがあるので、削除されることが多いです。ここでの「システム」は、ECサイトのようなデジタルのシステムに限らず、伝票やカタログ印刷などのアナログのシステムも含みます。

 ■キャンペーン文言などの削除
商品名中にキャンペーン文言などが含まれることがあります。
期間限定の文言は、自社で永続的な商品情報を管理する場合には不要な情報なので、除外します。

 ■入数・容量情報の追加または削除
仕入先ごとに、商品名が「xx用エタノール 100mL入り」と入数・容量の情報が入っているケースもあれば、「xx用エタノール」と入数・容量の情報が入っていないこともあります。

 自社での管理ルールに従って、表記を揃える必要があります。
商品によって表記のばらつきがあると、その商品情報を使う際にどのような値が入っているか予想することができなくなるため、使いにくくなってしまいます。

—-
以上はごく一例ですが、Massteryではこういったあらゆる表記統一を行う関数を備えており、作業の自動化をすることができます。

②商品カテゴリや、商品グループへの分類

ECサイトで販売用の商品データ整備をする場合には、「商品を購入したいユーザ」が所望の商品を見つけやすくする必要があり、そのための情報を付与していく必要があります。

 多くのECサイトでは、「商品カテゴリ」を設定して、カテゴリから商品を探しやすくしています。また、とくに同じ商品の入数・容量違いやサイズ違いがたくさんあるMRO業界では、そのような商品をグループ(やシリーズ)としてまとめて、一覧比較しながら購入できるようにしているサイトが多いです。

 仕入先から届いた商品情報が、既存商品と突き合わせできる場合は、過去に分類済みのカテゴリやグループを付与すればOKです。

ただし、既存商品と新たに届いた商品の突き合わせができるのは、以下の記事で紹介しているように、データ整備をして主キーの運用が上手くいっている場合に限られます。

既存商品との突き合わせができない場合には、その商品が属するカテゴリを、正しく判断していく必要があります。
試薬や医療機器・理化学機器など専門性の高い商品では、人手で分類を行う際には、その分野の商品知識が必要となったりします。

 属人化しやすい作業ですが、Massteryではこのカテゴリ分類を自動化することができます。

③商品属性情報の抽出、表記統一

商品の属性情報の抽出や、表記の統一も重要な作業です。

 ■属性情報の抽出
ECサイトやカタログなどに商品情報を掲載する際には、長さ(縦・横・奥行き)、重さ、材質、色といった商品の属性情報が整理して表示されていると、ユーザが購入しやすくなります。

 とくに、ECサイトにおいて、商品をスペックや特徴で絞り込む機能を提供する際には、こういった属性情報を持っておくことが必須になります。

 しかし、仕入先の商品情報を受け取るタイミングでは、こういった情報は「商品説明」の文章の一部となっていることがほとんどで、「文章から商品の属性情報を抽出する」という作業が必要になります。

 Massteryには、商品説明から属性情報を抽出する機能があります。これを使うと、人手でひとつひとつ属性情報を抽出する必要がなくなります。

 ■安全や品質にかかわる、重要な属性情報

商品情報のなかでも、たとえば試薬の法規制や保存温度の情報については、正確さを期する必要があります。

 法規制情報とは、その試薬が「毒物」「劇物」「危険物」などに該当するかどうかの情報です。こういった試薬は、安全のため、取り扱い業者の登録や、管理方法・運搬方法などが法律で定められています。

 法規制情報の表記に誤りがあると、法令違反や、危険な事態につながりかねません。しかしこういった情報も、メーカーごとに「毒物」「危険物」を示す表記方法がばらばらです。一方で管理の仕方の方法は何パターンかに限られますので、ばらばらな表記から属性を抽出して、どの管理パターンを適用すべきかを判定します。

 保存温度については、試薬は適切な温度で保管しなければ、変質や劣化を起こしてしまいます。適切な温度で輸送・管理できるよう、正しい保存温度を付記しなければなりません。

 ただこの保存温度も、「-80℃」「-90℃〜-60℃」「超冷凍」等々、仕入先やメーカーによって表記方法が異なります。保管や輸送にあたって、冷蔵庫が必要なのか、通常の冷凍庫があればよいのか、はたまた超冷凍の冷凍庫が必要なのか。自社の管理パターンに合わせて振り分けを行います。

—-
 Massteryには、こういった判定をサポートする機能も備わっています。

さいごに

今回ご紹介させていただいたのは、実際の商品データ整備業務のごく一部ですが、イメージをお伝えできたならば幸いです。

 なお、誰でも簡単に商品データ整備を自動化できる「Masstery」の機能一覧を、ブログで紹介しています。興味を持っていただけた方はぜひ、こちらもご覧ください。

私達がご提供している製品「Masstery(マスタリー)」は、
多くの人手が必要だったデータ整備を自動化する画期的なデータクレンジングツールです。フォーマットの統一、カテゴリーの自動分類、独自の変換、差分情報の取得等、データ整備に必要なあらゆる機能をご提供しています。
Masstery 公式サイト:https://mstr.forcia.com/ (データクレンジング)
フォルシア株式会社 企業サイト:https://www.forcia.com/ (高速検索)

この記事が気に入ったらサポートをしてみませんか?