見出し画像

Web上にある文章を分析して生活者の声を聴く、自然言語処理とは~データサイエンスを知るコラム⑦

こんにちは、笠原です。本日も知るギャラリーの記事をご紹介いたします。
Web上にある文章を分析して生活者の声を聴く、自然言語処理とは~データサイエンスを知るコラム⑦」です。今回ご紹介する記事は、連載モノの第7回となります。今回のnoteを読んでご興味が湧いた方は、ぜひ第1回~第6回もご覧ください。

それでは記事をご紹介する前に、そもそも、記事のタイトルにもある、「自然言語処理」とはいったいなんでしょうか?

人間が用いる言語のことを「自然言語」といいます。「自然言語処理」とは、自然言語をAIのような機械で処理し、内容を抽出したり、解釈しやすくしたりする技術のことを指します。対象となる言語は日本語だけでなく、英語、中国語等々あらゆる言語が対象となります。
英語では自然言語処理のことを“Natural Language Processing”といい、“NLP”と略されます(“NLP”で検索すると“Neuro Linguistic Programing”という「神経言語プログラミング」の記事がヒットしますが、この記事では”Natural Language Processing”を指しています)。
自然言語処理技術を用いることで、生活者が「何を望んでいるのか」「何に困っているのか」といったニーズや顧客課題を、より解釈しやすくすることが可能となります。

記事より

・・・なるほど!つまり、アンケート回答などの「数字」のデータではなく、文章のような非構造化データを分析し、インサイトを得ることができるようになった、という話のようです。AIの進化すごいですね・・!!
 
知るギャラリーの記事では具体的に、どのように自然言語処理をするのか、ステップにわけて解説しています。

<分析方法の概観>

まず、STEP 1ではWebサイトからテキストデータを取得します。
Web上に公開されている情報の中から特定の情報を抽出し、取得する技術のことをWebスクレイピングと言います。自然言語処理分野においてはWeb上の記事や、生活者がWeb上に書き込んだレビュー/コメント、SNS上への投稿などが取得対象となります。 “Garbage In, Garbage Out”(ゴミを入れれば、ゴミが出る)という言葉があるように、どのようなデータを使用するかを決めることがここでは重要です。
例えば、特定の商品を分析したい場合には、「該当商品と競合商品のレビューを取得対象とする」というように、目的に対して整合性が取れている取得先を選定し、取得しようとしているコメントやレビューは意味不明な言葉の羅列が多く含まれていないかをチェックしておきましょう。
その他、権利関係にも注意が必要です。コメントを取得することを明確に禁止しているWebサイトや、APIを介しての取得のみを許可しているWebサイト等もあるため、事前に調べておきましょう。

記事より

ここまでがステップ1です。知るギャラリーの記事では、さらに詳しく自然言語処理の具体的な分析方法についてまで解説しています。
 
自然言語処理技術は生活者が書き込むレビュー、コメントからインサイトを導出する強力な手法で、いま急速に伸びている市場です。
自然言語処理の技術を用いることで調査という手段によらず、生活者の潜在的な声を聴くことが可能になります。
 
ぜひこの機会に知るギャラリーの記事をご覧いただき、最新の情報をご確認ください!
 
記事リンク:https://gallery.intage.co.jp/nlp/