デジタル⊿ライフ027 : テキストマイニング (タイトル)
見出し画像

デジタル⊿ライフ027 : テキストマイニング (タイトル)

eb0shi / エンジニア

 タイトルを分析し、因数分解してみるが、なかなか難しい。マガジン跨ぎで、キーワードで使われることもあり、目線の違いで迷うが、広い分類から狭くなっていく法則を基本に試行錯誤してみた。

 タイトル構成は、紆余曲折を経て、以下に行きついた。5段階のLevelに分けられ、タイトルによりキーワードがはまる位置が異なるが、やむなしである。なお、ハッシュタグは、これとは別次元の横断的な検索用途として切り離した。




<タイトル構成>
 Level-1 マガジン名 : 分野
 Level-2 タイトル表示 : キーワード
 Level-3 ()内表示 : サブキーワード
 Level-4 /後表示 : サブx2 キーワード
 Level-5 /後表示 : サブx3 キーワード

 キーワードで一度、"行事"をタイトルに採用してみたが、広すぎてしっくりこない。順次修正しながらブラッシュアップしているが、現時点では以下の通り。




A) 衣食住
 A1) 衣:ブランド名(複数)、スーツ、ジーンズ、スニーカー、サンダル、サングラス、ウェットスーツ
 A2) 食:ビール、ウイスキー、日本酒、カレー、ラーメン、中華、ハンバーガー、郷土料理、コーヒー、コーラ
 A3) 住:国名(複数)、都市名(複数)、空港名(複数)、訪問場所(複数)、海、みち、住宅、ウッドデッキ、玄関、オリーブ、ホテル、美術館、ジム



B) 行事
 正月、初日の出、お年玉、年賀状、書初め、初詣、おみくじ、七五三、節分、七夕、雛祭り、誕生日、運動会、音楽祭、入学式、卒業式、土曜参観、合格、入試、クリスマス、サンタクロース、バレンタイン、ハロウィン、キャンプ、一人旅、男旅、プレゼント、お土産、観戦、応援、写真、ダイエット、検査



C) その他
 幼稚園、小学校、中学校、高校、大学、落とし物、忘れ物、事故、冷蔵庫、洗濯機、スマホ、SNS、カード、情報、マイナンバー、パスポート、タクシー、ファン、グローブ、車、買取

P.S : 料理ジャンル調査
 ”食”のジャンルだけでも、分類は難しい。皆の投稿で成り立つボトムアップ型の雄”食べログ”と、トップダウン型で統計データとも連携可能な総務省の分類を調べて見た。帯に短し襷に長しで、細かすぎる部分と荒すぎる部分があり、ちょっと合わず。

(1) 食べログ

(2) 日本標準産業分類(平成25年10月改定)(平成26年4月1日施行)-分類項目名 : Link




<中分類76 飲食店>
760  管理,補助的経済活動を行う事業所(76飲食店)
7600  主として管理事務を行う本社等
7609  その他の管理,補助的経済活動を行う事業所
761  食堂,レストラン(専門料理店を除く)
7611  食堂,レストラン(専門料理店を除く)
762  専門料理店
7621  日本料理店
7622  料亭
7623  中華料理店
7624  ラーメン店
7625  焼肉店
7629  その他の専門料理店
763  そば・うどん店
7631  そば・うどん店
764  すし店
7641  すし店
765  酒場,ビヤホール
7651  酒場,ビヤホール
766  バー,キャバレー,ナイトクラブ
7661  バー,キャバレー,ナイトクラブ
767  喫茶店
7671  喫茶店
769  その他の飲食店
7691  ハンバーガー店
7692  お好み焼・焼きそば・たこ焼店
7699  他に分類されない飲食店




この記事が参加している募集

スキしてみて

この記事が気に入ったら、サポートをしてみませんか?
気軽にクリエイターの支援と、記事のオススメができます!
eb0shi / エンジニア
ライフログもどきの文章 (ロンドン/サウジアラビア駐在記・ビジネス出張記・プライベート旅行記 & チガサキ⊿ライフ)を、お化粧直し公開。また、⊿ライフシリーズ (アート・シネマ・ボール・オサケ・オコノミ・スペース & デジタル)をスピンオフし、最近はほぼリアルタイム発信に発展!