大量のデータから興味深く再利用可能な規則性を見つけ出すツールとは?

広告の分析は結構、沢山の企業がされていますので
私がお伝えしても意味ありません。

本題へ

今回は、上場企業の通販業界(リテール業界の方が適切かも)
が普通に使っているけど、まだ中小企業が使用して
いない、もっと言うと実践ができていない分析方法の
概要をお伝えします。

大きくは2つあります。
1つ目
データマイニング
・回帰分析
・テキストマイニング
・アソシエーション分析

2つ目
PSM分

もっとみる

ECサイトに単に商品を並べていませんか? それ、やばいです!

データマイニングに関する有名な事例として、
ビールと紙おむつがあります。

これは、紙おむつを購入した男性は、
同時に缶ビールを購入することが多い

というデータに基づいて並べて陳列する
ようにした結果、売り上げが上昇した
という米国のあるスーパーでの事例です。

ECサイトに単に商品を並べていませんか?
それ、やばいです!

本題へ

データマイニングとは、
構造化されたデータベースから

情報

もっとみる

Tech Miningの心得

はじめに

 特許や論文といった科学技術情報を分析して、何らかの意思決定に繋げていく活動のことを表す用語が色々とあります。例えば、三位一体経営、IPランドスケープ、コンペティティブ・テクニカル・インテリジェンス、科学計量学(書誌計量学)等。今回は、その中でも特にドキュメントというコンテンツを分析し、書誌情報と掛けわせて分析する意味合いを色濃く持った「Tech Mining(テックマイニング)」を紹

もっとみる

積木くずし

はじめに、歴代視聴率No.1ドラマ『積木くずし』の印象変化を公開していきます。

私は、平成生まれですので、このドラマをリアルタイムで見れてないんですよねぇ。。ですが、TBSさまに強い愛と熱い思いをお伝えしたところ、このドラマを全て見ることができました。もうずっと鳥肌でした。笑

この記事を読んでくださっている方の中には、もしかしたら懐かしく思われる方もいるかもしれませんね!当時見ていた感想など聞

もっとみる

はじめまして

皆さま、はじめまして。

ドラマらばーこと、ドラマらばーです。ドラマがとても好きです。

大学時代、色彩的文脈からみたドラマの時系列変化とヒット性の相関について研究しておりました。

なんの役に立つのかわかりませんが、

様々なドラマの、画面分析で得られた印象変化結果について公開していきたいと思います。(誰か興味ありますかね…?笑)

印象分析に用いたシステムは、映像や音楽データなどの時間的な内容

もっとみる

休学しました!

あけましておめでとうございます。

2021年1発目の記事ですが、ずっとこのnoteの記事にしてきた100%オンライン大学院であるUniversity of York のコースを年末に休学しました。

理由としては、下記の2点です。

1. 転職したこと

2. 新たな副業事業を始めたこと

になります。

1に関して、11月より新しい職場になりました。

変わらず外資系ソフトウェア会社ですが、以

もっとみる

[Data Mining & Text Analysis]③ クラスタ分析 - 階層クラスタ

前回記事にした、K-meansクラスタ分析の手法の他に、もう一つ代表的なクラスタ分析の手法に階層クラスタ(Hierarchical Clustering)という手法がありますので、今日はこちらの概要を書いていければと思います。

階層クラスタ分析には基本的には、二つのアプローチが存在します。

1. 凝集型階層クラスタ(Agglomerative Hierarchical Clustering)

もっとみる

[Data Mining & Text Analysis]② クラスタ分析

こんにちは、

本日は、Data Mining & Text Analysiモジュールシリーズの続きでクラスタ分析に関しての記事になります。

クラスタ分析とは 

クラスタ分析とは、異なる要素が混ざり合っているデータセットから、類似性のあるものの、小さな集合(クラスター)を作り、分類する分析方法のことを言います。重要な点は、分析する際に、あらかじめ既に存在している要素や属性(例:性別、年齢等)を

もっとみる

[Data Mining & Text Analysis]② データマイニングでよく使用される用語集

現在学んでいるデータマイニングモジュールの中でよく出てくる用語をまとめたものを記事にしたいと思います。

- Categorical Attributes(カテゴリ値属性): データの属性値であり、カテゴリまたはクラスの離散値(連続していない=非連続的な)状態の値)、および順序付けしていない値として表します。

例:  

属性:天気カテゴリ

テキストデータ:晴れ、くもり、雨、雪

数値データ:

もっとみる