見出し画像

ボンサイグラフ

初めまして、九州工業大学、本田研究室の松崎です。これからnoteで研究の進捗や成果、情報交換のために研究日誌をすることになりました。

今回はゼミで紹介した論文である「ボンサイグラフ」を説明しようと思います。

重回帰分析のグラフ表現法には円グラフや棒グラフなどがありますが、
統計量を視覚的に表す方法としてボンサイグラフがあります。

盆栽

用いる統計量としては
・決定係数 R2 → 幹の太さ
・重相関係数 R → 幹の傾き
・偏相関係数 → 枝の広がり
・標準偏回帰係数 → 枝の長さ
・目的変数→幹 , 説明変数→枝
を使用します。相関係数が幹の傾きなのには理由があり、相関係数の公式は
本質的には内積のcosθと同じなのでこれを用います。

盆栽の形は曲がってる盆栽より幹が真っ直ぐの直幹を良いものとします。

良いボンサイグラフ

ここからは具体的な手順です。
①幹の作成
・長さℓの線分ABを引き、 中点Oから垂直に長さℓの線分OPを引く。 この線分OPを幹と呼ぶ。 幹の太さはℓ/10 𝑅^2とする。 (Rは相関係数)

②枝の作成
・枝の長さ順に説明変数を配置するので標準偏回帰係数の大きさ順に並べる。枝ごとの間隔を等分で配置。

③枝の作成
・枝の長さは1/2×|𝑏_𝑖 |ℓ で表す。 (|𝑏_𝑖 |は標準偏回帰係数) 枝の太さは1/3×ℓ/10 𝑅^2とする。

③枝の作成
・偏相関係数をcosΦ_𝑖 とする。 水平線から反時計回りにΦ_𝑖に回るように 枝を引く。 標準偏回帰係数が正なら幹に対して 右側に伸びる。負なら左に伸びる

④幹の傾き
・重相関係数Rに対して角度θを求め、幹の傾きとして表現。

・具体例
下図のようなデータを考える。まず1つ目は決定係数が1に限りなく近い場合である。

これのボンサイグラフはこのようになる。

このボンサイグラフは幹が太くいい感じである。X1とX2の長さから影響が大きいことが分かる。

・具体例②
下図のようなデータを考える。2つ目は決定係数が0に限りなく近い場合である。

これのボンサイグラフは以下のようになる。

このボンサイグラフは幹が細く今にも倒れそうである。またどの枝のも長さが短く影響が小さいことも分かる。枝も幹に対して閉じているから目的変数との相関も小さいことが分かる。

このように統計量を視覚的に表現できるのでモデルの良し悪しがすぐわかるようになります。機会があればぜひ試してみてください。

引用論文
重回帰分析のグラフ表現法: 石村 友二朗
2014 日本計算機統計学会
2014 年 26 巻 2 号 p. 93-103
https://www.jstage.jst.go.jp/article/jscswabun/26/2/26_KJ00009359225/_pdf

この記事が気に入ったらサポートをしてみませんか?