見出し画像

データの縦持ち、横持ち ~データを整理する新たな視点~



データの「縦持ち」と「横持ち」

データはExcelのように「行と列」の表形式で管理されていることが多いですが、その設計方法には「縦持ち」と「横持ち」という考え方が存在します。
あまり聞き慣れない言葉かもしれませんが、データを扱う際にはこの「データの持ち方」という視点が重要で、「データの持ち方」によって、データ分析する際にデータが扱いにくいことや処理しにくい原因となっていることがあります。
そのため、この2つの設計方法を理解し、使用する業務によって使い分け、時には適切に形式を変換することが重要となります。

今回は、改めてデータの縦持ち・横持ちの使い分けについて、「映画のリストを作成する」を例にお伝えできればと思います。


データの持ち方ごとの見え方

さて、あなたが例えば映画のタイトルごとに「公開年」のリストを作成するとします。
この時にどのようにデータを整理しますか?
この整理の仕方で「縦持ち」と「横持ち」に分かれます。

まず、「横持ち」のデータでは、各行が一つの項目(この場合は映画)を表し、各列がその項目の特性(タイトル、〇年に公開したかどうか)を表します。
今回の場合は、各列が「タイトル、2016年公開、2017年公開、2018年公開…」といった具合に、1年ごとに列が追加されていくため、データが増えれば増えるほど横にデータが長くなりやすいのが特徴です。
この形式は、一覧表やエクセルのシートを思い浮かべるとわかりやすいでしょう。

一方、「縦持ち」のデータでは、各行ごとに「事実」を表します。
たとえば、今回の場合は列が「タイトル、公開年」といった2列で、各行に「タイトルA、2016年」や、「タイトルB、2017年」といった具合になります。
横持ちのデータと違い、1年経っても、列は追加されません。
そのため、データが増えれば増えるほど縦に長くなりやすいです。
この形式は、特定の属性を横断的に見る場合や、データが時間と共に追加される場合に便利です。

そしてそれぞれの形式には利点と欠点があります。
よこ持ちは人が一目で全体が把握しやすい反面、データが増えると管理が難しくなることがあります。

一方、縦持ちは機械が読み取りやすい構造になるため、データの追加や集計が簡単な反面、全体像を把握するのが少し難しくなります。


まとめ

ここまでデータの縦持ちと横持ちについて解説していきましたが、お客様からいただくデータは初めから扱いやすい形になっていることは少なく、分析する人自身がデータの形式を理解し、適切な形に変換することが重要となってきます。

今回の記事で「縦持ち」、「横持ち」というデータの形式を理解し、
情報の価値を最大限に引き出す助けになればうれしいです。


【ワークスアイディのホームページはこちら】

この記事が参加している募集

この記事が気に入ったらサポートをしてみませんか?