見出し画像

Tableau パブリッシュへの道〜その1:ファイルタイプ

こんにちは山口征啓です。いよいよ明日がDATA Saberの試験です。この後におよんでまだ受験資格を満たしていないわけですが、ぎりぎりになるのはいつものことなので、気にせず進めていきます。

この3回シリーズでは、Tableauのパブリッシュに必要な情報についてお伝えします。パブリッシュとは自分の作ったワークシートやビジュアルをリモート環境にアップすることです。1回目の今回はパブリッシュへの準備としてTableauのファイルタイプについてです。

Tableauのファイルタイプはたくさんあって混乱するので、最初にまとめておきましょう。
公式サイトによると以下の6つのファイルタイプがあります。

ファイルタイプ一覧

ワークシート系

  • ワークブック(.twb)    基本的なファイル形式  .tdsを含む

  • パッケージドワークブック(.twbx) .twb + データ + 背景イメージ

  • ブックマーク(.tbm)  ワークシート1つだけのファイル

  • .tbwr 自動保存される復旧用のワークブックファイル

データ系

  • データソース(.tds) データ接続のためのショートカット

  • 抽出(.hyper)データのコピー 

  • パッケージドデータソース(.tdsx) .tds + .hyper + 色々なファイル

それでは一つずつ特徴をみていきましょう

ワークブック(.twb)

これが最も基本的なファイル形式です。Tableau Desktopを開くと自動的に生成されます。ファイル→保存するとこの形式になります。
通常は複数のワークブックとダッシュボードやストーリーを含みます。

ワークブックにはデータが含まれていません。したがってファイルの外にデータに接続して使う必要があります。もしファイルにデータを含めたい場合は、次のパッケージドワークブックを使います

パッケージドワークブック(.twbx)

ワークブックに加えて、抽出されたデータ(.hyper)やローカルのデータ(Excelなど)と背景イメージが含まれています。Zip形式で圧縮されています。データを含むのでファイルを渡すだけで、誰でもデータを閲覧できるという利点があります。
一方で、ファイルサイズが大きくなる、データが更新されない、データが意図しない人に渡ってしまうというデータ流出の危険性があります。そのため使用を推奨されていません。

ブックマーク(.tbm)

こちらは1つのワークシートだけを保存する形式です。頻繁に使用するワークシートがあるときに便利とされています。
データの更新はされませんので、あまり変化がなく、かつ頻繁に参照するようなワークシートがある時に向いていると思います。
検索してもユースケースが全く出てこないので、あまり使われていないようです。

.tbwr

こちらは公式サイトにも載っていなくて、なんという名称なのかわからないのですが、自動保存される復旧用ファイルです。
Tableauでは数分おきにワークブックが自動的に保存されます。この内容が.twbr形式で保存されます。

データソース(.tds)

つづいてデータ系のファイルです。一番基本的なのはこのデータソースです。
一般的にデータソースというとデータ自身を指すと思うのですが、Tableauのデータソースは、データを持っていません。代わりに、どのデータに接続したとか、読み込んだ後のデータ変形(結合、列名変更、型変更、別名)の情報だけをもっています。
名前が紛らわしいので注意が必要ですね。

抽出ファイル(.hyper)

こちらはデータを抽出した時に作成されるファイルです。以前は.tdeと呼ばれていたようです。
抽出とは元のデータセットから抜き出して、別に保存されるデータのことです。これも拡張子から中身が想像しにくいですね。

抽出すると以下のメリットがあります

  • 処理が高速になる 

  • データにオフラインでアクセスできる

  • 元のデータソースでは利用できない機能を使うことができる

オフラインで作成したワークブックをTableau Publicにパブリッシュするときにも抽出が必要になります。

パッケージドデータソース(.tdsx)

最後はパッケージドデータソースです。これはデータソース(.tds)に加えて、抽出ファイル(.hyper)やテキスト ファイル、Excel ファイル、Access ファイル、ローカル キューブ ファイルなどのローカル ファイル データが含まれます。そしてZip形式で圧縮されています。
全部盛りのデータソースですので、ローカルでも開くことができますが、
ファイルサイズが大きくなる、データが更新されない、データ流出の危険性などパッケージドワークブックと同じ欠点を持つため、推奨されていません。

終わりに

さまざまなファイルタイプがありますが、基本的にはワークブック、データソース、抽出ファイルの3つをよく使います。
これらの違いをおさえておくとスッキリしますね。

次回はTableauのリモート環境についてです。


参考サイト


この記事が気に入ったらサポートをしてみませんか?