見出し画像

収集等したデータを使いやすい形で保存するための手引き

なんらかのデータを収集等して保管するとき、後から利用しようとする自分または他人が発狂しないための注意点について思いつくままに列挙いたします。

データはCSV、TSV、エクセル、Googleスプレッドシート、せいぜいNumbersのいずれかの形式で保存する。

エクセルやスプレッドシートならば、数字、日付、時刻、文字列など素直にその形式に従って入力する。数字や日付を文字列形式で入力などのクレージーなことをしない。

CSVなら当然、数字の中にカンマを入れない。数字は半角で入れる。日付はyyyy/mm/ddとはyyyymmddとかのようにフォーマットを統一して入れる。

1行目を見出し行とし、2行目以降をデータ行とするという原則を厳守する。

ひとかたまりのデータ、例えば顧客名簿のようなものならば、1顧客のデータを、項目が多いから2行で1顧客のデータを入れるようにしようなどというクレージーなことをしない。いくら項目が多くとも1顧客は絶対に1行にする。

エクセルなどでセルの結合などのクレージーなことをしない。

セル内改行などの余計なことをしない。

小計行だの合計行だのをデータに混在させない。どうしても必要ならピボットテーブルとか関数を使って集計値だけの別シートにする。

以下は、データ形式とは少し違う話ですが

罫線は作業負荷をいたづらに増やすだけなので使わない。

フォントの種類だの、サイズだの、太字にするだの、イタリックにするだの、作業負荷をいたづらに増やすだけなので一切行わない。デフォルトで通す。

セルの背景色とか使わない。(やるなら見出し行だけ)


とりあえず、こんなところでしょうか。また思いついたら追記します。

この記事が気に入ったらサポートをしてみませんか?