見出し画像

データクリーニングに使える関数

データ完全性を確保するために関数を活用する方法を紹介します。
関数は、表計算ソフトで特定の計算を自動的に実行するコマンドで、データの処理やタスクの自動化に役立ちます。

紹介する例の対象データはA1:A100にあるものとします。

COUNTIF関数の活用

最初に紹介する関数はCOUNTIFです。これは、指定された条件に一致するセルの数を返す関数で、例えば、セルの価格が正確に記載されているか確認する場合に使います。具体的な例では、最も安い価格が100円の場合、COUNTIFを使用して異常な値や誤りを確認します。

=COUNTIF(A1:A100, "<100")

この関数は、I列の範囲で100未満の数値を持つセルの数を返します。
これにより、データの異常値を素早く発見することができます。

LEN関数の活用

次に紹介するのはLEN関数です。これは、文字列の文字数を数え、データが特定の長さを満たしているかどうかを確認するのに便利です。例えば、会員番号が6桁であることを確認する場合に使用します。

=LEN(A1)

この関数は、A2セル内の文字列の長さ(文字数)を返します。
これにより、不正確なデータを発見しやすくなります。

LEFT、RIGHT、MID関数の活用

LEFT関数は文字列の左側から指定した文字数を返し、RIGHT関数は右側から指定した文字数を返します。
これらの関数を使用することで、特定の部分文字列を抽出できます。
例えば、商品コードの整理などに役立ちます。
商品コード:abcdef1234

=LEFT(A1, 5)

→abcdef

=RIGHT(A1, 4)

→1234

MID関数は文字列の中間のセグメントを取得します。
例えば、特定の部分文字列を抽出して分析したい場合に使用します。

=MID(A1, 4, 2)

→de

これらの関数を駆使することで、文字列の任意の位置から必要な情報を抽出することができます。

CONCATENATE関数の活用

CONCATENATE関数は、複数のテキスト文字列を結合するのに使います。
例えば、会員番号のコードが左右から分かれていた部分を再結合する際に便利です。

=CONCATENATE(B1, C1)

この関数により、左右に分かれていた情報を1つにまとめることができます。

TRIM関数の活用

TRIM関数は、データの先頭、末尾、繰り返しの余分なスペースを削除するのに役立ちます。
特にテキストデータの取り込み時に生じる余分なスペースを解消します。

=TRIM(A1)

この関数により、特定のセル内の余分なスペースが取り除かれ、データの精度が向上します。

これらの関数を駆使することで、表計算ソフトにおけるデータクリーニング作業が効率的に行えます!

SPLIT関数の活用

SPLIT関数は指定した文字を中心にテキストを分割し、その区切られた部分を別のセルに挿入します。
例えば、商品コードの分割などに役立ちます。
商品コード:abcdef-1234

=LEFT(A1, "-")

→abcdef   →1234



この記事が気に入ったらサポートをしてみませんか?