Power Queryで、Webサイト上のスペースで整えられたテキストファイルをデータクレンジングしてみたハナシ
面白いネタをいただいたので、やってみましたw
対象サイトはこちら。
「テキストデータダウンロード」…(。 ・ω・))フムフム
スペースで整えられている!🤣🤣
Hiro_21さんも無事に解決できましたが、
面白かったので、自分のやり方をメモしておきますw
① ExcelからWebサイトにアクセス
空っぽのExcelファイルを用意します。
データメニュー→Webから をクリックして、URLにみずほ銀行のサイトから対象の日のURLをペーストします。
そのまま「データの変換」。
② 不要な行を削除
おー まとまってますね~w
とりあえず上と下にある不要な行を削除します。
上3行がいらないので、行の削除→上位の行の削除
3 を入力して「OK」。
下の20行がいらないので、行の削除→下位の行の削除
20 を入力して「OK」。
うん、すっきり✨
③ 文字を区切って行く
今からやる方法は、文字数が大きく変わらないことが前提のやり方です🙏
文字と文字の間のスペース…見た目を整えるために入れられているので、数が違うし 半角と全角がありますw
なので今回は、文字数で区切ることにしてみました。
まずはわかりやすく、通貨から…
一番長い名前は「パプアニューギニアキナ」の11文字です。
列の分割→文字数による分割
「できるだけ左側で1回」(なんじゃそりゃ) で、文字数11を指定してみました。
いい感じ!✨
次はお尻から区切っていきます。
2列目を選択して、
列の分割→文字数による分割で、今回は「できるだけ右側で1回」で6文字。
TTBの小数点を含めた文字数の最大値。
いいね~👏✨
次のTTBというものも同じように…
あれーーー!区切れない😳 そっか、スペースが入ってるからか…
適用したステップの今行った作業のところを選択して、
この数字が文字数っぽい。
適当にいじってみたら、13文字が良さそう!
では、TTSも同じように…
項目別にはできた!!
④ 不要なものの削除
一番後ろの空列は不要なので、右クリックして削除。
すべての列を範囲選択して、「値の置換」。
検索する値には、半角スペースを入力。
全角スペースも入っているのでw、
全角スペースも値の置換。
これでデータとしては綺麗な形に✨
⑤ ヘッダーの設定
最後に、「1行目をヘッダーとして使用」。
これで完成✨
⑥ 閉じて読み込む
最後に、「閉じて読み込む」。
できたーーー
⑦ データソースを変更するときは
※後日談あり
Power Queryエディタ開かなくても なんとかできないかな?と思ったけど、無理っぽい?🤔
クエリをダブルクリックして、Power Queryエディタを開く。
適用したステップの「ソース」を選択して…
ここの日付を書き換えて、EnterをすればOK🙆♀️
データか書き換わったことを確認したら、「閉じて読み込む」。
ちゃんと書き換わりました!
※後日談:2022/12/24追記
日付が変わってダウンロードしたい対象日が変わったとき、「ドリルダウン」とやらを使えばソースのURLの日付を変更できることを教えていただきました😍
(多分)同じように やったつもりなのですが、うまくできず…😢
こちらのサイトを参考に、URLの日付だけを生成するのではなくて URLすべてを生成するようにしたら うまくできました!
こんな感じで、入力した日付から URLを生成するように関数を入れておき、テーブル名を付けておきます(私は「URL」と付けました)。
このテーブルを読み込み、
URLのセル?で右クリックして、ドリルダウン。
こんな状態になります。
この状態で、ダウンロードデータの方の適用したステップのソースのURLをごそっと変更!
意気揚々とEnterすると… (ノ゚⊿゚)ノアウッ!! エラー!!
ありがたいことに、上で紹介したページに解決方法が載ってました…😭
ありがとうございます ありがとうございます🙏✨
ファイル→オプションと設定→クエリのオプションから、プライバシーのレベルを「常にプライバシーレベル設定を無視します」に変更。
プレビューの更新をすると…
出た!!😍
対象日が常に実行日の前日なら、TODAY()-1 にしておけば おっけー🙆♀️
対象日が変更になったら、「すべて更新」すればデータが書き換わります🎵
すごい!ドリルダウンすごい!!😍
⑧ 所感
上でも書きましたが、今回のこのやり方は 文字数指定で行うため、文字数が大きく変わらないことが前提のやり方です。
今回の操作対象は、大きく変動することはなさそうなデータなので大丈夫だと思いますが、多少変わっても Power Queryならすぐ修正できるので楽ですね🎵
やば~、Power Query やば~🤤
「テキストファイル」でも、スペースで見た目を整えることがあるんですね🤣
いやはや、勉強になりました。面白かった!!
事務員が少しの背伸びでできる効率化を目指す🌈✨ 自分の好きなものを、楽しく発信していきたいです! いただいたサポートは学習費にあてさせていただきます🥰