テキストから IP アドレスを抽出、重複削除２

2022年9月15日 05:09

以前テキストから IP アドレスを抽出し、さらに重複を除く方法について書いた。

上記は、IP アドレスを抽出するウェブサービス、および重複を取り除くウェブサービスを利用する方法だった。

しかしこの方法だと数万行に及ぶような大量のテキストだとエラーになる。さらに、扱う情報が外部に漏れる可能性がなくもない。

そこでこの処理をローカルでやることにした。

環境：macOS Catalina Version 10.15.6（英語環境）

（１）対象のテキストを sample.txt などというファイル名で保存する。

（２）Terminal で以下のコマンドを実行する。

$ grep -o '[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}\.[0-9]\{1,3\}' sample.txt | sort -t: -u -k1,1

たったこれだけで、IP アドレスの抽出および重複の削除ができるようになった。

参考：
How to Extract IPv4 Addresses from Files in Linux | Baeldung on Linux
https://www.baeldung.com/linux/files-extract-ip

この記事が気に入ったらサポートをしてみませんか？