CSVファイル内の指定したカラムで重複している値を検出するCLIツールです。
- シンプルで使いやすいコマンドラインインターフェース
- 重複している値の行番号と出現回数を表示
- 高速なCSV処理
cargo build --releaseビルドされたバイナリは target/release/cdc に生成されます。
cdc <ヘッダー名> <ファイルパス><ヘッダー名>: 重複チェックを行うCSVのカラム名<ファイルパス>: チェック対象のCSVファイルのパス
./target/release/cdc email users.csvこのコマンドは users.csv ファイル内の email カラムで重複をチェックします。
重複が見つかった場合:
Duplicates found in column 'email':
Value: '[email protected]'
Lines: [2, 5, 8]
Count: 3
Value: '[email protected]'
Lines: [10, 15]
Count: 2
重複が見つからなかった場合:
No duplicates found in column 'email'
MIT