Thanks to visit codestin.com
Credit goes to github.com

Skip to content
/ cdc Public

CSVファイル内の指定したカラムで重複している値を検出するCLIツール

Notifications You must be signed in to change notification settings

ksk001100/cdc

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

3 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

cdc - CSV Duplicate Checker

CSVファイル内の指定したカラムで重複している値を検出するCLIツールです。

特徴

  • シンプルで使いやすいコマンドラインインターフェース
  • 重複している値の行番号と出現回数を表示
  • 高速なCSV処理

インストール

ビルドから

cargo build --release

ビルドされたバイナリは target/release/cdc に生成されます。

使用方法

cdc <ヘッダー名> <ファイルパス>

引数

  • <ヘッダー名>: 重複チェックを行うCSVのカラム名
  • <ファイルパス>: チェック対象のCSVファイルのパス

使用例

基本的な使い方

./target/release/cdc email users.csv

このコマンドは users.csv ファイル内の email カラムで重複をチェックします。

出力例

重複が見つかった場合:

Duplicates found in column 'email':

Value: '[email protected]'
  Lines: [2, 5, 8]
  Count: 3

Value: '[email protected]'
  Lines: [10, 15]
  Count: 2

重複が見つからなかった場合:

No duplicates found in column 'email'

技術スタック

  • Rust - プログラミング言語
  • seahorse - CLIフレームワーク
  • csv - CSV処理ライブラリ

ライセンス

MIT

About

CSVファイル内の指定したカラムで重複している値を検出するCLIツール

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages