Создание базы картинок из директории. Это нужно, для того чтоб выявлять дубликаты в разных размерах, просто выявлять дубликаты, выявлять мелкие и битые картинки.
- сбор путей к изображения - collect.py
- настройка базы - setup_db.py
- настройка базы - setup_db.py
- Просто поставить зависимости из requirements.txt
Пример:
python3 collect.py --db 1 --path=/home/sb/projects
- db - путь sqllite файлу. Если расширение .sqllite3 то можно без расширения. Если файла нет - он будет создан
- path - Путь к директории где будут искаться картинки
Таблица image_db
- path - Путь к файлу
- file_hash - md5 хеш файла
- width - ширина картинки
- height - высота картинки
- size - размер картинки
- hash - хеш изображения картинки