Мощный парсер товаров с Ozon.ru с графическим интерфейсом и интеграцией с Telegram ботом.
- 🔍 Парсинг товаров из категорий Ozon (до 10000 товаров)
- 📊 Извлечение данных через API Ozon (артикулы, цены, названия)
- 🏢 Сбор информации о продавцах (ИНН, рейтинг, количество заказов)
- 🤖 Управление через Telegram бота
- 🖥️ Удобный GUI интерфейс
- ⚡ Многопоточная обработка (до 5 параллельных потоков)
- 📝 Подробное логирование процесса
- 💾 Экспорт результатов в JSON и Excel
- 🔄 Настраиваемые поля для экспорта
- Данные о товарах: артикулы, названия, цены (текущая, карточная, оригинальная)
- Информация о продавцах: название компании, ИНН, рейтинг, количество заказов и отзывов
- Ссылки: URL товаров и изображений
- Отчеты: автоматический экспорт в Excel с настраиваемыми полями
- Уведомления: мгновенные оповещения через Telegram
- Клонируйте репозиторий:
git clone https://github.com/NurjahonErgashevMe/ozon-parser
cd ozon-parser- Установите зависимости:
pip install -r requirements.txt- Убедитесь, что у вас установлен Chrome браузер
python main.pypython bot.pypython app.py- Создайте бота через @BotFather и получите токен
- Узнайте свой Telegram ID через @userinfobot
- Укажите токен и ID в настройках приложения
- Запустите бота и отправьте ссылку на категорию Ozon
/start- главное меню/status- текущий статус парсера/settings- настройки парсинга/help- справка
-
Вкладка "Конфигурация":
- Настройка Telegram бота (токен и ID)
- Установка параметров парсинга
-
Вкладка "Управление":
- Запуск/остановка парсинга
- Управление Telegram ботом
- Просмотр статистики
-
Вкладка "Логи":
- Мониторинг процесса в реальном времени
- Сохранение логов в файл
-
Вкладка "Разработчик":
- Дополнительные инструменты для отладки
Вы можете выбрать, какие поля включать в Excel-отчет:
- Артикул товара
- Название товара
- Название компании-продавца
- ИНН продавца
- Цены (карточная, текущая, оригинальная)
- Ссылки на товар и изображение
- Статистика продавца (заказы, отзывы, рейтинг)
ozon-parser/
├── app.py # Запуск парсинга из командной строки
├── bot.py # Запуск только Telegram бота
├── main.py # Запуск GUI интерфейса
├── requirements.txt # Зависимости проекта
├── src/ # Исходный код
│ ├── config/ # Настройки приложения
│ ├── core/ # Основная логика
│ ├── gui/ # GUI интерфейс
│ │ └── tabs/ # Вкладки интерфейса
│ ├── parsers/ # Парсеры (ссылок, товаров, продавцов)
│ ├── telegram/ # Telegram бот
│ └── utils/ # Вспомогательные утилиты
├── output/ # Результаты парсинга
└── logs/ # Файлы логов
- Python 3.8+
- Chrome браузер
- Интернет-соединение
- Для Telegram бота: токен бота и ваш User ID
- Парсер использует Selenium для сбора ссылок на товары
- Данные о товарах и продавцах извлекаются через API Ozon
- Многопоточность автоматически оптимизируется в зависимости от количества товаров
- Результаты сохраняются в папке
output/ - Логи записываются в папку
logs/
MIT License