Thanks to visit codestin.com
Credit goes to github.com

Skip to content

Zloooy/ITMO-AI-QA

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Структура проекта ai_itmo_qa

Запуск

Для корректной работы системы должны быть заданы переменные среды из файла config.py. Необходимо 2 файла - service key для генерации эмбеддингов Yandex GPT и service key для доступа к YDB.

Парсинг данных

Все данные хранятся в векторном и текстовом виде в базе YDB. Хранилище заполняется запуском следующих команд:

scrapy runspider itmo_spider.py -a start_url="https://ai.itmo.ru/" specialization_source="ai_engineer"
scrapy runspider itmo_spider.py -a start_url="https://aiproduct.itmo.ru/" specialization_source="ai_product_manager"

Запуск Telegram-бота

python main.py

Этот документ описывает структуру каталогов и файлов проекта ai_itmo_qa, предоставляя обзор его компонентов и их назначения.

Структура каталогов

ai_itmo_qa/
├── agent.py
├── ai_engineer.md
├── bot.py
├── config.py
├── embeddings.py
├── itmo_spider.py
├── main.py
├── utils.py
└── data/
    ├── __init__.py
    └── ydb_adapter.py

Описание файлов и каталогов

  • agent.py: Содержит реализацию AI-агента, отвечающего за координацию различных задач и взаимодействий.
  • bot.py: Реализует основную логику бота, обрабатывая взаимодействия с пользователем и ответы.
  • config.py: Основной конфигурационный файл проекта, хранящий учётные данные для подключения к сервисам.
  • embeddings.py: Создание текстовых эмбеддингов.
  • itmo_spider.py: Веб-краулер, предназначенный для сбора данных с доменов ИТМО. Точка входа в приложение для парсинга.
  • main.py: Основная точка входа в приложение, координирующая выполнение различных модулей.
  • tokenizer.json: JSON-файл с конфигурациями токенизатора, используемый для обработки текстовых данных.
  • utils.py: Набор вспомогательных функций и методов, используемых в проекте.
  • requirements.txt: Зависимости проекта.

Каталог data/

Этот каталог предназначен для хранения модулей, связанных с данными, и, возможно, обработанных данных.

  • __init__.py: Помечает каталог data как Python-пакет.
  • ydb_adapter.py: Содержит код для адаптации и взаимодействия с Yandex Database.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages