SoulTech là một ứng dụng trợ lý ảo AI giao diện bạn gái, sử dụng giọng nói để điều khiển hệ thống và tương tác thông minh qua API Gemini. Dự án kết hợp:
- 🎙️ Nhận diện giọng nói bằng VOSK
- 🧠 Trí tuệ nhân tạo trả lời bằng Google Gemini API
- 💻 Điều khiển hệ thống (mở Chrome, tăng/giảm âm lượng,...)
- 📦 Đóng gói dạng ứng dụng desktop bằng Electron
- 🔊 Đọc lại câu trả lời bằng Text-to-Speech
| Tác vụ nói | Hành động thực hiện |
|---|---|
hello / bật chrome |
Mở trình duyệt Chrome |
hi / mở youtube |
Mở Chrome và truy cập YouTube |
up |
Tăng âm lượng hệ thống |
down |
Giảm âm lượng hệ thống |
| Câu hỏi bất kỳ | Gemini trả lời + hiển thị + giọng đọc AI |
project/ │ ├── app.py # Backend Flask + Gemini xử lý lệnh ├── voice_to_text.py # VOSK chuyển giọng nói thành văn bản ├── index.js # Electron Main Process ├── templates/ │ └── index.html # Giao diện chính (AI bạn gái) ├── static/ │ ├── img/ # Icon, ảnh UI │ ├── voice_page.css # Style cho UI │ └── voice_text.js # Logic xử lý giao diện và AI ├── models/ │ └── vi/ # Mô hình VOSK tiếng Việt └── README.md # Tệp này
pip install flask flask-cors vosk pyautogui google-generativeai
Tải từ: https://alphacephei.com/vosk/models
Ví dụ: đặt vào models/vi
Mô hình đã có sẵn trong project, người dùng có thể thay thế models khác nếu cần
npm install
npm install electron
npm start
App sẽ tự động:
- Chạy Flask server ở
localhost:5000 - Mở giao diện Electron từ file
index.html - Nghe lệnh giọng nói
- Phản hồi bằng AI + giọng đọc
- 🔐 Thêm xác thực bằng khuôn mặt (OpenCV)
- 🌍 Hỗ trợ đa ngôn ngữ
- 🎭 Nâng cấp voice AI (Google TTS, ElevenLabs...)
- 💖 Cá nhân hóa câu trả lời theo cảm xúc
MIT License © 2025 SoulSync Project
