Convertir des voix, des paroles en Texte, même s'il y a plusieurs interlocuteurs.
./run.sh --install./run.sh --webPuis ouvrir http://localhost:8000
source venv/bin/activate
python cli.py transcribe fichier.mp3 --speakersPour détecter correctement plusieurs speakers, vous devez configurer un token HuggingFace (gratuit).
Solution rapide (5 minutes):
./setup_token.shOu manuellement:
- Créez un compte: https://huggingface.co/join
- Acceptez: https://huggingface.co/pyannote/speaker-diarization-3.1
- Token: https://huggingface.co/settings/tokens
- Créez le fichier:
echo "hf_VOTRE_TOKEN" > hf_token.txt
📖 Voir ACTIVER_SPEAKERS.md pour le guide complet
Cette version corrige :
- ✅ Case à cocher "Détecter les interlocuteurs" bien affichée
- ✅ Boutons Copier, Télécharger, Nouvelle transcription fonctionnels
- ✅ Format de sortie (JSON/TXT/SRT) correctement appliqué
- ✅ Support du token HuggingFace pour détection speakers
MP3, WAV, M4A, FLAC, OGG, WebM