Proyecto de IA para la salud mental semestre Febrero-Junio 2021
En el se pueden obervar paso a paso como hacer uso de la librería de speech brain y de como hacer uso de un modelo preentrenado de Automatic Speech Recognition. De igual manera se encuentra la experimetación y comparativa con diversos modelos como RNN, CDRNN y Transformers, diversos formatos de audio, distintas duraciones en la entrada de audio y diferentes velocidades de dictado. Cada experimentación cuenta con la presición asociada, el tiempo de ejecución al igual que el texto a predecir y la predicción del modelo
En el siguiente notebook los creadores del proyecto nos presentan brevemente las intenciones de la libreria con pequeñas demostraciones de lo que se puede lograr explicando los puntos base para el uso de la herramienta como: Instalación, locación de los archivos para hacer entrenamientos, manejo de los hiperparámetros para llevar entrenamientos propios, uso de modelos precargados, etc.
Adentramiento a la clase núcleo del proyecto en la cual se nos explica y lleva paso a paso de como utilizar los componentes de la misma para poder llevar a cabo los entrenamientos desde la creación del modelo mismo. Un acercamiento más profundo al funcionamiento de los métodos que se usan para la creación de datasets, entrenamientos, evaluaciones, etc.
Desglose entero de los 5 grandes pasos que lleva a cabo la libreria para hacer el proceso de automatic speech recognition con las indicaciones que tendría que llevar a cabo el usuario para poder personalizarlo de acuerdo a sus necesidades.
Github: https://speechbrain.github.io/index.html
Documetación:https://speechbrain.readthedocs.io/en/latest/index.html
Hugginface: https://huggingface.co/speechbrain