Esta es una herramienta para reconocer y extraer enunciados desde archivos de texto plano con el objetivo de transformarlos a formato json para ser usados en otra aplicacion/herramienta que consuma estos datos.
Se extraen los tipos:
- Multiple choice
- En un futuro pueden haber mas
Indice
Se requiere:
- python >= 3.10
-
Primero obtener el codigo:
Clonar el ropositorio
Descargar el .zip, en este caso descomprimirlo
-
Abrir la carpeta con el explorador de archivos
Una vez abierta colocar los archivos de texto (extension .txt) que se quieren procesar en la carpeta input
En Generar txt hay ayuda para obtener archivos de texto de otros formatos
-
Abrir una terminal en la misma carpeta
-
Ejecutar el archivo enunciados.py
py enunciados.py
-
El resultado del procesamiento se encontrara en la carpeta output
Si los datos de entrada no estan en formato de texto plano y no podes pasarlo a este, intenta con alguno de los siguientes metodos:
-
.pdf
Para pasar un pdf a texto plano una de las manera mas sencillas es usando Google Docs
Para hacerlo simplemente:
-
Abri el pdf en docs
-
Una vez abierto, solo usa la herramienta que se encuentra en la seccion Archivo -> Descargar -> Texto sin formato
-
Solo revisa que el contenido del .txt generado tenga sentido y listo
-
-
otros...