Thanks to visit codestin.com
Credit goes to github.com

Skip to content

Desarrollar un análisis completo que permita extraer datos sobre los pacientes que presentan afectaciones de diabetes, utilizando herramientas de modelos machine learning y el algoritmo Kmeans, para visualizar los resultados de manera efectiva.

Notifications You must be signed in to change notification settings

dg2c4/Diabetes-Clinical-Data

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 

Repository files navigation

Diabetes-Clinical-Data

Diabetes-Clinical-Data-Logo

Objetivo:

Desarrollar un análisis completo que permita extraer datos sobre los pacientes que presentan afectaciones de diabetes, utilizando herramientas de modelos machine learning y el algoritmo Kmeans, para visualizar los resultados de manera efectiva.

Desarrollo:

Este trabajo de Machine Learning se centra en el desarrollo de un proyecto completo de análisis de datos, desde la exploración inicial hasta la evaluación de un modelo predictivo. El proceso se divide en tres fases principales:

1. Análisis Exploratorio:

- Identificación de preguntas de investigación
. Formulación de hipótesis
- Análisis inicial del conjunto de datos

2. Preprocesamiento de Datos:

- Limpieza de datos
- Transformación de variables
- Reducción de dimensionalidad
- Discretización cuando sea necesaria

3. Modelado y Evaluación:

- Implementación de modelo de regresión lineal o logística
- Selección y cálculo de métricas de evaluación
- Análisis del rendimiento del modelo

Conjunto de datos:

Contiene información sobre datos clínicos de pacientes.

https://www.kaggle.com/datasets/ziya07/diabetes-clinical-dataset100k-rows 

Ejercicio:

El Dataset entregado presenta los datos de pacientes que presentan afectaciones de diabetes. La idea es analizar cuáles son las causas para que un paciente tenga afectaciones de salud por esta enfermedad. Se debe realizar lo siguiente:

  1. Preprocesamiento de los datos: limpieza, revisión de datos faltantes-anómalos, reducción de datos (seleccionar características relevantes) y transformaciones.
  2. Análisis exploratorio (EDA) de los datos para responder al problema: ¿Qué características hacen que se diagnostique a una persona con diabetes?.
  3. Entrenamiento de una red neuronal.

Evaluación:

Ítem Puntos
Análisis exploratorio en notebook 10 pts
Preprocesamiento de los datos 15 pts
Entrenamiento del Modelo de Machine Learning con redes neuronales 15 pts
Evaluación del modelo 75% Accuracy 10 pts
Total 50 pts

Systems engineering:

User: David Gutierrez Chaves
Code: 506222728
Subject: Big Data Electiva-I
Institution: Fundación Universitaria Konrad Lorenz
Institutional email [email protected]

Created By:

https://github.com/dg2c4

Date: 08/03/2025 - 15/03/2025

About

Desarrollar un análisis completo que permita extraer datos sobre los pacientes que presentan afectaciones de diabetes, utilizando herramientas de modelos machine learning y el algoritmo Kmeans, para visualizar los resultados de manera efectiva.

Topics

Resources

Stars

Watchers

Forks

Packages

No packages published