Este repositorio contiene las diapositivas, los cuadernos y código de ejemplo del curso de Datos Masivos II
1. Reducción de dimensionalidad
- Vectores y valores propios de matrices simétricas
- Análisis de componentes principales
- Descomposición de valores singulares
- Descomposición CUR
- Proyecciones aleatorias
2. Minería de elementos frecuentes
- Modelo mercado-canasta
- Algoritmo A Priori
- Algoritmos de memoria principal
- Algoritmos de pasadas limitadas
3. Análisis de vínculos
- Asignación de relevancia (PageRank)
- Búsqueda de tópicos inducido por hipervínculos
- Algoritmos de pesado de vínculos
- Análisis espectral y caminatas aleatorias
- Aplicaciones
4. Sistemas de recomendación
- Recomendación basada en contenido
- Modelado de recomendación
- Filtrado colaborativo
- Descomposición de matrices
- Caso de estudio: el desafío Netflix
5. Análisis de grafos de redes sociales
- Redes sociales como grafos
- Agrupamiento en grafos de redes sociales
- Descubrimiento de comunidades
- Búsqueda de comunidades
- Similitud entre nodos
- Conteo de triángulos
- Propiedades de vecindades
- Jure Leskovec, Anand Rajaraman and Jeffrey D. Ullman. Mining of Massive Datasets. Second Edition. Cambridge University Press, 2014. Liga
- Charu C. Aggarwal. Data Mining. Springer International Publishing, 2015.Liga
- Charu C. Aggarwal. Recommender Systems. Springer International Publishing, 2016.Liga
- David Easley and Jon Kleinberg. Networks, Crowds, and Markets: Reasoning About a Highly Connected World. Cambridge University Press, 2010. Liga
- Lunes 13:00 pm a 14:30 pm (teoría)
- Martes 10:00 am a 11:30 am (teoría)
- Jueves 10:00 am a 12:00 pm (práctica)
Tareas (30%) Exámenes (10%) Proyectos (50%) Participación (10%)
Blanca Hilda Vázquez Gómez
- Correo: blancavazquez2013[arroba]gmail.com
Gibran Fuentes Pineda
- Correo: gibranfp[arroba]unam.mx
En este curso las herramientas de programación que se emplearán son las siguientes: