Thanks to visit codestin.com
Credit goes to github.com

Skip to content

Este repositorio contiene las diapositivas, los cuadernos y código de ejemplo del curso de Datos Masivos II

Notifications You must be signed in to change notification settings

blancavazquez/CursoDatosMasivosII

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

49 Commits
 
 
 
 
 
 

Repository files navigation

Curso de Datos Masivos II, UNAM

Este repositorio contiene las diapositivas, los cuadernos y código de ejemplo del curso de Datos Masivos II

Temario

1. Reducción de dimensionalidad

  • Vectores y valores propios de matrices simétricas
  • Análisis de componentes principales
  • Descomposición de valores singulares
  • Descomposición CUR
  • Proyecciones aleatorias

2. Minería de elementos frecuentes

  • Modelo mercado-canasta
  • Algoritmo A Priori
  • Algoritmos de memoria principal
  • Algoritmos de pasadas limitadas

3. Análisis de vínculos

  • Asignación de relevancia (PageRank)
  • Búsqueda de tópicos inducido por hipervínculos
  • Algoritmos de pesado de vínculos
  • Análisis espectral y caminatas aleatorias
  • Aplicaciones

4. Sistemas de recomendación

  • Recomendación basada en contenido
  • Modelado de recomendación
  • Filtrado colaborativo
  • Descomposición de matrices
  • Caso de estudio: el desafío Netflix

5. Análisis de grafos de redes sociales

  • Redes sociales como grafos
  • Agrupamiento en grafos de redes sociales
  • Descubrimiento de comunidades
  • Búsqueda de comunidades
  • Similitud entre nodos
  • Conteo de triángulos
  • Propiedades de vecindades

Bibliografía

  • Jure Leskovec, Anand Rajaraman and Jeffrey D. Ullman. Mining of Massive Datasets. Second Edition. Cambridge University Press, 2014. Liga
  • Charu C. Aggarwal. Data Mining. Springer International Publishing, 2015.Liga
  • Charu C. Aggarwal. Recommender Systems. Springer International Publishing, 2016.Liga
  • David Easley and Jon Kleinberg. Networks, Crowds, and Markets: Reasoning About a Highly Connected World. Cambridge University Press, 2010. Liga

Horario

  • Lunes 13:00 pm a 14:30 pm (teoría)
  • Martes 10:00 am a 11:30 am (teoría)
  • Jueves 10:00 am a 12:00 pm (práctica)

Criterios de evaluación

Tareas (30%) Exámenes (10%) Proyectos (50%) Participación (10%)

Profesores

Blanca Hilda Vázquez Gómez

  • Correo: blancavazquez2013[arroba]gmail.com

Gibran Fuentes Pineda

  • Correo: gibranfp[arroba]unam.mx

Ambiente de programación

En este curso las herramientas de programación que se emplearán son las siguientes:

About

Este repositorio contiene las diapositivas, los cuadernos y código de ejemplo del curso de Datos Masivos II

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •