International Center for Advanced Studies

Horarios

Martes y jueves de 14 a 17 horas

Pre-inscripción

(abierta hasta el 30 de julio 2021)

Información General

Los algoritmos y técnicas de aprendizaje automático (machine learning) están cambiando radicalmente el mundo en el que vivimos y la manera en la que se llevan adelante muchos aspectos de la actividad humana. Apoyados en una disponibilidad exponencialmente creciente de datos y de capacidad de cálculo, están influyendo profundamente en áreas tan distintas como las ciencias básicas, desde la física y la astronomía hasta la neurociencia, la sociología y la biología, y han tenido un impacto notable en la economía, el mercado y en los negocios digitales.

Machine learning workflow
Flujo de trabajo típico de una aplicación de Aprendizaje Automático (A. Géron)

Las técnicas de aprendizaje automático actúan como aglutinador que potencia el descubrimiento científico colaborativo y que atraviesa todas las actividades científicas modernas. Se ocupa de extraer valor de los datos y traducirlos a activos de conocimiento, además de desarrollar las herramientas y los métodos para obtener, administrar y analizar estos datos. Pero su carácter excede largamente al ámbito científico y académico y tiene el potencial de guiar políticas públicas y mejorar la sociedad.

Introducción al Aprendizaje Automático es una manteria de la Escuela de Ciencia y Tecnología de la UNSAM que provee a estudiantes de distintas carreras de la Universidad Nacional de San Martín nociones teóricas y una amplia base de experiencias prácticas para la obtención, exploración y análisis de datos relevantes en sus respectivas disciplinas. Además de aprender el funcionamiento y utilización de algoritmos de machine learning, se entrena el espíritu crítico en el análisis de los resultados obtenidos.

Contenidos

Primera parte

  • El dato como objeto de estudio. Obtención y visualización de datos. Análisis exploratorio de los datos. Limpieza y curaduría de datos.
  • Conceptos básicos de probabilidad y estadística. Espacio muestral y las distintas interpretaciones de la probabilidad. Las reglas de la suma y el producto. Teorema de Bayes. Inferencia bayesiana. Prior, verosimilitud y posterior. Bayesian updating. Priors conjugados.
  • Regresión lineal simple y múltiple. Cuadrados mínimos. Análisis de normalidad, análisis de los residuos. Palanca.

Segunda parte

  • Regresión polinomial. Sobreajuste. Conjuntos de entrenamiento, validación y testeo. Validación cruzada. Regularización: ridge y lasso. Tradeoff sesgo/varianza.
  • Modelos lineales de clasificación. Perceptrón y clasificadores de márgenes máximos. Modelos probabilísticos: regresión lineal y modelos generativos (Naive Bayes y modelos de mixtura). Support Vector Machines. El truco del kernel.
  • Árboles de decisión. Métodos de ensemble. Bagging & pasting. Random Forests. Boosting: Adaptive Boosting y Gradient Boosting.

Tercera parte

  • Redes neuronales. Inspiración biológica. Arquitectura feed forward. Funcionamiento. Cálculo eficiente del gradiente con error backpropagation. Entrenamiento y regularización.
  • Redes neuronales convolucionales. Funcionamiento y ventajas. Filtros, kernels, y feature maps. Interpretabiliadd de las redes convolucionales, y transfer learning.
  • Autoencoders y autoencoders variacionales. Representaciones latentes. Redes Generativas Antagónicas. Redes recurrentes. LSTM y GRU. Aprendizaje por refuerzo.

Docentes

  • Profesor: Rodrigo Díaz. Dr. en física e investigador del CONICET en el ICIFI. Trabaja en el desarrollo de técnicas y algoritmos para la detección y caracterización de planetas extrasolares.
  • JTP: Manuel Szewc. Dr. en física. Trabaja en la implementación de algoritmos de machine learning para el descubrimiento de nueva física usando el LHC.
  • Ayudante: Luis Agustín Nieto. Lic. en Ciencias de la Computación. Estudiante de Doctorado en el ICIFI. Estudia el uso de algoritmos de Deep Learning para detectar exoplanetas en estrellas cercanas.

Información práctica

  • Nivel. Aprendizaje Automático es una materia optativa de grado y posgrado para toda la comunidad de UNSAM.
  • Inscripción. La inscripción se realiza llenando un formulario que se pone a disposición en esta página. Las fechas de inscripción siguen el calendario de la Escuela de Ciencia y Tecnología.
  • Cursada. La cursada es sincrónica, a través de la plataforma Zoom o Google Meet. Las fechas de cursada también se guían por las del calendario de la ECyT.
  • Pre-requisitos. Se requiere un conocimiento básico de programación (se sugiere haber cursado la materia de programación en Python), de análisis matemático (nivel IAM) y de álgrebra lineal. Contar con conocimiento de probabilidad y estadística es ventajoso.
  • Puntaje. La materia provee 6 créditos como materia optativa para las carreras de la ECyT. Para otras carreras, consultar al departamento de alumnos correspondiente.
  • Externos. La inscripción está abierta para personas externas a la UNSAM, pero los cupos son limitados.
Por consultas adicionales, contactar a Elisa Maluf (ECyT).

Bibliografía

  • Bishop, C. M. Pattern Recognition and Machine Learning. Disponible online.
  • Géron, A. Hands-On Machine Learning with Scikit-Learn and TensorFlow.
  • Gregory, P. Bayesian Logical Data Analysis for the Physical Sciences.
  • Jaynes, E.T. Probability Theory. The Logic of Science.
  • Frodesen, A. G., Skjeggestad, O., y Tofte, H. Probability and statistics in Particle Physics.