Lista de temas que se abarcarán en el primer parcial
Introducción
- Motivación con respecto a PLN
- Dos enfoques del PLN (racionalista vs empirista)
- Áreas de aplicación (SRI, Web Semántica, Desambiguación, Búsqueda de respuestas)
- Corpus, Corpora, palabras, palabras cerradas
- Frecuencias y probabilidad de palabras
- Complejidad del texto (Herdan, 1960)
- Ley de Zipf
- Formula de Mandelbrot
- Distancia de Kullback-Leibler
Fundamentos de matemáticas
- Probabilidad a priori
- Probabilidad a posteriori (condicional)
- Teorema de Bayes
- Clasificador de Naïve Bayes
- Clasificador simple basado en centroides
- Esperanza, Varianza y desviación estándar
- Estimación de modelos (General)
- Estadística frecuentista paramétrica
- Estimación de parámetros (Binomial, Gaussiana)
- Estimación de modelos mediante estadística paramétrica basada en distribuciones de probabilidad conocidas
- Estimador de máxima verosimilitud
- Estadística frecuentista no paramétrica
- Estadística Bayesiana
- Clasificador de Naïve Bayes para SPAM
- Teoría de la información
- Entropía (H)
- Entropía condicional
- Entropía conjunta
- Información mutua
- Perplejidad (2H)