Máquina de soporte vectorial(SVM)
(Extraido de: [1] "Python Machine Learning - Capitulo 3")
Introducción
El método de clasificación-regresión Máquinas de Vector Soporte (Vector Support Machines, SVMs) fue desarrollado en la década de los 90, dentro de campo de la ciencia computacional. Si bien originariamente se desarrolló como un método de clasificación binaria, su aplicación se ha extendido a problemas de clasificación múltiple y regresión. SVMs ha resultado ser uno de los mejores clasificadores para un amplio abanico de situaciones, por lo que se considera uno de los referentes dentro del ámbito de aprendizaje estadístico y machine learning.
Las Máquinas de Vector Soporte se fundamentan en el Maximal Margin Classifier, que a su vez, se basa en el concepto de hiperplano. A lo largo de este ensayo se introducen por orden cada uno de estos conceptos. Comprender los fundamentos de las SVMs requiere de conocimientos sólidos en álgebra lineal.
Características
- Ofrece una precisión muy alta en comparación con otros clasificadores como la Regresión Logística y los Árboles de Decisión.
- Se utiliza una variedad de aplicaciones tales como detección de rostros, detección de intrusos, clasificación de correos electrónicos, artículos de noticias y páginas web, entre otros.
La máquina de soporte vectorial
Es un algoritmo de aprendizaje potente y ampliamente utilizado que puede considerarse una extensión del perceptrón, usando el algoritmo del perceptrón, minimizamos los errores de clasificación. Pero, en las SVM nuestro objetivo de optimización es maximizar el margen.
Vectores de Soporte: son los puntos de datos más cercanos al hiperplano.
Hiperplano: Es un plano de decisión que separa entre un conjunto de objetos.
Margen: Es un espacio entre las dos líneas en los puntos más cercanos de la clase.
¿Qué es el margen?
Intuición de margen máximo
- La razón de tener límites de decisión con márgenes grandes es que tienden a tener menor error de generalización.
- Los modelos con márgenes pequeños son más propensos al sobreajuste.
Abordando el caso no linealmente separable mediante variables de holgura
¿Por qué introducir una variable de holgura?
Regresión logística frente a SVM
Bibliografía:
Comentarios
Publicar un comentario