Máquinas de Soporte Vectorial

Máquinas de Soporte Vectorial
Concepto:Las Máquinas de Soporte Vectorial (MSV), pertenecen a la familia de clasificadores lineales. Mediante una función matemática denominada kernel. Realizan un mapeo de los vectores de entrada para determinar la linealidad o no de los casos los cuales serán integrados a los Multiplicadores de Lagrange para minimizar el Riesgo Empírico y la Dimensión de Vapnik-Chervonenkis

Máquinas de soporte Vectorial, Suporter Vector Machine en inglés, son una moderna y efectiva técnica de IA, aplicada fundamentalmente al procesamiento de grandes cantidades de información.

Surgimiento

En épocas históricas, donde los intentos resultaban prematuros en relación a la tecnología disponible, podemos considerar que el camino hacia la construcción de máquinas inteligentes comienza en la Segunda Guerra Mundial, con el diseño de ordenadores analógicos ideados para controlar cañones antiaéreos o para la navegación. A partir de 1937 comienza el desarrollo de las primeras computadoras como la Máquina de Turing hasta llegar a 1957 donde A. Newell, H. Simon y J. Shaw presentaron el primer programa capaz de razonar sobre temas arbitrarios. Hacia 1960 John McCarthy, acuña el término de inteligencia artificial, para definir los métodos algorítmicos capaces de simular el pensamiento humano en los ordenadores.
Entre los métodos teóricos más utilizados están las Redes Neuronales Artificiales (RNA). Las RNA se han integrado dentro de los métodos ya clásicos del análisis de las relaciones cuantitativas entre la estructura y la actividad biológica u otras propiedades. Constituyen una de las áreas de la inteligencia artificial que ha despertado mayor interés en los últimos años. La razón principal es que potencialmente son capaces de resolver problemas cuya solución por otros métodos convencionales resulta extremadamente difícil dada su capacidad de aprender. Estos modelos de aprendizaje se clasifican en: Híbridos, Supervisados, No Supervisados y Reforzados. Dentro de los Supervisados se encuentra la técnica: Máquinas de Soporte Vectorial (MSV). Las MSV son un paradigma aparte de la Redes Neuronales, pero a pesar de tener similitudes están mejor fundamentadas en la teoría y tienen mucho mejor capacidad de generalización.
En la actualidad, las Máquinas de Soporte Vectorial pueden ser utilizadas para resolver problemas tanto de clasificación como de regresión. Algunas de las aplicaciones de clasificación o reconocimiento de patrones son: reconocimiento de firmas, reconocimiento de imágenes como rostros y categorización de textos. Por otro lado, las aplicaciones de regresión incluyen predicción de series de tiempo y problemas de inversión en general.

Inteligencia Artificial

Se denomina Inteligencia Artificial (IA) a la rama de la informática que desarrolla procesos que imitan a la inteligencia de los seres vivos. La principal aplicación de esta ciencia es la creación de máquinas para la automatización de tareas que requieran un comportamiento inteligente. Este es uno entre los más sencillos conceptos de IA enmarcado fundamentalmente al enfoque informático.
Ejemplo de técnicas:

  • Redes Neuronales.
  • Lógica Difusa.
  • Algoritmos Genéticos.
  • Máquinas de Soporte Vectorial.


Una de las más novedosas y efectivas técnicas de IA, aplicada fundamentalmente al procesamiento de grandes cantidades de información, son las Máquinas de Soporte Vectorial.

Máquinas de Soporte Vectorial

Las Máquinas de Soporte Vectorial (MSV) son una moderna y efectiva técnica de IA, que ha tenido un formidable desarrollo en los últimos años, a continuación se presentarán los fundamentos teóricos que definen estos sistemas de aprendizaje.
Uno de los conceptos fundamentales en esta técnica es el algoritmo Vector de Soporte (VS) es una generalización no-lineal del algoritmo Semblanza Generalizada, desarrollado en la Rusia en los años sesenta. El desarrollo de los VS trae consigo el surgimiento de las Máquinas de Soporte Vectorial. Estas son sistemas de aprendizaje que usan un espacio de hipótesis de funciones lineales en un espacio de rasgos de mayor dimensión, entrenadas por un algoritmo proveniente de la teoría de optimización.
La Minimización del Riesgo Empírico y la [[Dimensión de Vapnik-Chervonenkis]] son fundamentales en las Máquinas de Soporte Vectorial. Dicho de manera más sencilla el algoritmo se enfoca en el problema general de aprender a discriminar entre miembro positivos y negativos de una clase de vectores de n-dimensional dada. Las MSV pertenecen a la familia de clasificadores lineales. Mediante una función matemática denominada kernel, los datos originales se redimensionan para buscar una separabilidad lineal de los mismos. Una característica de las MSV es que realiza un mapeo de los vectores de entrada para determinar la linealidad o no de los casos los cuales serán integrados a los Multiplicadores de Lagrange para minimizar el Riesgo Empírico y la Dimensión de Vapnik-Chervonenkis. De manera general, las Máquinas de Soporte Vectorial permiten encontrar un hiperplano óptimo que separe las clases.

Kernel

Las funciones kernel son funciones matemáticas que se emplean en las Máquinas de Soporte Vectorial. Estas funciones son las que le permiten convertir lo que sería un problema de clasificación no-lineal en el espacio dimensional original, a un sencillo problema de clasificación lineal en un espacio dimensional mayor.

Máquina de Soporte Vectorial para Clasificación

Entre las aplicaciones más relevantes de las MSV se encuentra la Clasificación, el problema de la clasificación puede reducirse a examinar dos clases sin pérdida de generalidad. La tarea es encontrar un clasificador que funcione bien en datos futuros, es decir que generalice bien la clasificación.

Tipos de Máquinas de Soporte Vectorial para la clasificación

Dentro de las máquinas de soporte vectorial para la clasificación se encuentran:

  • C_SVC.
  • nu-SVC.
  • one_class.

Máquina de Soporte Vectorial para Regresión

Las MSV se desarrollaron inicialmente para solucionar problemas de clasificación, pero se han ampliado para problemas de regresión. Los resultados finales a los que se puede arribar luego del empleo de las MSV pueden ser cualitativos o cuantitativos, para el análisis cuantitativo se emplean MSV para regresión. Dicho método es una extensión del anteriormente explicado donde se incluyen los estimadores de rangos. El empleo de estos determinan los valores que tienen ruido dentro de la predicción a través de funciones de pérdida, donde los primeros pasos en este sentido se dieron por Tuckey quien demostró que, en situaciones reales, se desconoce el modelo del ruido y dista de las distribuciones supuestas. A raíz de esto, Huber crea el concepto de estimadores robustos los cuales están determinados por funciones de pérdida. En la actualidad, las más utilizadas son: las funciones de pérdida cuadrática y lineal, y la de Huber, entre otras. En este tipo de técnicas, su estructura se determina sobre la base del conjunto de entrenamiento necesitándose pocos parámetros para el mismo. Dicho entrenamiento se reduce a la solución de un problema de optimización que se reduce a un problema de programación cuadrática. Al mismo tiempo, el uso de las funciones Kernels muestra una gran eficiencia en el resultado de la predicción.

Tipos de Máquinas de Soporte Vectorial para la regresión

  • Epsilon_SVR.
  • NU_SVR.

Softwares vinculados a las Máquinas de Soporte Vectorial a nivel mundial

Weka

El software llamado Weka (Entorno para Análisis del Conocimiento de la Universidad de Waikato) es un conocido software para aprendizaje automático y minería de datos escrito en Java y desarrollado en la Universidad de Waikato. Weka es una colección de algoritmos de aprendizaje automático para la extracción de datos tareas. Los algoritmos pueden ser aplicados directamente a un conjunto de datos o llamar desde su propio código Java. Weka contiene herramientas para los datos de pre-procesamiento, clustering, reglas de asociación, y la visualización, así como clasificación, regresión usando las Máquinas de Soporte Vectorial. También es muy adecuado para el desarrollo de nuevos planes de aprendizaje máquina.

Librería SVM

LIBSVM es un software integrado para la clasificación por vectores de soporte, (C-SVC, nu-SVC), para la regresión (Epsilon-SVR, nu-SVR) y la estimación de la distribución (una clase SVM). Soporta multi-clasificación de clase. [22]

Fuente

  • RESENDIZ, J. A. Las Máquinas de Soporte Vectorial para identificación en Linea. Maestria, Control Automático. Instituto Politecnico Nacional, 2006.
This article is issued from Ecured. The text is licensed under Creative Commons - Attribution - Sharealike. Additional terms may apply for the media files.