Saltar al contenido

Regresión lineal vs regresión logística

septiembre 23, 2021
linear regression vs logistic regression

La regresión lineal y la regresión logística son los dos famosos algoritmos de aprendizaje automático que se encuentran bajo la técnica de aprendizaje supervisado. Dado que ambos algoritmos son de naturaleza supervisada, estos algoritmos utilizan conjuntos de datos etiquetados para hacer las predicciones. Pero la principal diferencia entre ellos es cómo se utilizan. La regresión lineal se usa para resolver problemas de regresión, mientras que la regresión logística se usa para resolver los problemas de clasificación. La descripción de ambos algoritmos se proporciona a continuación junto con la tabla de diferencias.

regresión inear vs regresión logística

Regresión lineal:

  • La regresión lineal es uno de los algoritmos de aprendizaje automático más simples que se incluye en la técnica de aprendizaje supervisado y se utiliza para resolver problemas de regresión.
  • Se utiliza para predecir la variable dependiente continua con la ayuda de variables independientes.
  • El objetivo de la regresión lineal es encontrar la línea de mejor ajuste que pueda predecir con precisión el resultado de la variable dependiente continua.
  • Si se utiliza una única variable independiente para la predicción, se denomina Regresión lineal simple y si hay más de dos variables independientes, dicha regresión se denomina Regresión lineal múltiple.
  • Al encontrar la línea de mejor ajuste, el algoritmo establece la relación entre la variable dependiente y la variable independiente. Y la relación debe ser de naturaleza lineal.
  • La salida para la regresión lineal debe ser solo los valores continuos como precio, edad, salario, etc. La relación entre la variable dependiente y la variable independiente se puede mostrar en la siguiente imagen:

regresión inear vs regresión logística

En la imagen de arriba, la variable dependiente está en el eje Y (salario) y la variable independiente está en el eje X (experiencia). La línea de regresión se puede escribir como:

Donde un0 y un1 son los coeficientes y ε es el término de error.

Regresión logística:

  • La regresión logística es uno de los algoritmos de aprendizaje automático más populares que se incluye en las técnicas de aprendizaje supervisado.
  • Puede utilizarse tanto para problemas de clasificación como para problemas de regresión, pero se utiliza principalmente para problemas de clasificación.
  • La regresión logística se utiliza para predecir la variable dependiente categórica con la ayuda de variables independientes.
  • La salida del problema de regresión logística solo puede estar entre 0 y 1.
  • La regresión logística se puede utilizar cuando se requieren las probabilidades entre dos clases. Por ejemplo, si lloverá hoy o no, 0 o 1, verdadero o falso, etc.
  • La regresión logística se basa en el concepto de estimación de máxima verosimilitud. Según esta estimación, los datos observados deberían ser los más probables.
  • En la regresión logística, pasamos la suma ponderada de las entradas a través de una función de activación que puede mapear valores entre 0 y 1. Dicha función de activación se conoce como función sigmoidea y la curva obtenida se denomina curva sigmoidea o curva en S. Considere la siguiente imagen:

regresión inear vs regresión logística

  • La ecuación para la regresión logística es:

regresión inear vs regresión logística

Diferencia entre regresión lineal y regresión logística:

Regresión lineal Regresión logística
La regresión lineal se usa para predecir la variable dependiente continua usando un conjunto dado de variables independientes. La regresión logística se usa para predecir la variable dependiente categórica usando un conjunto dado de variables independientes.
La regresión lineal se utiliza para resolver el problema de regresión. La regresión logística se utiliza para resolver problemas de clasificación.
En la regresión lineal, predecimos el valor de las variables continuas. En Regresión logística, predecimos los valores de variables categóricas.
En la regresión lineal, encontramos la línea de mejor ajuste, mediante la cual podemos predecir fácilmente la salida. En Regresión logística, encontramos la curva S mediante la cual podemos clasificar las muestras.
El método de estimación de mínimos cuadrados se utiliza para estimar la precisión. El método de estimación de máxima verosimilitud se utiliza para estimar la precisión.
El resultado de la regresión lineal debe ser un valor continuo, como precio, antigüedad, etc. La salida de Regresión logística debe ser un valor categórico como 0 o 1, Sí o No, etc.
En la regresión lineal, se requiere que la relación entre la variable dependiente y la variable independiente sea lineal. En la regresión logística, no se requiere tener la relación lineal entre la variable dependiente y la independiente.
En la regresión lineal, puede haber colinealidad entre las variables independientes. En regresión logística, no debe haber colinealidad entre la variable independiente.

close