¿Cómo se puede comprobar la normalidad en los datos de Machine Learning?
La normalidad es una suposición importante para muchos algoritmos de aprendizaje automático, especialmente aquellos que se basan en la inferencia estadística, como la regresión lineal, el ANOVA o las pruebas t. La normalidad significa que los datos siguen una distribución normal, también conocida como curva de campana, donde la mayoría de los valores se agrupan alrededor de la media y las colas son simétricas. Las pruebas de normalidad pueden ayudarte a elegir el algoritmo adecuado, transformar tus datos o validar tus resultados. En este artículo, aprenderá a probar la normalidad en los datos de Machine Learning mediante tres métodos comunes: gráfico, numérico y estadístico.