in

Pruebas estadísticas: ¿cuándo usarlas?

1Zu0iou9DD zIZSOZjsUeEA

Pruebas estadísticas: ¿cuándo usarlas?

vibhor nigam

vibhor nigam

1 de abril de 2018·8 min de lectura

Para una persona que no tiene antecedentes estadísticos, el aspecto más confuso de las estadísticas son siempre las pruebas estadísticas fundamentales, y cuándo usar cuáles. Esta publicación de blog es un intento de marque la diferencia entre las pruebas más comunes, el uso de la hipótesis de valor nulo en estas pruebas y describa las condiciones bajo las cuales se debe usar una prueba en particular.

Hipótesis y pruebas nulas

Antes de aventurarnos en la diferencia seatEn diferentes pruebas, necesitamos formular una comprensión clara de lo que es una hipótesis nula. Una hipótesis nula, propone que no existe una diferencia significativa en un conjunto de observaciones dadas. A los efectos de estas pruebas en general

Nulo: Dadas dos medias muestrales son iguales

Alterno: Dadas dos medias muestrales no son iguales

Para rechazar una hipótesis nula, se calcula una estadística de prueba. Esta estadística de prueba se compara luego con un valor crítico y si se encuentra que es mayor que el valor crítico, la hipótesis se rechaza. «En los fundamentos teóricos, las pruebas de hipótesis se basan en la noción de regiones críticas: la hipótesis nula se rechaza si el estadístico de la prueba cae en la región crítica.. Los valores críticos son los límites de la región crítica. Si la prueba es unilateral (como una prueba de χ2 o una prueba t de un solo lado), solo habrá un valor crítico, pero en otros casos (como una prueba t de dos lados) habrá dos ”.[1]

Valor crítico

Un valor crítico es un punto (o puntos) en la escala del estadístico de prueba más allá del cual rechazamos la hipótesis nula, y se deriva del nivel de significancia α de la prueba. El valor crítico puede decirnos cuál es la probabilidad de que dos medias muestrales pertenezcan a la misma distribución. Más alto, el valor crítico significa más baja la probabilidad de que dos muestras pertenezcan a la misma distribución. El valor crítico general para una prueba de dos colas es 1,96, cual es basado en el hecho de que 95% del área de una distribución normal está dentro de 1,96 desviaciones estándar de la media.

Los valores críticos se pueden utilizar para realizar pruebas de hipótesis de la siguiente manera

1. Calcule la estadística de prueba

2. Calcular valores críticos basados ​​en el nivel de significancia alfa.

3. Compare la estadística de prueba con los valores críticos.

Si el estadístico de la prueba es menor que el valor crítico, acepte la hipótesis o rechace la hipótesis.. Para ver cómo calcular un valor crítico en detalle, verifique

Antes de seguir adelante con diferentes pruebas estadísticas, es imperativo comprender la diferencia entre una muestra y una población.

En estadisticas «población» se refiere al conjunto total de observaciones que se pueden realizar. Por ejemplo, si queremos calcular la altura promedio de los humanos presentes en la tierra, «población» será el «número total de personas realmente presentes en la tierra».

A muestra, por otro lado, es un conjunto de datos recopilados / seleccionados de un procedimiento predefinido. Para nuestro ejemplo anterior, será un pequeño grupo de personas seleccionadas al azar de algunas partes de la tierra.

Para sacar inferencias de una muestra validando una hipótesis es necesario que la muestra sea aleatoria.

Por ejemplo, en nuestro ejemplo anterior, si seleccionamos personas al azar de todas las regiones (Asia, América, Europa, África, etc.) en la tierra, nuestra estimación será cercana a la estimación real y se puede suponer como una media de la muestra, mientras que si haga una selección, digamos solo de los Estados Unidos, entonces nuestra estimación de altura promedio no será precisa, sino que solo representará los datos de una región en particular (Estados Unidos). Esta muestra se denomina entonces muestra sesgada y no es representativa de la «población».

Otro aspecto importante a comprender en estadística es «distribución». Cuando la «población» es infinitamente grande, es improbable validar cualquier hipótesis calculando el valor medio o los parámetros de prueba en toda la población. En tales casos, se supone que una población tiene algún tipo de distribución.

Las formas más comunes de distribuciones son Binomial, Poisson y Discreto. Sin embargo, hay muchos otros tipos que se mencionan en detalle en

Distribuciones estadísticas

valores discretos o si los datos son continuos; si un nuevo medicamento farmacéutico obtiene la aprobación de la FDA o no es un…

people.stern.nyu.edu

La determinación del tipo de distribución es necesaria para determinar el valor crítico y la prueba a elegir para validar cualquier hipótesis.

Ahora, cuando tengamos claro población, muestra y distribución podemos avanzar para comprender los diferentes tipos de prueba y los tipos de distribución para los que se utilizan.

Relación entre valor p, valor crítico y estadístico de prueba

Como sabemos, el valor crítico es un punto más allá del cual rechazamos la hipótesis nula. Por otro lado, el valor p se define como la probabilidad a la derecha de la estadística respectiva (Z, T o chi). El beneficio de usar el valor p es que calcula una estimación de probabilidad, podemos probar en cualquier nivel de significancia deseado comparando esta probabilidad directamente con el nivel de significancia.

Por ejemplo, suponga que el valor Z de un experimento en particular resulta ser 1,67, que es mayor que el valor crítico al 5%, que es 1,64. Ahora, para verificar un nivel de significancia diferente del 1%, se debe calcular un nuevo valor crítico.

Sin embargo, si calculamos el valor p para 1,67, será 0,047. Podemos usar este valor p para rechazar la hipótesis a un nivel de significancia del 5% desde 0.047 <0.05. Pero con un nivel de significancia más estricto del 1% se aceptará la hipótesis ya que 0.047> 0.01. Un punto importante a tener en cuenta aquí es que no se requiere un doble cálculo.

Prueba Z

En una prueba z, se supone que la muestra tiene una distribución normal. Se calcula una puntuación z con parámetros de población como «Población media» y «desviación estándar de población» y se utiliza para validar una hipótesis de que la muestra extraída pertenece a la misma población.

Nulo: La media de la muestra es la misma que la media de la población

Alterno: La media de la muestra no es la misma que la media de la población

Las estadísticas utilizadas para esta prueba de hipótesis se denominan estadística z, cuya puntuación se calcula como

z = (x – μ) / (σ / √n), dónde

x = media muestral

μ = media de la población

σ / √n = desviación estándar de la población

Si el estadístico de la prueba es menor que el valor crítico, acepte la hipótesis o rechace la hipótesis.

Prueba t

Se usa una prueba t para comparar la media de dos muestras dadas. Al igual que una prueba z, una prueba t también asume una distribución normal de la muestra. Se utiliza una prueba t cuando se desconocen los parámetros de la población (media y desviación estándar).

Hay tres versiones de la prueba t

1. Prueba t de muestras independientes que compara la media de dos grupos

2. Prueba t de muestras pareadas que compara medias del mismo grupo en diferentes momentos

3. Prueba t de una muestra que compara la media de un solo grupo con una media conocida.

El estadístico para esta prueba de hipótesis se llama estadístico t, cuya puntuación se calcula como

t = (x1 – x2) / (σ / √n1 + σ / √n2), dónde

x1 = media de la muestra 1

x2 = media de la muestra 2

n1 = tamaño de la muestra 1

n2 = tamaño de la muestra 2

Hay múltiples variaciones de la prueba t que se explican en detalle aquí.

Prueba T (prueba T de Student): definición y ejemplos

Contenido: La prueba t (también llamada prueba T de Student) compara dos promedios (medias) y le indica si son diferentes …

www.statisticshowto.com

ANOVA

ANOVA, también conocido como análisis de varianza, se usa para comparar múltiples (tres o más) muestras con una sola prueba.. Hay 2 sabores principales de ANOVA

1. ANOVA de una vía: se utiliza para comparar la diferencia entre las tres o más muestras / grupos de una sola variable independiente.

2. MANOVA: MANOVA nos permite probar el efecto de una o más variables independientes sobre dos o más variables dependientes. Además, MANOVA también puede detectar la diferencia en la correlación entre las variables dependientes dados los grupos de variables independientes.

La hipótesis que se está probando en ANOVA es

Nulo: Todos los pares de muestras son iguales, es decir, todas las medias de las muestras son iguales

Alterno: Al menos un par de muestras es significativamente diferente

Las estadísticas utilizadas para medir la significancia, en este caso, se denominan estadísticas F. El valor F se calcula mediante la fórmula

F = ((SSE1 – SSE2) / m) / SSE2 / nk, dónde

SSE = suma residual de cuadrados

m = número de restricciones

k = número de variables independientes

Hay varias herramientas disponibles como SPSS, paquetes R, Excel, etc. para realizar ANOVA en una muestra determinada.

Prueba de chi-cuadrado

La prueba de chi-cuadrado se utiliza para comparar variables categóricas. Hay dos tipos de prueba de chi-cuadrado

1. Prueba de bondad de ajuste, que determina si una muestra coincide con la población.

2. Se utiliza una prueba de ajuste de chi-cuadrado para dos variables independientes para comparar dos variables en una tabla de contingencia para verificar si los datos se ajustan.

una. Un valor pequeño de chi-cuadrado significa que los datos se ajustan

B. Un valor alto de chi-cuadrado significa que los datos no encajan.

La hipótesis que se está probando para chi-cuadrado es

Nulo: Variable A y Variable B son independientes

Alterno: Variable A y Variable B no son independientes.

La estadística utilizada para medir la significancia, en este caso, se llama estadística de chi-cuadrado. La fórmula utilizada para calcular la estadística es

Χ2 = Σ [ (Or,c — Er,c)2 / Er,c ] dónde

O, c = recuento de frecuencias observadas en el nivel r de Variable A y nivel C de la variable B

Er, c = recuento de frecuencia esperado en el nivel r de Variable A y nivel C de la variable B

Nota: Como se puede ver en los ejemplos anteriores, en todas las pruebas se compara una estadística con un valor crítico para aceptar o rechazar una hipótesis. Sin embargo, el estadístico y la forma de calcularlo difieren según el tipo de variable, el número de muestras que se analizan y si se conocen los parámetros de la población. Por tanto, dependiendo de tales factores, se elige una prueba adecuada y una hipótesis nula.

Este es el punto más importante que he señalado, en mis esfuerzos por aprender sobre estas pruebas y encontrarlo fundamental en mi comprensión de estos conceptos estadísticos básicos.

Descargo de responsabilidad

Esta publicación se centra principalmente en datos distribuidos normalmente. La prueba Z y la prueba t también se pueden usar para datos que no están distribuidos normalmente si el tamaño de la muestra es mayor que 20, sin embargo, existen otros métodos preferibles para usar en tal situación. Por favor visita http://www.statisticshowto.com/probability-and-statistics/non-normal-distributions/ para obtener más información sobre las pruebas para distribuciones anormales.

Referencia

  1. https://math.stackexchange.com/questions/281940/what-is-a-critical-value-in-statistics
  2. http://www.statisticshowto.com/probability-and-statistics/t-test/

2. http://blog.minitab.com/blog/adventures-in-statistics-2/understanding-analysis-of-variance-anova-and-the-f-test

3. http://www.statisticshowto.com/p-value/

4. http://www.statisticshowto.com/probability-and-statistics/chi-square/

5. http://stattrek.com/chi-square-test/independence.aspx?Tutorial=AP

6. https://www.investopedia.com/terms/n/null_hypothesis.asp

7. https://math.stackexchange.com/questions/1732178/help-understanding-difference-in-p-value-critical-value-results

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

gxJ5ayE29y27zw3dDeGpdf 1200 80

Elegir el mejor navegador web en 2021

OPERA Cloud Property Management – Hotel PMS