La prueba de hipótesis se realiza mediante análisis estadístico. La significancia estadística se calculó utilizando el valor p, que indica la magnitud de la probabilidad de los resultados de la investigación, siempre que ciertas afirmaciones (hipótesis cero) sean verdaderas. Si el valor p es menor que el nivel de significancia predeterminado (generalmente 0.05), el investigador puede concluir que la hipótesis nula no es cierta y aceptar la hipótesis alternativa. Con una prueba t simple, puede calcular un valor p y determinar la significancia entre dos conjuntos de datos diferentes.
Paso
Parte 1 de 3: Configuración de experimentos
Paso 1. Establezca una hipótesis
El primer paso para analizar la significación estadística es determinar la pregunta de investigación que desea responder y formular su hipótesis. Una hipótesis es una declaración sobre sus datos experimentales y explica las posibles diferencias en la población de estudio. Para cada experimento, se debe establecer una hipótesis nula y una hipótesis alternativa. Generalmente, comparará dos grupos para ver si son iguales o diferentes.
- La hipótesis nula (H0) generalmente establece que no hay diferencia entre los dos conjuntos de datos. Ejemplo: el grupo de estudiantes que leyó el material antes de que comenzara la clase no obtuvo mejores calificaciones que el grupo que no leyó el material.
- Hipótesis alternativa (Ha) es una afirmación que contradice la hipótesis nula y que está intentando respaldar con datos experimentales. Ejemplo: el grupo de estudiantes que leyó el material antes de la clase obtuvo mejores calificaciones que el grupo que no leyó el material.
Paso 2. Limite el nivel de significancia para determinar qué tan únicos deben ser sus datos para que se consideren significativos
El nivel de significancia (alfa) es el umbral utilizado para determinar la significancia. Si el valor p es menor o igual al nivel de significancia, los datos se consideran estadísticamente significativos.
- Como regla general, el nivel de significancia (alfa) se establece en 0.05, lo que significa que la probabilidad de que ambos grupos de datos sean iguales es solo del 5%.
- Al utilizar un nivel de confianza más alto (valor p más bajo) significa que los resultados experimentales se considerarán más significativos.
- Si desea aumentar el nivel de confianza de sus datos, reduzca el valor p más a 0.01. Los valores p más bajos se usan comúnmente en la fabricación cuando se detectan defectos en el producto. Un alto nivel de confianza es esencial para garantizar que cada pieza fabricada realice su función.
- Para experimentos de prueba de hipótesis, es aceptable un nivel de significancia de 0.05.
Paso 3. Decida utilizar una prueba de una cola o una prueba de dos colas
Una de las suposiciones que se utilizan cuando realiza una prueba t es que sus datos se distribuyen normalmente. Los datos que se distribuyen normalmente formarán una curva de campana con la mayoría de los datos en el medio de la curva. La prueba t es una prueba matemática que se utiliza para ver si sus datos están fuera de la distribución normal, por debajo o por encima de la "cola" de la curva.
- Si no está seguro de que sus datos estén por debajo o por encima del grupo de control, utilice una prueba de dos colas. Esta prueba verificará la importancia de ambas direcciones.
- Si conoce la dirección de la tendencia de sus datos, utilice una prueba unilateral. Usando el ejemplo anterior, esperaba que la calificación de un estudiante aumentara. Por lo tanto, debe utilizar una prueba de una cola.
Paso 4. Determine el tamaño de la muestra mediante análisis de potencia estadístico de prueba
El poder de las estadísticas de prueba es la probabilidad de que una determinada prueba estadística pueda dar el resultado correcto, con un cierto tamaño de muestra. El umbral de potencia de prueba (o) es del 80%. El análisis de la fuerza de una prueba estadística puede ser complicado sin datos preliminares porque necesitará información sobre la media estimada de cada conjunto de datos y su desviación estándar. Utilice la calculadora de análisis de potencia de prueba estadística en línea para determinar el tamaño de muestra óptimo para sus datos.
- Los investigadores generalmente realizan estudios piloto como material para el análisis de fuerza de las pruebas estadísticas y como base para determinar el tamaño de muestra necesario para estudios más amplios y completos.
- Si no tiene los recursos para realizar un estudio piloto, calcule la media basándose en la literatura y otras investigaciones que se hayan realizado. Este método proporcionará información para determinar el tamaño de la muestra.
Parte 2 de 3: Cálculo de la desviación estándar
Paso 1. Utilice la fórmula de desviación estándar
La desviación estándar (también conocida como desviación estándar) es una medida de la distribución de sus datos. La desviación estándar proporciona información sobre la similitud de cada punto de datos en su muestra. Al principio, la ecuación de desviación estándar puede parecer complicada, pero los pasos a continuación ayudarán con su proceso de cálculo. La fórmula de la desviación estándar es s = ((xI -)2/ (N - 1)).
- s es la desviación estándar.
- significa que debe sumar todos los valores de muestra que ha recopilado.
- XI representa todos los valores individuales de sus puntos de datos.
- es el promedio de los datos de cada grupo.
- N es el número de sus muestras.
Paso 2. Calcule la media muestral en cada grupo
Para calcular la desviación estándar, primero debe calcular la media de la muestra en cada conjunto de datos. El promedio se denota con la letra griega mu o. Para hacer esto, sume todos los valores de puntos de datos de muestra y divídalos por el número de sus muestras.
- Por ejemplo, para obtener el puntaje promedio del grupo de estudiantes que leyeron el material antes de la clase, veamos los datos de muestra. Para simplificar, usaremos 5 puntos de datos: 90, 91, 85, 83 y 94.
- Sume todos los valores de muestra: 90 + 91 + 85 + 83 + 94 = 443.
- Dividir por el número de muestras, N = 5: 443/5 = 88, 6.
- La puntuación media de este grupo fue de 88,6.
Paso 3. Reste cada valor de punto de datos de muestra por el valor promedio
El segundo paso es completar la parte (xI -) ecuación. Reste cada valor de punto de datos de muestra de la media precalculada. Continuando con el ejemplo anterior, tienes que hacer cinco restas.
- (90 - 88, 6), (91 - 88, 6), (85 - 88, 6), (83 - 88, 6) y (94 - 88, 6).
- Los valores obtenidos son 1, 4, 2, 4, -3, 6, -5, 6 y 5, 4.
Paso 4. Eleve al cuadrado cada valor obtenido y súmelos todos
Eleve al cuadrado cada valor que acaba de calcular. Este paso eliminará los números negativos. Si hay un valor negativo después de realizar este paso o el tiempo después de que se hayan realizado todos los cálculos, es posible que haya olvidado este paso.
- Usando el ejemplo anterior, obtenemos los valores 1, 96, 5, 76, 12, 96, 31, 36 y 29.16.
- Sume todos los valores: 1, 96 + 5, 76 + 12, 96 + 31, 36 + 29, 16 = 81, 2.
Paso 5. Divida por el número de muestras menos 1
La fórmula expresa N - 1 como un ajuste porque no está contando toda la población; Solo toma una muestra de la población para hacer una estimación.
- Restar: N - 1 = 5 - 1 = 4
- Dividir: 81, 2/4 = 20, 3
Paso 6. Calcula la raíz cuadrada
Después de dividir por el número de muestras menos uno, calcule la raíz cuadrada del valor final. Este es el paso final para calcular la desviación estándar. Existen varios programas estadísticos que pueden calcular la desviación estándar después de haber ingresado los datos sin procesar.
Por ejemplo, la desviación estándar de las puntuaciones para el grupo de estudiantes que leyeron el material antes de que comience la clase es: s = √20, 3 = 4, 51
Parte 3 de 3: Determinación de la importancia
Paso 1. Calcule la varianza entre los dos grupos de muestra
En el ejemplo anterior, solo calculamos la desviación estándar de un grupo. Si desea comparar dos grupos, debe tener datos de los dos grupos. Calcule la desviación estándar del segundo grupo y use los resultados para calcular la varianza entre los dos grupos en el experimento. La fórmula de la varianza es sD = ((s1/NORTE1) + (s2/NORTE2)).
- sD es la varianza intergrupal.
- s1 es la desviación estándar del grupo 1 y N1 es el número de muestras en el grupo 1.
- s2 es la desviación estándar del grupo 2 y N2 es el número de muestras en el grupo 2.
-
Por ejemplo, los datos del grupo 2 (estudiantes que no leen el material antes de que comience la clase) tienen un tamaño de muestra de 5 con una desviación estándar de 5,81. Entonces la variante:
- sD = ((s1)2/NORTE1) + ((s2)2/NORTE2))
- sD = √(((4.51)2/5) + ((5.81)2/5)) = √((20.34/5) + (33, 76/5)) = √(4, 07 + 6, 75) = √10, 82 = 3, 29.
Paso 2. Calcule el valor de la prueba t de sus datos
El valor de la prueba t le permitirá comparar un grupo de datos con otro grupo de datos. El valor t le permite realizar una prueba t para determinar en qué medida la probabilidad de que los dos grupos de datos que se comparan sean significativamente diferentes. La fórmula para el valor de t es: t = (µ1 -2)/sD.
- ️1 es la media del primer grupo.
- ️2 es el valor medio del segundo grupo.
- sD es la varianza entre las dos muestras.
- Utilice la media más grande como1 para que no obtenga valores negativos.
- Por ejemplo, la puntuación media del grupo 2 (estudiantes que no leen) es 80. El valor t es: t = (µ1 -2)/sD = (88, 6 – 80)/3, 29 = 2, 61.
Paso 3. Determine los grados de libertad de la muestra
Cuando se usa el valor t, los grados de libertad están determinados por el tamaño de la muestra. Sume el número de muestras de cada grupo y luego reste dos. Por ejemplo, los grados de libertad (d.f.) son 8 porque hay cinco muestras en el primer grupo y cinco muestras en el segundo grupo ((5 + 5) - 2 = 8).
Paso 4. Utilice la Tabla t para determinar la importancia
Las tablas de valores t y grados de libertad se pueden encontrar en libros de estadísticas estándar o en línea. Mire la fila que muestra los grados de libertad que seleccionó para sus datos y encuentre el valor p apropiado para el valor t derivado de sus cálculos.
Con grados de libertad de 8 d.f. y el valor t de 2.61, el valor p para la prueba de una cola está entre 0.01 y 0.025. Dado que usamos un nivel de significancia menor o igual a 0.05, los datos que usamos demuestran que los dos grupos de datos son significativamente diferente, significativo. Con estos datos, podemos rechazar la hipótesis nula y aceptar la hipótesis alternativa: el grupo de estudiantes que leyeron el material antes de que comenzara la clase puntuaron mejor que el grupo de estudiantes que no leyeron el material
Paso 5. Considere hacer un estudio de seguimiento
Muchos investigadores realizan pequeños estudios piloto para ayudarlos a comprender cómo diseñar estudios más grandes. Hacer más investigaciones con más mediciones aumentará su confianza en sus conclusiones.