Intervalo de confianza para la media y diferencia de medias. Muestras grandes.
Si s12 y s22 son las medias y las varianzas de dos muestras aleatorias de tamaño n1 y n2, respectivamente, tomadas de dos poblaciones normales e independientes con varianzas desconocidas pero iguales, entonces un intervalo de confianza del 100() por ciento para la diferencia entre medias es:
en donde:
es el estimador combinado de la desviación estándar común de la población con n1+n2 – 2 grados de libertad.
Ejemplos:
- Un artículo publicado dio a conocer los resultados de un análisis del peso de calcio en cemento estándar y en cemento contaminado con plomo. Los niveles bajos de calcio indican que el mecanismo de hidratación del cemento queda bloqueado y esto permite que el agua ataque varias partes de una estructura de cemento. Al tomar diez muestras de cemento estándar, se encontró que el peso promedio de calcio es de 90 con una desviación estándar de 5; los resultados obtenidos con 15 muestras de cemento contaminado con plomo fueron de 87 en promedio con una desviación estándar de 4. Supóngase que el porcentaje de peso de calcio está distribuido de manera normal. Encuéntrese un intervalo de confianza del 95% para la diferencia entre medias de los dos tipos de cementos. Por otra parte, supóngase que las dos poblaciones normales tienen la misma desviación estándar.
- Se realizó un experimento para comparar el tiempo promedio requerido por el cuerpo humano para absorber dos medicamentos, A y B. Suponga que el tiempo necesario para que cada medicamento alcance un nivel específico en el torrente sanguíneo se distribuye normalmente. Se eligieron al azar a doce personas para ensayar cada fármaco registrándose el tiempo en minutos que tardó en alcanzar un nivel específico en la sangre. Calcule un intervalo de confianza del 95% para la diferencia del tiempo promedio. Suponga varianzas iguales.
Solución:El estimador combinado de la desviación estándar es:
Al calcularle raíz cuadrada a este valor nos queda que sp = 4.41
expresión que se reduce a – 0.72 1-2 6.72
Nótese que el intervalo de confianza del 95% incluye al cero; por consiguiente, para este nivel confianza, no puede concluirse la existencia de una diferencia entre las medias.
Medicamento A | Medicamento B |
nA = 12 | nB = 12 |
SA2= 15.57 | SB2 = 17.54 |
Solución:
2.35 B-A 9.25
Con un nivel confianza del 95% se sabe que el tiempo promedio para alcanzar un nivel específico es mayor para el medicamento B.Las situaciones que más prevalecen e implican pruebas sobre dos medias son las que tienen varianzas desconocidas. Si el científico prueba mediante una prueba F, que las varianzas de las dos poblaciones son iguales, se utiliza la siguiente fórmula:
donde:
- Para encontrar si un nuevo suero detiene la leucemia, se seleccionan nueve ratones, todos con una etapa avanzada de la enfermedad. Cinco ratones reciben el tratamiento y cuatro no. Los tiempos de sobrevivencia en años, a partir del momento en que comienza el experimento son los siguientes:
Con Tratamiento |
2.1
|
5.3
|
1.4
|
4.6
|
0.9
|
Sin Tratamiento |
1.9
|
0.5
|
2.8
|
3.1
|
Primero se probará el supuesto de varianzas iguales con un ensayo de hipótesis bilateral utilizando la distribución Fisher.
Datos:
Con tratamiento
s= 1.97
n = 5
Sin tratamiento
s = 1.1672
n = 4
Ensayo de hipótesis:
Estadístico de prueba:
La sugerencia que se hace es que el numerador sea el de valor mayor .
Entonces los grados de libertad uno será el tamaño de la muestra de la población uno menos uno. 1= 5-1 = 4 y 2 = 4-1=3.
Si 0.10 Fc 15.1 No se rechaza Ho,
Si la Fc < 0.10 ó si Fc > 15.1 se rechaza Ho.
Cálculo:
Decisión y Justificación:
Como 2.85 esta entre los dos valores de Ho no se rechaza , y se concluye con un = 0.05 que existe suficiente evidencia para decir que las varianza de las poblaciones son iguales.
Con la decisión anterior se procede a comparar las medias:Ensayo de Hipótesis
Ho; CT-ST=0
H1; CT-ST >0
Regla de decisión:
Si tR 1.895 No se Rechaza Ho
Si tR > 1.895 se rechaza HoCálculos:
por lo tanto sp = 1.848
Justificación y decisión:
Como 0.6332 es menor que 1.895, no se rechaza Ho, y se concluye con un nivel de significancia del 0.05 que no existe suficiente evidencia para decir que el suero detiene la leucemia.- Se realizó un experimento para comparar el tiempo promedio requerido por el cuerpo humano para absorber dos medicamentos, A y B. Suponga que el tiempo necesario para que cada medicamento alcance un nivel específico en el torrente sanguíneo se distribuye normalmente. Se eligieron al azar a doce personas para ensayar cada fármaco registrándose el tiempo en minutos que tardó en alcanzar un nivel específico en la sangre. Calcule con
= 0.05 si existe diferencia entre los tiempos promedio y obtenga el valor de P. Suponga varianzas iguales.
Medicamento A | Medicamento B |
nA = 12 | nB = 12 |
SA2= 15.57 | SB2 = 17.54 |
Solución:
Primero se pondrá a prueba el supuesto de varianzas iguales mediante una prueba de hipótesis con = 0.10.
Ensayo de hipótesis:
Estadístico de prueba:
La sugerencia que se hace es que el numerador sea el de valor mayor .
Entonces los grados de libertad uno será el tamaño de la muestra de la población uno menos uno. 1=12-1=11 y 2=12-1=11.
Si 0.355 Fc 2.82 No se rechaza Ho,
Si la Fc < 0.355 ó si Fc > 2.82 se rechaza Ho.
Cálculo:
Decisión y Justificación:
Como 1.13 esta entre los dos valores de Ho no se rechaza , y se concluye con un = 0.10 que existe suficiente evidencia para decir que las varianza de las poblaciones son iguales.
Con la decisión anterior se procede a comparar las medias:
Ensayo de Hipótesis
Ho; B-A=0
H1; B-A 0
Regla de decisión:
Si –2.074 tc 2.074 No se rechaza Ho,
Si la tc < -2.074 ó si tc > 2.074 se rechaza Ho.
Cálculos:
Justificación y decisión:
Como 3.49 es mayor que 2.074, no se rechaza Ho, y se concluye con un nivel de significancia del 0.05 que la media del tiempo para que el medicamento A llegue a un nivel específico en el torrente sanguíneo es distinta de la que toma al fármaco B alcanzar ese mismo nivel.Para calcular el valor de P se ubicará la t calculada en la gráfica para proceder a buscar el área y multiplicarla por dos ya que es bilateral.
Consideremos ahora el problema de encontrar una estimación por intervalos de 1-2 cuando no es probable que las varianzas poblacionales desconocidas sean iguales. La estadística que se usa con más frecuencia en este caso es:
Como rara vez es número entero, lo redondeamos al número entero más cercano menor. Esto es si el valor de nu es de 15.9 se redondeará a 15.
Al despejar la diferencia de medias poblacionales de la formula de t nos queda:
Ejemplos:
- El departamento de zoología de la Universidad de Virginia llevó a cabo un estudio para estimar la diferencia en la cantidad de ortofósforo químico medido en dos estaciones diferentes del río James. El ortofósforo se mide en miligramos por litro. Se reunieron 15 muestras de la estación 1 y se ontuvo una media de 3.84 con una desviación estándar de 3.07 miligramos por litro, mientras que 12 muestras de la estación 2 tuvieron un contenido promedio de 1.49 con una desviación estándar 0.80 miligramos por litro. Encuentre un intervalo de confianza de 95% para la diferencia del contenido promedio real de ortofósforo en estas dos estaciones, suponga que las observaciones vienen de poblaciones normales con varianzas diferentes.
Solución:
Datos:
Estación 1 | Estación 2 |
n1 = 15 | n2 = 12 |
S1= 3.07 | S2 = 0.80 |
Primero se procederá a calcular los grados de libertad:
Al usar =0.05, encontramos en la tabla con 16 grados de libertad que el valor de t es 2.120, por lo tanto:
que se simplifica a:
0.60 1-2 4.10
Por ello se tiene una confianza del 95% de que el intervalo de 0.60 a 4.10 miligramos por litro contiene la diferencia de los contenidos promedios reales de ortofósforo para estos dos lugares.
Ejemplo:
- Un fabricante de monitores prueba dos diseños de microcircuitos para determinar si producen un flujo de corriente equivalente. El departamento de ingeniería ha obtenido los datos siguientes:
- Dos proveedores fabrican un engrane de plástico utilizado en una impresora láser. Una característica importante de estos engranes es la resistencia al impacto la cual se mide en pies-libras. Una muestra aleatoria de 10 engranes suministrados por el primer proveedor arroja los siguientes resultados: y s1 = 12. Del segundo proveedor se toma una muestra aleatoria de 16 engranes, donde los resultados son
Diseño 1
|
n1 = 16
|
s12 = 10
| |
Diseño 2
|
n2 = 10
|
s22 = 40
|
Con = 0.05, se desea determinar si existe alguna diferencia significativa en el flujo de corriente promedio entre los dos diseños, donde se supone que las dos poblaciones son normales, pero no es posible suponer que las varianzas desconocidas sean iguales.
Solución:
Primero se probarán varianzas desiguales.
Ensayo de hipótesis:
Estadístico de prueba:
La sugerencia que se hace es que el numerador sea el de valor mayor .Entonces los grados de libertad uno será el tamaño de la muestra de la población uno menos uno. 1= 10-1 = 9 y 2 = 16-1=15.
Si 0.265 Fc 3.12 No se rechaza Ho,
Si la Fc < 0.265 ó si Fc > 3.12 se rechaza Ho.
Cálculo:
Decisión y Justificación:Como 4 es mayor que 3.12 se rechaza Ho , y se concluye con un = 0.05 que existe suficiente evidencia para decir que las varianza de las poblaciones son diferentes.
Con la decisión anterior se procede a comparar las medias:
Ensayo de HipótesisHo; 1-2=0
H1; 1-2 0
Para poder buscar el valor de t en la tabla, se necesita saber el valor de los grados de libertad:
Este valor se redondea al próximo menor que sería 11.
Si tR < -2.201 ó si tR > 2.201 se rechaza Ho
Cálculos:
Justificación y decisión:
Como 0.1395 esta entre –2.201 y 2.201, no se rechaza Ho y se concluye con un = 0.05, que no existe diferencia significativa en el flujo de corriente promedio entre los dos diseños.
y s2 = 45. ¿Existe evidencia que apoye la afirmación de que los engranes del proveedor 2 tienen una mayor resistencia promedio al impacto. Use un nivel de significancia de 0.05. Calcule el valor de P.
Solución:
Datos:
Proveedor 1 | Proveedor 2 |
n1 = 10 | n2 = 16 |
S1= 12 | S2 = 45 |
Primero se probarán varianzas desiguales.
Ensayo de hipótesis:
Estadístico de prueba:
La sugerencia que se hace es que el numerador sea el de valor mayor .
Entonces los grados de libertad uno será el tamaño de la muestra de la población uno menos uno. 1= 16-1 = 15 y 2 = 10-1=9.
Si 0.320 Fc 3.01 No se rechaza Ho,
Si la Fc < 0.320 ó si Fc > 3.01 se rechaza Ho.
Cálculo:
Decisión y Justificación:
Como 14.06 es mayor que 3.01 se rechaza Ho , y se concluye con un = 0.05 que existe suficiente evidencia para decir que las varianza de las poblaciones son diferentes.
Con la decisión anterior se procede a comparar las medias:
Ensayo de Hipótesis
Ho; 2-1=0
H1; 2-1 >0
Para poder buscar el valor de t en la tabla, se necesita saber el valor de los grados de libertad:
Este valor se redondea al próximo menor que sería 18.
Si tR 1.734 No se rechaza Ho
Si tR > 1.734 se rechaza Ho
Cálculos:
Justificación y decisión:
Como 2.61 es mayor que 1.734, se rechaza Ho y se concluye con un =0.05, que existe evidencia suficiente para decir que el promedio de resistencia de los engranes del proveedor 2 es mayor a el promedio de resistencia de los engranes del proveedor 1.Para calcular el valor de P se busca adentro de la tabla de t el valor de 2.61 con 18 grados de libertad y se observa que se encuentra entre dos áreas que son 0.01 y 0.0075, al interpolar nos da un valor de P = 0.00894.
Comentarios
Publicar un comentario