Intervalo de confianza de una proporción y diferencia de proporciones.
Estimación de una Proporción
Un estimador puntual de la proporción P en un experimento binomial está dado por la estadística P=X/N, donde x representa el número de éxitos en n pruebas. Por tanto, la proporción de la muestra p =x/n se utiuñlizará como estimador puntual del parámetro P.
Si no se espera que la proporción P desconocida esté demasiado cerca de 0 ó de 1, se puede establecer un intervalo de confianza para P al considerar la distribución muestral de proporciones.
Al despejar P de esta ecuación nos queda:
En este despeje podemos observar que se necesita el valor del parámetro P y es precisamente lo que queremos estimar, por lo que lo sustituiremos por la proporción de la muestra p siempre y cuando el tamaño de muestra no sea pequeño.
Cuando n es pequeña y la proporción desconocida P se considera cercana a 0 ó a 1, el procedimiento del intervalo de confianza que se establece aquí no es confiable, por tanto, no se debe utilizar. Para estar seguro, se debe requerir que np ó nq sea mayor o igual a 5.
El error de estimación será la diferencia absoluta entre p y P, y podemos tener el nivel de confianza de que esta diferencia no excederá .
Ejemplos:
- Un fabricante de reproductores de discos compactos utiliza un conjunto de pruebas amplias para evaluar la función eléctrica de su producto. Todos los reproductores de discos compactos deben pasar todas las pruebas antes de venderse. Una muestra aleatoria de 500 reproductores tiene como resultado 15 que fallan en una o más pruebas. Encuentre un intervalo de confianza de 90% para la proporción de los reproductores de discos compactos de la población que no pasan todas las pruebas.
- En una muestra de 400 pilas tipo B fabricadas por la Everlast Company, se encontraron 20 defectuosas. Si la proporción p de pilas defectuosas en esa muestra se usa para estimar P, que vendrá a ser la proporción verdadera de todas las pilas defectuosas tipo B fabricadas por la Everlast Company, encuentre el máximo error de estimación tal que se pueda tener un 95% de confianza en que P dista menos de de p.
- En un estudio de 300 accidentes de automóvil en una ciudad específica, 60 tuvieron consecuencias fatales. Con base en esta muestra, construya un intervalo del 90% de confianza para aproximar la proporción de todos los accidentes automovilísticos que en esa ciudad tienen consecuencias fatales.
Solución:n=500
p = 15/500 = 0.03
z(0.90) = 1.645
0.0237<P<0.0376
Se sabe con un nivel de confianza del 90% que la proporción de discos defectuosos que no pasan la prueba en esa población esta entre 0.0237 y 0.0376.Solución:p=x/n = 20/400=0.05
z(0.95)=1.96
Para calcular el intervalo de confianza se tendría:
Si se requiere un menor error con un mismo nivel de confianza sólo se necesita aumentar el tamaño de la muestra.
P= 60/300 = 0.20
Z(0.90) = 1.645
0.162<P<0.238
Si se tienen dos poblaciones con medias 1 y 2 y varianzas 12 y 22, respectivamente, un estimador puntual de la diferencia entre 1 y 2 está dado por la estadística . Por tanto. Para obtener una estimación puntual de
1- 2, se seleccionan dos muestras aleatorias independientes, una de cada población, de tamaño n1 y n2, se calcula la diferencia , de las medias muestrales.
1- 2, se seleccionan dos muestras aleatorias independientes, una de cada población, de tamaño n1 y n2, se calcula la diferencia , de las medias muestrales.
Recordando a la distribución muestral de diferencia de medias:
Al despejar de esta ecuación 1- 2 se tiene:
En el caso en que se desconozcan las varianzas de la población y los tamaños de muestra sean mayores a 30 se podrá utilizar la varianza de la muestra como una estimación puntual.
Ejemplos:
- Se lleva a cabo un experimento en que se comparan dos tipos de motores, A y B. Se mide el rendimiento en millas por galón de gasolina. Se realizan 50 experimentos con el motor tipo A y 75 con el motor tipo B. La gasolina que se utiliza y las demás condiciones se mantienen constantes. El rendimiento promedio de gasolina para el motor A es de 36 millas por galón y el promedio para el motor B es 24 millas por galón. Encuentre un intervalo de confianza de 96% sobre la diferencia promedio real para los motores A y B. Suponga que las desviaciones estándar poblacionales son 6 y 8 para los motores A y B respectivamente.
- Una compañía de taxis trata de decidir si comprar neumáticos de la marca A o de la B para su flotilla de taxis. Para estimar la diferencia de las dos marcas, se lleva a cabo un experimento utilizando 12 de cada marca. Los neumáticos se utilizan hasta que se desgastan, dando como resultado promedio para la marca A 36,300 kilómetros y para la marca B 38,100 kilómetros. Calcule un intervalo de confianza de 95% para la diferencia promedio de las dos marcas, si se sabe que las poblaciones se distribuyen de forma aproximadamente normal con desviación estándar de 5000 kilómetros para la marca A y 6100 kilómetros para la marca B.
Solución:Es deseable que la diferencia de medias sea positiva por lo que se recomienda restar la media mayor menos la media menor. En este caso será la media del motor B menos la media del motor A.
El valor de z para un nivel de confianza del 96% es de 2.05.
3.43<B-A<8.57
La interpretación de este ejemplo sería que con un nivel de confianza del 96% la diferencia del rendimiento promedio esta entre 3.43 y 8.57 millas por galón a favor del motor B. Esto quiere decir que el motor B da mas rendimiento promedio que el motor A, ya que los dos valores del intervalo son positivos.
-2662.68<B-A<6262.67
Gráficamente:En la sección anterior se vio el tema de la generación de las distribuciones muestrales, en donde se tenía el valor de los parámetros, se seleccionaban dos muestras y podíamos calcular la probabilidad del comportamiento de los estadísticos. Para este caso en particular se utilizará la distribución muestral de diferencia de proporciones para la estimación de las misma. Recordando la formula:
- Se considera cierto cambio en un proceso de fabricación de partes componentes. Se toman muestras del procedimiento existente y del nuevo para determinar si éste tiene como resultado una mejoría. Si se encuentra que 75 de 1500 artículos del procedimiento actual son defectuosos y 80 de 2000 artículos del procedimiento nuevo también lo son, encuentre un intervalo de confianza de 90% para la diferencia real en la fracción de defectuosos entre el proceso actual y el nuevo.
- Un artículo relacionado con la salud, reporta los siguientes datos sobre la incidencia de disfunciones importantes entre recién nacidos con madres fumadoras de marihuana y de madres que no la fumaban:
Solución:Sean P1 y P2 las proporciones reales de defectuosos para los procesos actual y nuevo, respectivamente. De aquí, p1=75/1500 = 0.05 y p2 = 80/2000 = 0.04. con el uso de la tabla encontramos que z para un nivel de confianza del 90% es de 1.645.
-0.0017<P1-P2<0.0217
Como el intervalo contiene el valor de cero, no hay razón para creer que el nuevo procedimiento producirá una disminución significativa en la proporción de artículos defectuosos comparado con el método existente.
Usuaria
|
No Usuaria
| |
Tamaño Muestral |
1246
|
11178
|
Número de disfunciones |
42
|
294
|
Proporción muestral |
0.0337
|
0.0263
|
Representemos P1 la proporción de nacimientos donde aparecen disfunciones entre todas las madres que fuman marihuana y definamos P2, de manera similar, para las no fumadoras. El valor de z para un 99% de confianza es de 2.58.
-0.0064<P1-P2<0.0212
Este intervalo es bastante angosto, lo cual sugiere que P1-P2 ha sido estimado de manera precisa.Al iniciar cualquier investigación, la primer pregunta que surge es: ¿de qué tamaño debe ser la o las muestras?. La respuesta a esta pregunta la veremos en esta sección, con conceptos que ya se han visto a través de este material.
¿Qué tan grande debe ser una muestra si la media muestral se va a usar para estimar la media poblacional?. La respuesta depende del error estándar de la media, si este fuera cero, entonces se necesitaría una sola media que será igual necesariamente a la media poblacional desconocida , porque = 0. Este caso extremo no se encuentra en la práctica, pero refuerza el hecho de que mientras menor sea el error estándar de la media, menor es el tamaño de muestra necesario para lograr un cierto grado de precisión.
Se estableció antes que una forma de disminuir el error de estimación es aumentar el tamaño de la muestra, si éste incluye el total de la población, entonces sería igual a cero. Con esto en mente, parece razonable que para un nivel de confianza fijo, sea posible determinar un tamaño de la muestra tal que el error de estimación sea tan pequeño como queramos, para ser mas preciso, dado un nivel de confianza y un error fijo de estimación , se puede escoger un tamaño de muestra n tal que P() = Nivel de confianza. Con el propósito de determinar n. El error máximo de estimación esta dado por:
En el caso de que se tenga una población finita y un muestreo sin reemplazo, el error de estimación se convierte en:
- Un biólogo quiere estimar el peso promedio de los ciervos cazados en el estado de Maryland. Un estudio anterior de diez ciervos cazados mostró que la desviación estándar de sus pesos es de 12.2 libras. ¿Qué tan grande debe ser una muestra para que el biólogo tenga el 95% de confianza de que el error de estimación es a lo más de 4 libras?
- Una empresa eléctrica fabrica focos que tienen una duración aproximadamente normal con una desviación estándar de 40 horas. ¿De qué tamaño se necesita una muestra si se desea tener 96% de confianza que la media real esté dentro de 10 horas de la media real?
- Suponga que en el ejercicio anterior se tiene una población de 300 focos, y se desea saber de que tamaño debe de ser la muestra. El muestreo se realizará sin reemplazo.
Solución:
¿Qué pasaría si en lugar de tener un error de estimación de 10 horas sólo se requiere un error de 5 horas?
Solución:
Como se tiene una población finita y un muestreo sin reemplazo es necesario utilizar la formula con el factor de corrección.
Se desea saber que tan grande se requiere que sea una muestra para asegurar que el error al estimar P sea menor que una cantidad específica .
- Tomar una muestra preliminar mayor o igual a 30 para proporcionar una estimación de P. Después con el uso de la fórmula se podría determinar de forma aproximada cuántas observaciones se necesitan para proporcionar el grado de precisión que se desea.
- Tomar el valor de p como 0.5 ya que sustituyendo este en la fórmula se obtiene el tamaño de muestra mayor posible. Observe el siguiente ejemplo:
Se desconoce el valor de P, por lo que se utilizarán diferentes valores y se sustituirán en la formula para observar los diferentes tamaños de muestras. El nivel de confianza que se utilizará es del 95% con un error de estimación de 0.30.
p
|
n
| |
0.10
|
3.84
| |
0.20
|
6.82
| |
0.30
|
8.96
| |
0.40
|
10.24
| |
0.50
|
10.67
| |
0.60
|
10.24
| |
0.70
|
8.96
| |
0.80
|
6.82
| |
0.90
|
3.84
|
Como se puede observar en la tabla anterior cuando P vale 0.5 el tamaño de la muestra alcanza su máximo valor.
En el caso de que se tenga una población finita y un muestreo sin reemplazo, el error de estimación se convierte en:
- En una muestra aleatoria de 500 familias que tienen televisores en la ciudad de Hamilton, Canadá, se encuentra que 340 están suscritas a HBO. ¿Qué tan grande se requiere que sea una muestra si se quiere tener 95% de confianza de que la estimación de P esté dentro de 0.02?
- Una legisladora estatal desea encuestar a los residentes de su distrito para conocer qué proporción del electorado conoce la opinión de ella, respecto al uso de fondos estatales para pagar abortos. ¿Qué tamaño de muestra se necesita si se requiere un confianza del 95% y un error máximo de estimación de 0.10?
Solución:Se tratarán a las 500 familias como una muestra preliminar que proporciona una estimación de p=340/500=0.68.
Solución:
En este problema, se desconoce totalmente la proporción de residentes que conoce la opinión de la legisladora, por lo que se utilizará un valor de 0.5 para p.
Si se recuerda a la distribución muestral de diferencia de medias se tiene que error esta dado por:
- Los tamaños de muestra son iguales.
- Los tamaño de muestra son diferentes .
Para el primer caso no se tiene ningún problema, se eleva al cuadrado la ecuación y se despeja n ya que n1 es igual a n2.
Un director de personal quiere comparar la efectividad de dos métodos de entrenamiento para trabajadores industriales a fin de efectuar cierta operación de montaje. Se divide un número de operarios en dos grupos iguales: el primero recibe el método de entrenamiento 1, y el segundo, el método 2. Cada uno realizará la operación de montaje y se registrará el tiempo de trabajo. Se espera que las mediciones para ambos grupos tengan una desviación estándar aproximadamente de 2 minutos. Si se desea que la estimación de la diferencia en tiempo medio de montaje sea correcta hasta por un minuto, con una probabilidad igual a 0.95, ¿cuántos trabajadores se tienen que incluir en cada grupo de entrenamiento?
Si se recuerda a la distribución muestral de diferencia de medias se tiene que error esta dado por:
- Los tamaños de muestra son iguales.
- Los tamaño de muestra son diferentes .
Para el primer caso no se tiene ningún problema, se eleva al cuadrado la ecuación y se despeja n ya que n1 es igual a n2.
Comentarios
Publicar un comentario