Intervalo de confianza
Un intervalo de confianza es una técnica de estimación utilizada en inferencia estadística que permite acotar un par o varios pares de valores, dentro de los cuales se encontrará la estimación puntual buscada (con una determinada probabilidad).
Un intervalo de confianza nos va a permitir calcular dos valores alrededor de una media muestral (uno superior y otro inferior). Estos valores van a acotar un rango dentro del cual, con una determinada probabilidad, se va a localizar el parámetro poblacional.
Intervalo de confianza = media +- margen de error
Conocer el verdadero poblacional, por lo general, suele ser algo muy complicado. Pensemos en una población de 4 millones de personas. ¿Podríamos saber el gasto medio en consumo por hogar de esa población? En principio sí. Simplemente tendríamos que hacer una encuesta entre todos los hogares y calcular la media. Sin embargo, seguir ese proceso sería tremendamente laborioso y complicaría bastante el estudio.
Factores de los que depende un intervalo de confianza
El cálculo de un intervalo de confianza depende principalmente de los siguientes factores:
- Tamaño de la muestra seleccionada: Dependiendo de la cantidad de datos que se hayan utilizado para calcular el valor muestral, este se acercará más o menos al verdadero parámetro poblacional.
- Nivel de confianza: Nos va a informar en qué porcentaje de casos nuestra estimación acierta. Los niveles habituales son el 95% y el 99%.
- Margen de error de nuestra estimación: Este se denomina como alfa y nos informa de la probabilidad que existe de que el valor poblacional esté fuera de nuestro intervalo.
- Lo estimado en la muestra (media, varianza, diferencia de medias…): De esto va a depender el estadístico pivote para el cálculo del intervalo.
Intervalo de confianza de la media de una población
De una población de media y desviación típica se pueden tomar muestras de elementos. Cada una de estas muestras tiene a su vez una media. Se puede demostrar que la media de todas las medias muestrales coincide con la media poblacional:
- Pero además, si el tamaño de las muestras es lo suficientemente grande, o la distribución poblacional es normal, la distribución de medias muestrales es, prácticamente, una distribución normal (o gaussiana) con media μ y una desviación típica dada por la siguiente expresión: . Esto se representa como sigue: . Si estandarizamos, se sigue que:
- En una distribución Z ~ N(0, 1) puede calcularse fácilmente un intervalo dentro del cual caigan un determinado porcentaje de las observaciones, esto es, es sencillo hallar z1 y z2 tales que P[z1 ≤ z ≤ z2] = 1 - α, donde (1 - α)·100 es el porcentaje deseado (véase el uso de las tablas en una distribución normal).
- En esta distribución normal de medias se puede calcular el intervalo de confianza donde se encontrará la media poblacional si solo se conoce una media muestral (), con una confianza determinada. Habitualmente se manejan valores de confianza del 95 y del 99 por ciento. A este valor se le llamará (debido a que es el error que se cometerá, un término opuesto).
- Para ello se necesita calcular el punto —o, mejor dicho, su versión estandarizada o valor crítico— junto con su "opuesto en la distribución" . Estos puntos delimitan la probabilidad para el intervalo, como se muestra en la siguiente imagen:
Y en la versión estandarizada se cumple que:
Así:
De lo cual se obtendrá el intervalo de confianza:
Obsérvese que el intervalo de confianza viene dado por la media muestral ± el producto del valor crítico por el error estándar .
Si no se conoce y n es grande (habitualmente se toma n ≥ 30):5
Intervalo de confianza de una proporción
El intervalo de confianza para estimar una proporción p, conocida como una proporción muestral pn de una muestra de tamaño n, a un nivel de confianza del (1-α)·100% es:
En la demostración de estas fórmulas están involucrados el Teorema Central del Límite y la aproximación de una binomial por una normal.
Ejemplo práctico
Una máquina llena tazas con helado, y se supone que está ajustada para verter la cantidad de 250 g. Como la máquina no puede llenar cada taza con exactamente 250 g, el contenido que se añade a cada taza individual presenta cierta variación y se le asigna una variable aleatoria X. Se asume que esta variación se ajusta a una distribución normal de alrededor de la cantidad promedio deseada de 250 g, con una desviación estándar de 2.5 g.
Para determinar si la máquina está adecuadamente calibrada, se toma una muestra aleatoria de n = 25 tazas de helado para pesarlas. La medición resultante es X1, ..., X25, una muestra aleatoria procedente de X.
Para μ, es suficiente con dar una estimación. El estimador adecuado es la media muestral:
La muestra señala los pesos reales x1, ..., x25, con media:
- dependiente del parámetro μ que debe ser estimado, pero con una distribución normal estándar independiente del parámetro μ. Por lo tanto, es posible hallar números −z y z, independientes de μ, entre los cuales está Z con probabilidad 1 − α, una medida de cuán confiados queremos estar.Tomamos 1 − α = 0.95, por ejemplo. Así, tenemos:El número z proviene de una función de distribución acumulada, en este caso la Función de distribución normal acumulativa:y se obtiene:En otras palabras, el límite inferior de un intervalo de confianza del 95% es:y el superior de tal intervalo es:Con los valores de este ejemplo, el intervalo de confianza es:Esto podría interpretarse como: con probabilidad del 0.95 encontramos un intervalo de confianza en el que se cumple que el parámetro μ está entre los límites estocásticosyEsto no implica que hay una probabilidad de 0.95 de encontrar el parámetro μ en el intervalo obtenido usando el valor efectivamente establecido para el valor medio de la muestra.Cada vez que se repitan las mediciones, darán otro valor para la media X de la muestra. En el 95% de los casos μ estará entre los límites calculados a partir de la media, pero en el 5% de los casos no lo estará. El intervalo de confianza efectivo se calcula llevando los valores de masas de helado medidas a la fórmula. Este intervalo de confianza de 0.95 resulta:

