# Guía 5
## Teorema Central del Límite y Distribución Multinormal
- Estudie el grado de validez del teorema central del límite dibujando las siguientes distribuciones,
y superponiendo sobre ellas la gaussiana con el $\mu$ y $\sigma$ correspondiente.
1. ${\rm B}_{k}(5,0.2)$, ${\rm B}_k(30,0.4)$
2. ${\rm P}_{n}(4)$, ${\rm P}_{n}(10)$, ${\rm P}_{n}(40)$
- El teorema central del límite permite evaluar probabilidades binomiales
sin necesidad de sumar muchos términos que involucran factoriales de grandes números,
a partir de la distribución acumulativa normal canónica $\Phi(x)$:
$$
\sum_{k=a}^{b} B_{k}(n,p)
= \sum_{k=a}^{b} \binom{n}{k} p^{k} q^{n-k}
\simeq
\Phi \left( \frac{b-np+\frac{1}{2}}{\sqrt{npq}} \right) -
\Phi \left( \frac{a-np-\frac{1}{2}}{\sqrt{npq}} \right)
$$
Discuta el origen de esta fórmula
y utilícela para calcular la probabilidad de aprobar un examen multiple choice
con 100 preguntas de tres opciones cada una,
si se contesta al azar y se aprueba con 4
(40% de respuestas correctas).
0.0966 con la suma exacta,
y 0.0951 con la fórmula aproximada.
- Utilizando el teorema central del límite,
escribir un generador aproximado de números gaussianos $N(0,1)$
a partir de variables aleatorias independientes $\{X_{i}\}$ con distribución uniforme en $[0,1]$
como una función $f(Z)$ siendo $Z=\sum_{i}^{n}X_{i}$.
1. Si se elige $n$=50, ¿cuál debe ser $f(Z)$?
2. ¿En qué rango de la abscisa seguro falla la aproximación a la normal?
3. Genere de este modo 10000 números con la computadora,
haga un histograma de su distribución,
y grafique N(0,1) sobre éste.
4. Muestre que el promedio de $N$ variables independientes con distribución de Cauchy
tiene a su vez distribución de Cauchy.
¿Por qué falla en este caso el teorema central del límite?
- ¿Cuánta gente deberá encuestarse en Argentina
si se desea conocer la intención de voto $p$ para un cierto candidato
dentro de un margen de 1% (en sentido absoluto)
y con un nivel de confianza de 95%?
Use para esto el dato de que aproximadamente:
(a) el 45%,
o (b) el 5% del electorado votará efectivamente por dicho candidato.
Discuta intuitivamente por qué obtiene resultados distintos para los casos (a) y (b).
9900 y 1900
*Sugerencia: considerar que la población tiene muchos más individuos que cualquiera de estas muestras y usar la aproximación gaussiana.*
- Muestre que a distribución poissoniana tiende a la gaussiana
en el límite $\mu\rightarrow\infty$.
Para ello obtenga la función característica de $Y\equiv(n-E(n))/\sigma_{n}$,
con $n$ poissoniana,
y verifique la validez de ${\lim_{\mu\rightarrow\infty}}\phi_{Y}(t)=\phi_{X}(t)$,
con $X(t)$ gaussiana canónica.
- Siendo que en el problema anterior no hay una suma de variables aleatorias,
¿por qué esta en esta guía?
*Ayuda*: estudie la distribución de la suma de variables aleatorias con distribución de Poisson.
- La *Distribución Multinormal* es la generalización a $n$ dimensiones de la normal (la gaussiana)
y, al igual que ésta, juega un rol preponderante en probabilidades y estadística.
Dadas $n$ variables aleatorias correlacionadas $\{X_{i}\}$,
con esperanza $E(X_{i})=\mu_{i}$ y matriz de covarianza $\mathbb{V}$,
ésto es Cov($X_{i}$,$X_{j}$)=$V_{ij}$,
se dice que su densidad de probabilidad conjunta $f({\rm \underline{x}})$ es multinormal si
todas las distribuciones marginales $f(x_{i})$ y
todas las distribuciones condicionales unidimensionales $f(x_{i}|x_{j},j\ne i)$ son gaussianas.
La densidad de probabilidad conjunta $f({\rm \underline{x}})$ viene dada por
$$
f({\rm \underline{x}})=
\frac{1}{\sqrt{(2\pi)^{n}|\mathbb{V}|}}
\exp\left[-\frac{1}{2}\,
({\rm \underline{x}}-\underline{\smash{\mu}})^{T}
\mathbb{V}^{-1}
({\rm \underline{x}}-\underline{\smash{\mu}})\right]
$$
donde ${\rm \underline{x}}$ y $\underline{\smash{\mu}}$ son vectores columna de tamaño $n$,
${\rm \underline{x}}^{T}$ y $\underline{\smash{\mu}}^{T}$ los respectivos vectores traspuestos (vectores fila)
y $\mathbb{V}$ es cuadrada (de $n \times n$), simétrica y definida positiva,
con $|\mathbb{V}|\equiv\det(\mathbb{V})$.
1. Verifique que para $n=1$, $f({\rm \underline{x}})$ es una gaussiana.
2. En el caso $n=2$ (multinormal bivariada),
la matriz de covarianza de una multinormal depende de tres parámetros (¿por qué?).
Elijamos $\sigma_{1}$, $\sigma_{2}$ y el coeficiente de correlación $\rho$,
ésto es,
$V_{11}=\sigma_{1}^{2}$,
$V_{22}=\sigma_{2}^{2}$ y
$V_{12}=\rho\,\sigma_{1}\sigma_{2}$.
Muestre entonces que $$f(x_{1},x_{2})=\left(2\pi\sigma_{1}\sigma_{2}\sqrt{1-\rho^{2}}\right)^{-1} \exp\left(-\frac{Q}{2}\right)$$
con $$Q=\frac{1}{1-\rho^{2}}\left[\left(\frac{x_{1}-\mu_{1}}{\sigma_{1}}\right)^{2}+\left(\frac{x_{2}-\mu_{2}}{\sigma_{2}}\right)^{2}-2\rho\left(\frac{x_{1}-\mu_{1}}{\sigma_{1}}\right)\left(\frac{x_{2}-\mu_{2}}{\sigma_{2}}\right)\right]$$
3. Compruebe que cuando $\rho=0$, $f(x_{1},x_{2})=N(\mu_{1},\sigma_{1})N(\mu_{2},\sigma_{2})$.
Esto es, para la multinormal, correlación nula implica que las variables son independientes.
*En adelante, puede trabajar con $\mu_{1}=\mu_{2}=0$ para simplificar las cuentas.*
4. Muestre que la distribución marginal $f(x_{2})$ es la gaussiana $N(\mu_{2},\sigma_{2})$,
independientemente del valor del nivel de correlación $\rho$.
5. Una manera de visualizar la forma de una multinormal con $n=2$
es dibujar curvas de nivel de $f$ en el plano $x_{1},x_{2}$.
Considere las correspondientes a $Q=1$,
y muestre que son elipses centradas en $(\mu_{1},\mu_{2})$,
denominadas *elipses de covarianza*.
Para $\mu_{1}=\mu_{2}=0$,
verifique que éstas están contenidas en el rectángulo $(\pm\sigma_{1},\pm\sigma_{2})$,
que son tangentes a dicho rectángulo en los puntos $(\sigma_{1},\rho\,\sigma_{2})$ y $(\rho\,\sigma_{1},\sigma_{2})$.
6. Muestre que $f(x_{2}|x_{1})$ es gaussiana,
con $N(\mu_{2}+\rho(\sigma_{2}/\sigma_{1})(x_{1}-\mu_{1}),\sigma_{2}\sqrt{1-\rho^{2}})$.
Discuta cómo varía la esperanza de $x_{2}$ en función de $x_{1}$ según el signo de $\rho$,
y analice cómo varía el ancho de la distribución condicional con el grado de correlación.
Interprete estos resultados cortando con líneas $x_1$=cte
las elipses dibujadas a mano alzada en el item anterior.
¿Qué ocurre en el caso límite $\rho=1$?
- Aplicando los resultados del ejercicio anterior para el caso de ${\rm \underline{x}}$ bidimensional,
1. Dibuje a mano alzada elipses de covarianza con distintos $\rho$ para el caso $\sigma_{1}=\sigma_{2}$.
Discuta la diferencia entre tomar como error para $X_{1}$
el rango máximo cubierto por la elipse sobre el eje $x_1$,
o el segmento entre los puntos de intersección de la elipse con el eje $x_1$.
2. ¿Por qué tiene más sentido considerar la elipse como rango de confianza,
que el propio rectángulo $(\pm k\sigma_{1},\pm k\sigma_{2})$?
3. Considere las elipses de covarianza encerradas dentro del rectángulo $(\pm k\sigma_{1},\pm k\sigma_{2})$ alrededor de $(\mu_{1},\mu_{2})$.
Muestre que la probabilidad conjunta de que ($x_{1},x_{2}$) se encuentre dentro de una de estas elipses con $k$=1 es 39.3%,
independientemente del valor de la correlación $\rho$
(este resultado es el equivalente al 68.3% obtenido para el caso $n$=1).
Sugerencia:
pensar en otro suceso que tenga la *misma* probabilidad que el suceso
"($x_{1},x_{2}$) se encuentra dentro de una de estas elipses"
y que involucre a la variable aleatoria Q.
4. ¿Cuánto debería ser $k$ para que la elipse corresponda a un nivel de confianza de 95%?
Verifique que este resultado puede obtenerse también analíticamente (para el caso bidimensional),
además de usando las tablas.
k=2.448
- La función característica $\phi(\underline{t})$ de la distribución multinormal esta dada por
$$\phi(\underline{t}) = \exp\left(i\,\underline{t}^{T}\underline{\smash{\mu}} -\frac{1}{2}\,\underline{t}^{T}\mathbb{V}\,\underline{t}\right)$$
Muestre que $\underline{\smash{\mu}}$ y $\mathbb{V}$ son la esperanza y la matriz de covarianza de la variable aleatoria multidimensional ${\rm \underline{x}}$.
Ayuda:
alcanza con mostrar que $\mu_l$ es la esperanza de x$_l$
(la componente $l$-ésima de ${\rm \underline{x}}$)
y que $\mathbb{V}_{kl}$
(el elemento kl de la matriz $\mathbb{V}$)
es la covarianza de x$_k$ con x$_l$.
- Al realizar mediciones de una variable continua $X$,
se tiene un límite de resolución experimental $\delta$
(también conocido como error de cuantización, entre otros nombres).
¿Cómo nos afecta este límite?
Asumamos que la variable continua subyacente $X$,
sin límite de resolución,
tiene distribución normal $N(\mu,\sigma^2)$.
Por lo tanto,
el promedio de $n$ muestras tendrá distribución $N(\mu, \sigma^2/n)$.
Llamemos $\widetilde{X}$ a la variable que medimos, limitada por la resolución.
1. ¿Cómo simularía el efecto del límite de resolución $\delta$?
Es decir, ¿cómo obtendría una muestra de $\widetilde{X}$ a partir de una muestra de $X$?
2. ¿Cambian
la esperanza $E[\widetilde{X}]$,
la varianza $\text{Var}(\widetilde{X})$, y
la varianza del promedio de $n$ de $\text{Var}(\frac{1}{n} \sum_i^n \widetilde{X}_i)$ respecto de la de $X$?
¿Dependen de la resolución $\delta$?
Bibliografía:
- Kollar, I. (1994).
Bias of mean value and mean square value measurements based on quantized data.
IEEE Transactions on Instrumentation and Measurement.
https://doi.org/10.1109/19.328894
- Widrow, B., Kollar, I., & Ming-Chang Liu. (1996).
Statistical theory of quantization.
IEEE Transactions on Instrumentation and Measurement.
https://doi.org/10.1109/19.492748