# Guía 5 ## Teorema Central del Límite y Distribución Multinormal - Estudie el grado de validez del teorema central del límite dibujando las siguientes distribuciones, y superponiendo sobre ellas la gaussiana con el $\mu$ y $\sigma$ correspondiente. 1. ${\rm B}_{k}(5,0.2)$, ${\rm B}_k(30,0.4)$ 2. ${\rm P}_{n}(4)$, ${\rm P}_{n}(10)$, ${\rm P}_{n}(40)$ - El teorema central del límite permite evaluar probabilidades binomiales sin necesidad de sumar muchos términos que involucran factoriales de grandes números, a partir de la distribución acumulativa normal canónica $\Phi(x)$: $$ \sum_{k=a}^{b} B_{k}(n,p) = \sum_{k=a}^{b} \binom{n}{k} p^{k} q^{n-k} \simeq \Phi \left( \frac{b-np+\frac{1}{2}}{\sqrt{npq}} \right) - \Phi \left( \frac{a-np-\frac{1}{2}}{\sqrt{npq}} \right) $$ Discuta el origen de esta fórmula y utilícela para calcular la probabilidad de aprobar un examen multiple choice con 100 preguntas de tres opciones cada una, si se contesta al azar y se aprueba con 4 (40% de respuestas correctas). 0.0966 con la suma exacta, y 0.0951 con la fórmula aproximada. - Utilizando el teorema central del límite, escribir un generador aproximado de números gaussianos $N(0,1)$ a partir de variables aleatorias independientes $\{X_{i}\}$ con distribución uniforme en $[0,1]$ como una función $f(Z)$ siendo $Z=\sum_{i}^{n}X_{i}$. 1. Si se elige $n$=50, ¿cuál debe ser $f(Z)$? 2. ¿En qué rango de la abscisa seguro falla la aproximación a la normal? 3. Genere de este modo 10000 números con la computadora, haga un histograma de su distribución, y grafique N(0,1) sobre éste. 4. Muestre que el promedio de $N$ variables independientes con distribución de Cauchy tiene a su vez distribución de Cauchy. ¿Por qué falla en este caso el teorema central del límite? - ¿Cuánta gente deberá encuestarse en Argentina si se desea conocer la intención de voto $p$ para un cierto candidato dentro de un margen de 1% (en sentido absoluto) y con un nivel de confianza de 95%? Use para esto el dato de que aproximadamente: (a) el 45%, o (b) el 5% del electorado votará efectivamente por dicho candidato. Discuta intuitivamente por qué obtiene resultados distintos para los casos (a) y (b). 9900 y 1900 *Sugerencia: considerar que la población tiene muchos más individuos que cualquiera de estas muestras y usar la aproximación gaussiana.* - Muestre que a distribución poissoniana tiende a la gaussiana en el límite $\mu\rightarrow\infty$. Para ello obtenga la función característica de $Y\equiv(n-E(n))/\sigma_{n}$, con $n$ poissoniana, y verifique la validez de ${\lim_{\mu\rightarrow\infty}}\phi_{Y}(t)=\phi_{X}(t)$, con $X(t)$ gaussiana canónica. - Siendo que en el problema anterior no hay una suma de variables aleatorias, ¿por qué esta en esta guía? *Ayuda*: estudie la distribución de la suma de variables aleatorias con distribución de Poisson. - La *Distribución Multinormal* es la generalización a $n$ dimensiones de la normal (la gaussiana) y, al igual que ésta, juega un rol preponderante en probabilidades y estadística. Dadas $n$ variables aleatorias correlacionadas $\{X_{i}\}$, con esperanza $E(X_{i})=\mu_{i}$ y matriz de covarianza $\mathbb{V}$, ésto es Cov($X_{i}$,$X_{j}$)=$V_{ij}$, se dice que su densidad de probabilidad conjunta $f({\rm \underline{x}})$ es multinormal si todas las distribuciones marginales $f(x_{i})$ y todas las distribuciones condicionales unidimensionales $f(x_{i}|x_{j},j\ne i)$ son gaussianas. La densidad de probabilidad conjunta $f({\rm \underline{x}})$ viene dada por $$ f({\rm \underline{x}})= \frac{1}{\sqrt{(2\pi)^{n}|\mathbb{V}|}} \exp\left[-\frac{1}{2}\, ({\rm \underline{x}}-\underline{\smash{\mu}})^{T} \mathbb{V}^{-1} ({\rm \underline{x}}-\underline{\smash{\mu}})\right] $$ donde ${\rm \underline{x}}$ y $\underline{\smash{\mu}}$ son vectores columna de tamaño $n$, ${\rm \underline{x}}^{T}$ y $\underline{\smash{\mu}}^{T}$ los respectivos vectores traspuestos (vectores fila) y $\mathbb{V}$ es cuadrada (de $n \times n$), simétrica y definida positiva, con $|\mathbb{V}|\equiv\det(\mathbb{V})$. 1. Verifique que para $n=1$, $f({\rm \underline{x}})$ es una gaussiana. 2. En el caso $n=2$ (multinormal bivariada), la matriz de covarianza de una multinormal depende de tres parámetros (¿por qué?). Elijamos $\sigma_{1}$, $\sigma_{2}$ y el coeficiente de correlación $\rho$, ésto es, $V_{11}=\sigma_{1}^{2}$, $V_{22}=\sigma_{2}^{2}$ y $V_{12}=\rho\,\sigma_{1}\sigma_{2}$. Muestre entonces que $$f(x_{1},x_{2})=\left(2\pi\sigma_{1}\sigma_{2}\sqrt{1-\rho^{2}}\right)^{-1} \exp\left(-\frac{Q}{2}\right)$$ con $$Q=\frac{1}{1-\rho^{2}}\left[\left(\frac{x_{1}-\mu_{1}}{\sigma_{1}}\right)^{2}+\left(\frac{x_{2}-\mu_{2}}{\sigma_{2}}\right)^{2}-2\rho\left(\frac{x_{1}-\mu_{1}}{\sigma_{1}}\right)\left(\frac{x_{2}-\mu_{2}}{\sigma_{2}}\right)\right]$$ 3. Compruebe que cuando $\rho=0$, $f(x_{1},x_{2})=N(\mu_{1},\sigma_{1})N(\mu_{2},\sigma_{2})$. Esto es, para la multinormal, correlación nula implica que las variables son independientes. *En adelante, puede trabajar con $\mu_{1}=\mu_{2}=0$ para simplificar las cuentas.* 4. Muestre que la distribución marginal $f(x_{2})$ es la gaussiana $N(\mu_{2},\sigma_{2})$, independientemente del valor del nivel de correlación $\rho$. 5. Una manera de visualizar la forma de una multinormal con $n=2$ es dibujar curvas de nivel de $f$ en el plano $x_{1},x_{2}$. Considere las correspondientes a $Q=1$, y muestre que son elipses centradas en $(\mu_{1},\mu_{2})$, denominadas *elipses de covarianza*. Para $\mu_{1}=\mu_{2}=0$, verifique que éstas están contenidas en el rectángulo $(\pm\sigma_{1},\pm\sigma_{2})$, que son tangentes a dicho rectángulo en los puntos $(\sigma_{1},\rho\,\sigma_{2})$ y $(\rho\,\sigma_{1},\sigma_{2})$. 6. Muestre que $f(x_{2}|x_{1})$ es gaussiana, con $N(\mu_{2}+\rho(\sigma_{2}/\sigma_{1})(x_{1}-\mu_{1}),\sigma_{2}\sqrt{1-\rho^{2}})$. Discuta cómo varía la esperanza de $x_{2}$ en función de $x_{1}$ según el signo de $\rho$, y analice cómo varía el ancho de la distribución condicional con el grado de correlación. Interprete estos resultados cortando con líneas $x_1$=cte las elipses dibujadas a mano alzada en el item anterior. ¿Qué ocurre en el caso límite $\rho=1$? - Aplicando los resultados del ejercicio anterior para el caso de ${\rm \underline{x}}$ bidimensional, 1. Dibuje a mano alzada elipses de covarianza con distintos $\rho$ para el caso $\sigma_{1}=\sigma_{2}$. Discuta la diferencia entre tomar como error para $X_{1}$ el rango máximo cubierto por la elipse sobre el eje $x_1$, o el segmento entre los puntos de intersección de la elipse con el eje $x_1$. 2. ¿Por qué tiene más sentido considerar la elipse como rango de confianza, que el propio rectángulo $(\pm k\sigma_{1},\pm k\sigma_{2})$? 3. Considere las elipses de covarianza encerradas dentro del rectángulo $(\pm k\sigma_{1},\pm k\sigma_{2})$ alrededor de $(\mu_{1},\mu_{2})$. Muestre que la probabilidad conjunta de que ($x_{1},x_{2}$) se encuentre dentro de una de estas elipses con $k$=1 es 39.3%, independientemente del valor de la correlación $\rho$ (este resultado es el equivalente al 68.3% obtenido para el caso $n$=1). Sugerencia: pensar en otro suceso que tenga la *misma* probabilidad que el suceso "($x_{1},x_{2}$) se encuentra dentro de una de estas elipses" y que involucre a la variable aleatoria Q. 4. ¿Cuánto debería ser $k$ para que la elipse corresponda a un nivel de confianza de 95%? Verifique que este resultado puede obtenerse también analíticamente (para el caso bidimensional), además de usando las tablas. k=2.448 - La función característica $\phi(\underline{t})$ de la distribución multinormal esta dada por $$\phi(\underline{t}) = \exp\left(i\,\underline{t}^{T}\underline{\smash{\mu}} -\frac{1}{2}\,\underline{t}^{T}\mathbb{V}\,\underline{t}\right)$$ Muestre que $\underline{\smash{\mu}}$ y $\mathbb{V}$ son la esperanza y la matriz de covarianza de la variable aleatoria multidimensional ${\rm \underline{x}}$. Ayuda: alcanza con mostrar que $\mu_l$ es la esperanza de x$_l$ (la componente $l$-ésima de ${\rm \underline{x}}$) y que $\mathbb{V}_{kl}$ (el elemento kl de la matriz $\mathbb{V}$) es la covarianza de x$_k$ con x$_l$. - Al realizar mediciones de una variable continua $X$, se tiene un límite de resolución experimental $\delta$ (también conocido como error de cuantización, entre otros nombres). ¿Cómo nos afecta este límite? Asumamos que la variable continua subyacente $X$, sin límite de resolución, tiene distribución normal $N(\mu,\sigma^2)$. Por lo tanto, el promedio de $n$ muestras tendrá distribución $N(\mu, \sigma^2/n)$. Llamemos $\widetilde{X}$ a la variable que medimos, limitada por la resolución. 1. ¿Cómo simularía el efecto del límite de resolución $\delta$? Es decir, ¿cómo obtendría una muestra de $\widetilde{X}$ a partir de una muestra de $X$? 2. ¿Cambian la esperanza $E[\widetilde{X}]$, la varianza $\text{Var}(\widetilde{X})$, y la varianza del promedio de $n$ de $\text{Var}(\frac{1}{n} \sum_i^n \widetilde{X}_i)$ respecto de la de $X$? ¿Dependen de la resolución $\delta$? Bibliografía: - Kollar, I. (1994). Bias of mean value and mean square value measurements based on quantized data. IEEE Transactions on Instrumentation and Measurement. https://doi.org/10.1109/19.328894 - Widrow, B., Kollar, I., & Ming-Chang Liu. (1996). Statistical theory of quantization. IEEE Transactions on Instrumentation and Measurement. https://doi.org/10.1109/19.492748