# Guía 9 ## Tests de Hipótesis 1. Se realiza un experimento para estudiar una cierta ley física, $y=f(x)$. Para 50 valores distintos $x_{i}$ se mide $y_{i}$, con errores gaussianos de varianza $\sigma_{i}^{2}$, y se calcula la variable aleatoria $S=\sum_{i=1}^{50}[(y_{i}-f(x_{i}))/\sigma_{i}]^{2}$, la cual crece cuanto más difieran los datos experimentales $y_{i}$ de las respectivas predicciones teóricas $f(x_{i})$. 1. Bajo la suposición de que la ley física es válida, ?'qué valor espera obtener para $S$? 2. Utilizando la aproximación dada por el teorema central del límite, calcule dentro de qué rango espera encontrar a $S$ con un 95% de probabilidad. 3. Al realizarse el experimento se obtiene $S=80$, y se concluye que la ley física no es válida. ?'Cuál es la probabilidad de que esta conclusión sea errónea y que un valor de $S\ge80$ sea obtenido debido a una fluctuación estadística de los datos? $p \simeq 0.5\%$ 4. Se repite otras 14 veces el experimento (c/u con 50 mediciones), obteniendo en todos los casos $S<80$. ?'Cuál es la probabilidad en este caso de que la medición $S\ge80$ se debiera a una fluctuación? $p \simeq 7\%$ 2. Se desea testear si un conjunto de $n$ mediciones $\{x_i,y_i\pm\sigma_i\}$, con errores gaussianos en $y$, es consistente con cierta predicción teórica $y=f(x)$. Para ello se construye el estadístico $S=\sum_i[(y_i-f(x_i))/\sigma_i]^2$, cuya distribución es $\chi^2_n$ si la hipótesis es correcta (?'por qué?), y se calcula $p\equiv P(\chi^2>S)$, denominado valor-$P$ del resultado. 1. []{#itm:test-hipo-chi2-a label="itm:test-hipo-chi2-a"} Muestre que si $X$ es una variable aleatoria con densidad de probabilidad $f_X(t)$, entonces la variable $Y$, definida como $Y\equiv\int_{-\infty}^x f_X(t)\,{\rm d}t$, tiene distribución uniforme en \[0,1\]. 2. Usando [\[itm:test-hipo-chi2-a\]](#itm:test-hipo-chi2-a){reference-type="ref" reference="itm:test-hipo-chi2-a"} encuentre cual es la distribución de la variable aleatoria valor-$P$ bajo la suposición de que la teoría es correcta, y muestre que el valor esperado de esta probabilidad es 50%. 3. Se decide usar como criterio para rechazar la hipótesis que $p$ sea menor que 0.05. Exprese en palabras cuál es el suceso cuya probabilidad es 5%. 4. ?'Qué le sugiere o que concluye si el resultado del test hubiera sido $p\geq99\%$? 3. El bosón W es una partícula elemental intermediaria de la fuerza débil descubierta en 1983. Su masa ha sido medida por diversos experimentos, con distintos niveles de precisión. Los datos de la edición 2000 del Review of Particle Properties son, en MeV: ::: center -------- -------- ------- ------------- Masa W Experimento 80.482 $\pm$ 0.091 DØ 80.423 $\pm$ 0.112 Aleph 80.38 $\pm$ 0.12 Opal 80.61 $\pm$ 0.15 L3 80.41 $\pm$ 0.18 CDF -------- -------- ------- ------------- ::: Se desea testear si los resultados son consistentes entre sí. Escriba un test a partir de lo discutido en el problema anterior y calcule el valor-$P$. $P$=0.793 4. []{#itm:tests-de-medias label="itm:tests-de-medias"} Considere dos muestras independientes $X_1,\ldots,X_m$ e $Y_1,\ldots,Y_n$ con distribuciones gaussianas $N(\mu_{X},\sigma^2)$ y $N(\mu_{Y},\sigma^2)$, $\mu_X, \mu_Y$ y $\sigma$ desconocidas. Se quiere testear la hipótesis $H_0:~\mu_X=\mu_Y$ contra $H_1:~\mu_X \neq \mu_Y$. Sea el estadístico U=($\bar{X}$-$\bar{Y}$)$\oldsqrt[\ ]{\frac{m+n-2}{(1/m+1/n)(s_X^2+s_Y^2)}}$, $s_X^2$=$\sum_i^m(X_i-\bar{X})^2$ $s_Y^2=\sum_i^n(Y_i-\bar{Y})^2:$ 1. Muestre que si $\mu_X=\mu_Y$, el estadístico U tiene distribución t-Student con $n+m-2$ grados de libertad. 2. Analice en que rango debería estar U para sospechar de la hipótesis $H_0$. 3. Proponga una zona critica para testear $H_0$ contra $H_1$ con significancia $\alpha$, en términos del estadístico $U$ y un cuantil de la t-Student. 4. ?'Como sería la zona crítica si ahora se desea testear $H_0:~\mu_X\leq\mu_Y$ contra $H_1:~\mu_X>\mu_Y$ con significancia $\alpha$? 5. []{#itm:tests-de-medias-aplicacion label="itm:tests-de-medias-aplicacion"} Apliquemos el test-t descripto en el problema anterior a un caso real. Se mide el módulo de Young de un conjunto de aceros templados (B) y sin templar (A) disponibles en el mercado y se quiere testear si el módulo de Young es mayor para los templados. Al medir se obtiene\ A: 0.8 0.9 1.05 1.2 1.3 1.3; y B: 1.0 1.4 1.7 1.9 2.3. Escriba la hipótesis nula y la alternativa, indique la zona crítica para una significancia $\alpha=0.05$, determine el valor-$P$ de las mediciones y obtenga sus conclusiones. $P$=0.0148 6. El test-t del problema [\[itm:tests-de-medias-aplicacion\]](#itm:tests-de-medias-aplicacion){reference-type="ref" reference="itm:tests-de-medias-aplicacion"} supone igual varianza para ambas muestras. ?'Puede decirse que los datos apoyan esta suposición con un CL de 95%? 7. Se desea determinar si los siguientes tres conjuntos de mediciones independientes son consistentes. Considere (1) normalidad de los datos; (2) de ignorancia de su distribución (test de Kruskal-Wallis). A: 6.4 6.8 7.2 8.3 8.4 9.1 9.4 9.7 B: 2.5 3.7 4.9 5.4 5.9 8.1 8.2 C: 1.3 4.1 4.9 5.2 5.5 8.2 8. Los individuos con una cierta enfermedad pueden presentar un síntoma X y un síntoma Y. Para confirmar la hipótesis que al ocurrir uno hay alta probabilidad que ocurra el otro, un investigador examina 20 pacientes. Encuentra que hay 11 que no presentan el síntoma X, y de ellos 9 tampoco presentan el síntoma Y. Por otro lado, entre los 9 que presentan X, 6 presentan Y. Los datos apuntan entonces en la dirección de la hipótesis, pero es necesario establecer si la medición obtenida puede ser fruto de una fluctuación estadística. Para ello se aplica el test exacto de Fisher, con una significancia de 0.05. 1. Escriba la tabla de contingencia de las mediciones y dé los otros 8 posibles resultados del experimento. Calcule sus probabilidades y sus grados de asimetría, $|a/(a+b)-c/(c+d)|$. A partir de ésto encuentre las regiones críticas con nivel de significancia 0.05 para ambos tests unilaterales y para el test bilateral. ::: center X $\bar{X}$ ----------- --------- --------------- --------------- Y a b $n_{Y}$ $\bar{Y}$ c d $n_{\bar{Y}}$ $n_{X}$ $n_{\bar{X}}$ n ::: 2. Discuta si corresponde un test unilateral o bilateral, y muestre que el resultado permite rechazar la hipótesis nula con el nivel de significancia establecido. 3. Calcule el valor-$P$ para el test unilateral y bilateral \[rtas: 0.03989 y 0.06478\]. Note que si el test hubiera sido bilateral no se podría haber establecido correlación al 95% CL. 4. Diga como debería haber sido un problema para que corresponda hacer el test bilateral. 9. *Tests de Kolmogorov y de Cramer-von Misses*. Se desea investigar la hipótesis de que una muestra $\{x_i\}$, con $x_i\in\mathcal{R}$ e $i$=1,$n$, proviene de una cierta distribución $F(x)$. Para ello se ordena la muestra en orden creciente $x_i$P$=0.0274 2. Si bien el test-t tiene más potencia, es también más dependiente de la suposición de normalidad. Para estudiar la robustez de ambos suponga que se agrega una medición sin sentido a la muestra B (20, por ejemplo, un 'outlier'). Muestre que Wilcoxon esencialmente no cambia, mientras el test-t ahora da acuerdo con la hipótesis nula. Discuta por qué ocurre ésto, teniendo en cuenta que, aunque poco creíble, el dato agregado refuerza en realidad la evidencia de mayor Módulo de Young para aceros templados. 12. Aplique los tests de Kolmogorov y de Wilcoxon para testear la situación descripta en el problema [\[test_de_runs\]](#test_de_runs){reference-type="ref" reference="test_de_runs"}. Muestre que permiten rechazar la hipótesis de consistencia con un CL de 98% y 99%, respectivamente. 13. Las estrellas en formación en galaxias jóvenes se pueden clasificar en 3 grupos según su velocidad de rotación: (1) lentas, (2) normales, (3) rápidas. Una hipótesis es que la velocidad angular está relacionada con las características del disco de acreción, ya que hay estrellas jóvenes: (a) sin disco, (b) con disco cercano, (c) con disco lejano. Se midieron para ello 189 estrellas en el cluster NGC2264 obteniéndo la siguiente tabla: ::: center \(1\) \(2\) \(3\) Tot ------- ------- ------- ------- ----- \(a\) 20 15 12 47 \(b\) 24 27 32 83 \(c\) 14 22 23 59 Tot 58 64 67 189 ::: Los valores totales en la última fila y la última columna se obtuvieron sumando las respectivas filas o columnas de la tabla de $3\times3$. Llamemos $p_{ix}$, $p_i$, $p_x$, con $i=1,2,3$ y $x=a,b,c$, a las probabilidades que una estrella sea del tipo $ix$, $i$ o $x$, y sea $H_0$: $p_{ix} = p_i\,p_x$, $i=1,2,3$ y $x=a,b,c$ Considerando que todos los $n_{ix}$ son suficientemente grandes tal que vale la aproximación poisson$\rightarrow$gauss, diseñe un test de $H_0$ basado en la estadística $\chi^2$ y determine el valor-$P$ correspondiente a los datos obtenidos. Justifique cuidadosamente el número de grados de libertad usados para obtener el valor-$P$, y explique en palabras que concluye de su resultado. 14. La eficiencia de un detector en condiciones normales es 50%, y para verificar que no caiga significativamente se testea periódicamente $H_0: \varepsilon=1/2$ vs $H_1: \varepsilon<1/2$ realizando 40 ensayos y midiendo la fracción de fallos. Suponga que para $n=40$ ya es válida la aproximación normal $\hat{\varepsilon}\sim N(\varepsilon,\oldsqrt[\ ]{\varepsilon(1-\varepsilon)/n})$. 1. Detemine el criterio de rechazo para un nivel de significancia 0.05 2. Supóngase que si la eficiencia baja de 33% los datos se vuelven básicamente inusables. Bajo esta consideración los investigadores necesitan una alta probabilidad de detectar una disminución de tal magnitud, si ésta se produce. ?'Cuál es la potencia de nuestro test si el valor real de la eficiencia es $\varepsilon=\nicefrac{1}{3}$? 3. A la vista de la importancia que adopta no superar el límite de $\nicefrac{1}{3}$, ?'qué tamaño muestral deberíamos elegir para garantizar que la potencia del test sea 0.97? 106 15. Sobre un conjunto de datos se realiza el test $\chi^2$ y el test runs, obteniéndose $\chi^2_a$ y $r_a$, con respectivas probabilidades $P_1=P(\chi^2>\chi^2_a)$ y $P_2=P(r\le r_a)$. 1. Muestre que $y_1$ = -$2\ln P_1$ tiene distribución $\chi^2_2$, y discuta bajo que condiciones también $y_2$ = -$2\ln P_2$ es $\chi^2_2$. ?'Qué distribución tendrá entonces $y$ = -$2\ln(P_1P_2)$, sabiendo que ambos tests son independientes? 2. Si los resultados numéricos son $P_1=0.04$ y $P_2=0.04$, cuál es el valor-$P$ de ambos tests combinados? Comentario: este ejercicio requiere haber visto como es la distribución de $y$ = -$2\ln(P_1P_2)$ sabiendo que ambos test son independientes.