# Guía 9
## Tests de Hipótesis
1.
Se realiza un experimento para estudiar una cierta ley física,
$y=f(x)$. Para 50 valores distintos $x_{i}$ se mide $y_{i}$, con
errores gaussianos de varianza $\sigma_{i}^{2}$, y se calcula la
variable aleatoria
$S=\sum_{i=1}^{50}[(y_{i}-f(x_{i}))/\sigma_{i}]^{2}$, la cual crece
cuanto más difieran los datos experimentales $y_{i}$ de las
respectivas predicciones teóricas $f(x_{i})$.
1. Bajo la suposición de que la ley física es válida, ?'qué valor
espera obtener para $S$?
2. Utilizando la aproximación dada por el teorema central del
límite, calcule dentro de qué rango espera encontrar a $S$ con
un 95% de probabilidad.
3. Al realizarse el experimento se obtiene $S=80$, y se concluye
que la ley física no es válida. ?'Cuál es la probabilidad de que
esta conclusión sea errónea y que un valor de $S\ge80$ sea
obtenido debido a una fluctuación estadística de los
datos? $p \simeq 0.5\%$
4. Se repite otras 14 veces el experimento (c/u con 50 mediciones),
obteniendo en todos los casos $S<80$. ?'Cuál es la probabilidad
en este caso de que la medición $S\ge80$ se debiera a una
fluctuación? $p \simeq 7\%$
2.
Se desea testear si un conjunto de $n$ mediciones
$\{x_i,y_i\pm\sigma_i\}$, con errores gaussianos en $y$, es
consistente con cierta predicción teórica $y=f(x)$. Para ello se
construye el estadístico $S=\sum_i[(y_i-f(x_i))/\sigma_i]^2$, cuya
distribución es $\chi^2_n$ si la hipótesis es correcta (?'por qué?),
y se calcula $p\equiv P(\chi^2>S)$, denominado valor-$P$ del
resultado.
1. []{#itm:test-hipo-chi2-a label="itm:test-hipo-chi2-a"} Muestre
que si $X$ es una variable aleatoria con densidad de
probabilidad $f_X(t)$, entonces la variable $Y$, definida como
$Y\equiv\int_{-\infty}^x f_X(t)\,{\rm d}t$, tiene distribución
uniforme en \[0,1\].
2. Usando
[\[itm:test-hipo-chi2-a\]](#itm:test-hipo-chi2-a){reference-type="ref"
reference="itm:test-hipo-chi2-a"} encuentre cual es la
distribución de la variable aleatoria valor-$P$ bajo la
suposición de que la teoría es correcta, y muestre que el valor
esperado de esta probabilidad es 50%.
3. Se decide usar como criterio para rechazar la hipótesis que $p$
sea menor que 0.05. Exprese en palabras cuál es el suceso cuya
probabilidad es 5%.
4. ?'Qué le sugiere o que concluye si el resultado del test hubiera
sido $p\geq99\%$?
3.
El bosón W es una partícula elemental intermediaria de la fuerza
débil descubierta en 1983. Su masa ha sido medida por diversos
experimentos, con distintos niveles de precisión. Los datos de la
edición 2000 del Review of Particle Properties son, en MeV:
::: center
-------- -------- ------- -------------
Masa W Experimento
80.482 $\pm$ 0.091 DØ
80.423 $\pm$ 0.112 Aleph
80.38 $\pm$ 0.12 Opal
80.61 $\pm$ 0.15 L3
80.41 $\pm$ 0.18 CDF
-------- -------- ------- -------------
:::
Se desea testear si los resultados son consistentes entre sí.
Escriba un test a partir de lo discutido en el problema anterior y
calcule el
valor-$P$. $P$=0.793
4.
[]{#itm:tests-de-medias label="itm:tests-de-medias"}
Considere dos muestras independientes $X_1,\ldots,X_m$ e
$Y_1,\ldots,Y_n$ con distribuciones gaussianas $N(\mu_{X},\sigma^2)$
y $N(\mu_{Y},\sigma^2)$, $\mu_X, \mu_Y$ y $\sigma$ desconocidas. Se
quiere testear la hipótesis $H_0:~\mu_X=\mu_Y$ contra
$H_1:~\mu_X \neq \mu_Y$.
Sea el estadístico
U=($\bar{X}$-$\bar{Y}$)$\oldsqrt[\ ]{\frac{m+n-2}{(1/m+1/n)(s_X^2+s_Y^2)}}$,
$s_X^2$=$\sum_i^m(X_i-\bar{X})^2$ $s_Y^2=\sum_i^n(Y_i-\bar{Y})^2:$
1. Muestre que si $\mu_X=\mu_Y$, el estadístico U tiene
distribución t-Student con $n+m-2$ grados de libertad.
2. Analice en que rango debería estar U para sospechar de la
hipótesis $H_0$.
3. Proponga una zona critica para testear $H_0$ contra $H_1$ con
significancia $\alpha$, en términos del estadístico $U$ y un
cuantil de la t-Student.
4. ?'Como sería la zona crítica si ahora se desea testear
$H_0:~\mu_X\leq\mu_Y$ contra $H_1:~\mu_X>\mu_Y$ con
significancia $\alpha$?
5.
[]{#itm:tests-de-medias-aplicacion
label="itm:tests-de-medias-aplicacion"} Apliquemos el test-t
descripto en el problema anterior a un caso real. Se mide el módulo
de Young de un conjunto de aceros templados (B) y sin templar (A)
disponibles en el mercado y se quiere testear si el módulo de Young
es mayor para los templados. Al medir se obtiene\
A: 0.8 0.9 1.05 1.2 1.3 1.3; y B: 1.0 1.4 1.7 1.9 2.3.
Escriba la hipótesis nula y la alternativa, indique la zona crítica
para una significancia $\alpha=0.05$, determine el valor-$P$ de las
mediciones y obtenga sus
conclusiones. $P$=0.0148
6.
El test-t del problema
[\[itm:tests-de-medias-aplicacion\]](#itm:tests-de-medias-aplicacion){reference-type="ref"
reference="itm:tests-de-medias-aplicacion"} supone igual varianza
para ambas muestras. ?'Puede decirse que los datos apoyan esta
suposición con un CL de 95%?
7.
Se desea determinar si los siguientes tres conjuntos de mediciones
independientes son consistentes. Considere (1) normalidad de los
datos; (2) de ignorancia de su distribución (test de
Kruskal-Wallis). A: 6.4 6.8 7.2 8.3 8.4 9.1 9.4 9.7 B: 2.5 3.7 4.9
5.4 5.9 8.1 8.2 C: 1.3 4.1 4.9 5.2 5.5 8.2
8.
Los individuos con una cierta enfermedad pueden presentar un síntoma
X y un síntoma Y. Para confirmar la hipótesis que al ocurrir uno hay
alta probabilidad que ocurra el otro, un investigador examina 20
pacientes. Encuentra que hay 11 que no presentan el síntoma X, y de
ellos 9 tampoco presentan el síntoma Y. Por otro lado, entre los 9
que presentan X, 6 presentan Y. Los datos apuntan entonces en la
dirección de la hipótesis, pero es necesario establecer si la
medición obtenida puede ser fruto de una fluctuación estadística.
Para ello se aplica el test exacto de Fisher, con una significancia
de 0.05.
1. Escriba la tabla de contingencia de las mediciones y dé los
otros 8 posibles resultados del experimento. Calcule sus
probabilidades y sus grados de asimetría, $|a/(a+b)-c/(c+d)|$. A
partir de ésto encuentre las regiones críticas con nivel de
significancia 0.05 para ambos tests unilaterales y para el test
bilateral.
::: center
X $\bar{X}$
----------- --------- --------------- ---------------
Y a b $n_{Y}$
$\bar{Y}$ c d $n_{\bar{Y}}$
$n_{X}$ $n_{\bar{X}}$ n
:::
2. Discuta si corresponde un test unilateral o bilateral, y muestre
que el resultado permite rechazar la hipótesis nula con el nivel
de significancia establecido.
3. Calcule el valor-$P$ para el test unilateral y bilateral \[rtas:
0.03989 y 0.06478\]. Note que si el test hubiera sido bilateral
no se podría haber establecido correlación al 95% CL.
4. Diga como debería haber sido un problema para que corresponda
hacer el test bilateral.
9.
*Tests de Kolmogorov y de Cramer-von Misses*. Se desea investigar la
hipótesis de que una muestra $\{x_i\}$, con $x_i\in\mathcal{R}$ e
$i$=1,$n$, proviene de una cierta distribución $F(x)$. Para ello se
ordena la muestra en orden creciente $x_i$P$=0.0274
2. Si bien el test-t tiene más potencia, es también más dependiente
de la suposición de normalidad. Para estudiar la robustez de
ambos suponga que se agrega una medición sin sentido a la
muestra B (20, por ejemplo, un 'outlier'). Muestre que Wilcoxon
esencialmente no cambia, mientras el test-t ahora da acuerdo con
la hipótesis nula. Discuta por qué ocurre ésto, teniendo en
cuenta que, aunque poco creíble, el dato agregado refuerza en
realidad la evidencia de mayor Módulo de Young para aceros
templados.
12.
Aplique los tests de Kolmogorov y de Wilcoxon para testear la
situación descripta en el problema
[\[test_de_runs\]](#test_de_runs){reference-type="ref"
reference="test_de_runs"}. Muestre que permiten rechazar la
hipótesis de consistencia con un CL de 98% y 99%, respectivamente.
13.
Las estrellas en formación en galaxias jóvenes se pueden clasificar
en 3 grupos según su velocidad de rotación: (1) lentas, (2)
normales, (3) rápidas. Una hipótesis es que la velocidad angular
está relacionada con las características del disco de acreción, ya
que hay estrellas jóvenes: (a) sin disco, (b) con disco cercano, (c)
con disco lejano. Se midieron para ello 189 estrellas en el cluster
NGC2264 obteniéndo la siguiente tabla:
::: center
\(1\) \(2\) \(3\) Tot
------- ------- ------- ------- -----
\(a\) 20 15 12 47
\(b\) 24 27 32 83
\(c\) 14 22 23 59
Tot 58 64 67 189
:::
Los valores totales en la última fila y la última columna se
obtuvieron sumando las respectivas filas o columnas de la tabla de
$3\times3$. Llamemos $p_{ix}$, $p_i$, $p_x$, con $i=1,2,3$ y
$x=a,b,c$, a las probabilidades que una estrella sea del tipo $ix$,
$i$ o $x$, y sea $H_0$: $p_{ix} = p_i\,p_x$, $i=1,2,3$ y $x=a,b,c$
Considerando que todos los $n_{ix}$ son suficientemente grandes tal
que vale la aproximación poisson$\rightarrow$gauss, diseñe un test
de $H_0$ basado en la estadística $\chi^2$ y determine el valor-$P$
correspondiente a los datos obtenidos. Justifique cuidadosamente el
número de grados de libertad usados para obtener el valor-$P$, y
explique en palabras que concluye de su resultado.
14.
La eficiencia de un detector en condiciones normales es 50%, y para
verificar que no caiga significativamente se testea periódicamente
$H_0: \varepsilon=1/2$ vs $H_1: \varepsilon<1/2$ realizando 40
ensayos y midiendo la fracción de fallos. Suponga que para $n=40$ ya
es válida la aproximación normal
$\hat{\varepsilon}\sim N(\varepsilon,\oldsqrt[\ ]{\varepsilon(1-\varepsilon)/n})$.
1. Detemine el criterio de rechazo para un nivel de significancia
0.05
2. Supóngase que si la eficiencia baja de 33% los datos se vuelven
básicamente inusables. Bajo esta consideración los
investigadores necesitan una alta probabilidad de detectar una
disminución de tal magnitud, si ésta se produce. ?'Cuál es la
potencia de nuestro test si el valor real de la eficiencia es
$\varepsilon=\nicefrac{1}{3}$?
3. A la vista de la importancia que adopta no superar el límite de
$\nicefrac{1}{3}$, ?'qué tamaño muestral deberíamos elegir para
garantizar que la potencia del test sea
0.97? 106
15.
Sobre un conjunto de datos se realiza el test $\chi^2$ y el test
runs, obteniéndose $\chi^2_a$ y $r_a$, con respectivas
probabilidades $P_1=P(\chi^2>\chi^2_a)$ y $P_2=P(r\le r_a)$.
1. Muestre que $y_1$ = -$2\ln P_1$ tiene distribución $\chi^2_2$, y
discuta bajo que condiciones también $y_2$ = -$2\ln P_2$ es
$\chi^2_2$. ?'Qué distribución tendrá entonces $y$ =
-$2\ln(P_1P_2)$, sabiendo que ambos tests son independientes?
2. Si los resultados numéricos son $P_1=0.04$ y $P_2=0.04$, cuál es
el valor-$P$ de ambos tests combinados?
Comentario: este ejercicio requiere haber visto como es la
distribución de $y$ = -$2\ln(P_1P_2)$ sabiendo que ambos test son
independientes.