F-2925: ensayo matematicas II

Teoría estadística de las decisiones

Muy a menudo, en la práctica, se tienen que tomar decisiones sobre poblaciones, partiendo de la información muestral de las mismas. Tales decisiones se llaman decisiones estadísticas.

Hipótesis estadísticas. Hipótesis nula

Para llegar a tomar decisiones, conviene hacer determinados supuestos o conjeturas acerca de las poblaciones que se estudian. Tales supuestos que pueden ser o no ciertos se llaman hipótesis estadísticas y, en general, lo son sobre las distribuciones de probabilidad de las poblaciones.

En muchos casos se formulan las hipótesis estadísticas con el solo propósito de rechazarlas o invalidarlas. Por ejemplo, si se quiere decidir si una moneda está cargada, se formula la hipótesis de que la moneda está bien, s decir, p = 0.5; donde p es la probabilidad de cara. Análogamente, si se quiere decidir sobre si un procedimiento es mejor que otro, se formula la hipótesis de que no hay diferencia entre los procedimientos (es decir, cualquier diferencia observada se debe meramente a fluctuaciones en el muestreo de la misma población). Tales hipótesis se llaman también hipótesis nulas y se denotan por ho.

Cualquier hipótesis que difiera de una hipótesis dada se llama hipótesis alternativa.

Ensayos de hipótesis y significación

Si en el supuesto de que una hipótesis determinada es cierta, se encuentra que los resultados observados en una muestra al azar difieren marcadamente de aquellos que cabía esperar con la hipótesis y con la variación propia del muestreo, se diría que las diferencias observadas son significativas y se estaría en condiciones de rechazar la hipótesis (o al menos no aceptarla de acuerdo con la evidencia obtenida). Por ejemplo, si en 20 lanzamientos de una moneda se obtienen 16 caras, se estaría inclinado a rechazar la hipótesis de que la moneda está bien, aunque sería posible que fuese un rechazamiento erróneo.

Los procedimientos que facilitan el decidir si una hipótesis se acepta o se rechaza o el determinar si las muestras observadas difieren significativamente de los resultados esperados se llaman ensayos de hipótesis, ensayos de significación o reglas de decisión.

Errores de tipo i y tipo ii

Si se rechaza una hipótesis cuando debería ser aceptada, se dice que se comete un error del tipo i. Si, por el contrario, se acepta una hipótesis que debería ser rechazada, se dice que se comete un error del tipo ii. En cualquiera de los dos casos se comete un error al tomar una decisión equivocada.

Para que cualquier ensayo de hipótesis o reglas de decisión sea bueno, debe diseñarse de forma que minimice los errores de decisión. Esto no es tan sencillo como pueda parecer puesto que para un tamaño de muestra dado, un intento de disminuir un tipo de error, va generalmente acompañado por un incremento en el otro tipo de error. En la práctica, un tipo de error puede tener más importancia que el otro, y así se tiende a conseguir poner una limitación al error de mayor importancia. La única forma de reducir al tiempo ambos tipos de error es incrementar el tamaño de la muestra, lo cual puede ser o no ser posible.

Nivel de significación

La probabilidad máxima con la que en el ensayo de una hipótesis se puede cometer un error del tipo i se llama nivel de significación del ensayo. Esta probabilidad generalmente se fija antes de la extracción de las muestras, de modo que los resultados obtenidos no influyen en la elección.

En la práctica se acostumbra a utilizar niveles de significación del 0.05 ó 0.01, aunque igualmente pueden emplearse otros valores. Si, por ejemplo, se elige un nivel de significación del 0.05 ó 5 % al diseñar un ensayo de hipótesis, entonces hay aproximadamente 5 ocasiones en 100 en que se rechazaría la hipótesis cuando debería ser aceptada, es decir, se está con un 95 % de confianza de que se toma la decisión adecuada. En tal caso se dice que la hipótesis ha sido rechazada al nivel de significación del 0.05, lo que significa que se puede cometer error con una probabilidad de 0.05.

Ensayos referentes a la distribución normal

Para aclarar las ideas anteriores, supóngase que con una hipótesis dada, la distribución muestral de un estadístico s es una distribución normal con media µs y desviación típica uso entonces la distribución de la variable tipificada (representada por z) dada por z = (s –µs) /ss, es una normal tipificada (media 0, varianza 1) y se muestra en la figura.

Como se indica en la figura, se puede estar con el 95 % de confianza de que, si la hipótesis es cierta, el valor de z obtenido de una muestra real para el estadístico s se encontrará entre -1.96 y 1.96 (puesto que el área bajo la curva normal entre estos valores es 0.95).

Sin embargo, si al elegir una muestra al azar se encuentra que z para ese estadístico se halla fuera del rango -1.96 a 1.96, lo que quiere decir que es un suceso con probabilidad de solamente 0.05 (área sombreada de la figura) si la hipótesis fuese verdadera. Entonces puede decirse que esta z difiere significativamente de la que cabía esperar bajo esta hipótesis y se estaría inclinado a rechazar la hipótesis.

El área total sombreada 0.05 es el nivel de significación del ensayo. Representa la probabilidad de cometer error al rechazar la hipótesis es decir, la probabilidad de cometer error del tipo i. Así, pues, se dice que la hipótesis se rechaza al nivel de significación del 0.05 o que la z obtenida del estadístico muestral dado es significativa al nivel de significación del 0.05.

El conjunto de las z que se encuentran fuera del rango -1.96 a 1.96 constituyen lo que se llama región crítica o región de rechace de la hipótesis o región de significación. El conjunto de las z que se encuentran dentro del rango -1,96 a 1,96 podía entonces llamarse región de aceptación de la hipótesis o región de no significación.

De acuerdo con lo dicho hasta ahora; se puede formular la siguiente regla de decisión o ensayo de hipótesis o significación.

(a) se rechaza la hipótesis al nivel de significación del 0.05 si la z obtenida para el estadístico s se encuentra fuera del rango -1.96 a 1.96 (es decir, z > 1,96 o z < -1,96). Esto equivale a decir que el estadístico muestral observado es significativo al nivel del 0,05.

(b) se acepta la hipótesis (o si se desea no se toma decisión alguna) en caso contrario.

A causa de su importante papel en los ensayos de hipótesis y significación, z recibe también el nombre de ensayo estadístico.

Debe ponerse de manifiesto que pueden igualmente emplearse otros niveles de significación. Por ejemplo, si se utilizase el nivel del 0.01 se sustituiría 1.96 en todo lo visto anteriormente por 2.58

F-2925

miércoles, 20 de junio de 2012

ensayo matematicas II

No hay comentarios:

Publicar un comentario