Una
prueba estadística no paramétrica esta
basada en un modelo que solo especifica condiciones muy generales y ninguna acerca de la forma especifica de la
distribución de la cual fue obtenida la muestra. Ciertas suposiciones están
relacionadas con la mayoría de las pruebas no paramétricas, a saber: que las observaciones son independientes y
quizá que la variable en estudio es continua; pero estas suposiciones son
menores y más débiles que aquellas asociadas con las pruebas paramétricas.
Las pruebas no paramétricas han de emplearse
cuando no se cumplen los denominados supuestos paramétricos. Teniendo en cuenta
los criterios mas frecuentes, toda prueba no paramétrica o contraste es considerado no paramétrico si
se da algunas de las siguientes situaciones:
· Se utilizan datos medidos a nivel de un intervalo o razón, pero la hipótesis formulada no esta referida a parámetros de las distribuciones poblacionales.
· El estadístico de contraste empleado no asume supuestos de la población que han de cumplirse.
· El tamaño de la muestra es muy pequeño.
Como todo tiene un pro; en la estadística no
paramétrica no hay excepciones por lo tanto se presentan a continuación las
ventajas y desventajas de las pruebas no paramétricas:
VENTAJAS:
1.
Si
el tamaño de la muestra es muy pequeño, puede no haber otra opción que usar
estadística no paramétrica, a menos que la naturaleza de la distribución de la
población se conozca con exactitud.
2.
Las
pruebas no paramétricas típicamente hacen menos suposiciones acerca de los
datos y pueden ser más relevantes en una situación particular. Además, las
hipótesis probadas por una prueba no paramétrica pueden ser más adecuadas para
la investigación.
3.
Los
métodos paramétricos están disponibles
para tratar datos que son simplemente
clasificatorios o categóricos, es decir que son medios en una escala
nominal. Ninguna técnica paramétrica se aplica a tales datos.
4.
Existen
pruebas estadísticas no paramétricas que son adecuadas para tratar muestras
obtenidas de observaciones de diferentes poblaciones. Las pruebas paramétricas
a menudo no pueden manipular tales datos sin exigirnos hacer suposiciones
aparentemente irreales o requisitos pesados de computación.
5.
Las
pruebas estadísticas típicamente son mas fáciles de aprender y aplicar que las
pruebas paramétricas. Además su,
interpretación suela ser mas directa que
la interpretación de las pruebas paramétricas
DESVENTAJAS:
·
Una
objeción de las pruebas no paramétricas es que no son sistemáticas, mientras
que las pruebas estadísticas
paramétricas han sido sistematizadas y
diferentes pruebas son simplemente variaciones
de un tema central.
·
Otra
objeción de este tipo de prueba estadística se relaciona con la conveniencia, este se debe a que no se
tiene una distribución fija para este tipo de estadística, por lo que en
ocasiones puede ser un problema elegir la adecuada.
·
Las
tablas necesarias para aplicar estadística no paramétrica están muy difundidas
y aparecen en diferentes formatos, por lo que podría provocar confusión en el
investigador ó la persona que este
aplicando una prueba no paramétrica.
tipos de pruebas no Parametricas
existen muchas pruebas estadisticas no parametricas, pero solo nos enfocaremos en 3 las cuales son las más utilizadas (si quieres mas informacion ve a la seccion de paginas recomendadas).PRUEBA DE LOS SIGNOS:
La pruebas de los signos es aplicable para
contrastar la hipótesis de que la respuesta de dos” tratamientos
“pertenecen a poblaciones idénticas.
Para la utilización de esta prueba se requiere únicamente que las poblaciones subyacentes sean
continuas y que las respuestas de cada par
asociado estén medidas por lo
menos en una escala ordinal.
La hipótesis nula puede expresarse como:
p(xi>yi)=p(xi<yi)=0.5
Siendo
la
repuesta del elemento i-enésimo al primer “tratamiento” e
la
respuesta del elemento i-enésimo al segundo “tratamiento”
La hipótesis alternativa puede ser cuando se postula que X es
estocásticamente mayor ó menor que Y,
o no direccional, cuando no predice la
dirección de la diferencia.
Para realizar el contraste se hallan los signos (+ o -) de las
diferencias no nulas entre las
respuestas de los dos componentes de cada par
y se cuenta cuantas son positivas, S+, y cuantas negativas S-, “si HO es cierta, es de esperar que la mitad de las aproximaciones sean
positivas y las otras sean negativas”.
Prueba de los signos de Wilcoxon:
Es una prueba no paramétrica que utiliza rangos ordenados de datos muéstrales que consiste en datos
aparearos. Se usa para probar la
hipótesis nula de que una población de diferencias tiene una mediana de cero; de
tal manera que la hipótesis nula y alternativa
son las siguientes:
- La
hipótesis nula: los datos aparearos
tienen diferencias que provienen
de una población con una mediana igual a
cero.
- La
hipótesis alternativa: los datos aparearos tienen diferencias que provienen de
una población con una mediana diferente de cero.
Este tipo de prueba puede usarse también para probar la aseveración de que una muestra proviene de una población
con una mediana específica. Para que se pueda usar este tipo de prueba deben
cumplirse los siguientes requisitos:
- Los
datos consisten en datos aparearos que se seleccionaron aleatoriamente.
- La
población de las diferencias( calculadas a partir de los pares de datos) tiene
una distribución que es aproximadamente
simétrica, lo que quiere decir que la
mitad izquierda de su histograma es
aproximadamente una imagen de
espejo de la mitad derecha( no existen
de que los datos tenga una distribución
normal).
El
contraste se basa en el comportamiento de las diferencias entre las
puntuaciones de los elementos de cada par asociado, teniendo en cuenta no sólo
el signo, sino también la magnitud de la diferencia.
prueba de U de Mann-Whitnet:
Con esta prueba se puede demostrar que la
hipótesis de que las dos muestras proviene
de poblaciones idénticas sin tener que suponer
que las poblaciones muestreadas tienen distribuciones normales; de
hecho, la prueba solo requiere únicamente que las poblaciones muestreadas sean continuas para evitar las coincidencias y en la práctica no importa si se cumple esa suposición.
Si existe una diferencia apreciable entre las medias de las dos poblaciones de las dos poblaciones,
la mayoría de los rangos inferiores tienden a tener los valores de una
muestra mientras que la mayoría de los
rangos superiores a tomar valores de la otra muestra. La prueba de la hipótesis
nula de que las dos muestras provienen
de poblaciones idénticas se puede basar
por tanto en w1, la suma de los rangos
de la primera muestra y w2, la suma de los rangos de la segunda muestra.
Si el tamaño de las muestras son n1 y n2, la
suma de w1 y w2 es simplemente la suma de
los primeros n1+n2 enteros
positivos que se sabe que es igual a:
A partir de esta formula podemos decir que
el estadístico de la prueba de U esta determinado por cualquiera de las dos
formulas:
Las pruebas resultantes son equivalentes a aquéllas que se basan en w1
ó w2, pero tienen la ventaja de
que se prestan más fácilmente a la
construcción de tablas de valores
críticos. No solo lo de U1 y U2 toman valores contenidos en el intervalo de 0 a n1n2 (en realidad su suma es siempre igual n1n2) pero
sus distribuciones de muestreo son simétricas con respecto a
.
La hipótesis
nula en la prueba seria en demostrar
que las dos muestras provienen de
poblaciones idénticas contra la
hipótesis alternativa de que las dos
poblaciones tienen medias desiguales con el criterio siguiente:
Se rehace
la hipótesis nula si:
U≤
Donde U es dado en cualquier tabla de este
estadístico; U es el valor mas
grande para cual obtener U≤
,
es menor o igual a
.
En algunos manuales estadísticos se pueden encontrar otras tablas más extensas
pero cuando n1 y n2 son mayores a 8, suele considerarse razonable utilizar la prueba de muestra grande.
EJERCICIOS PROPUESTOS
1) Se dice que dos tiendas poseen un promedio de ventas igual,recientemente una aditoria demostro que la tienda A posee en promedio de ventas mayor al de la tienda B.demostrar por prueba de rangos con wilcoxon y por prueba de signos, use un nivel de significancia del 5%
explicación por prueba de signos
2) se muestran las ventas de un nuevo producto durante un mes dado en 12 establecimientos comerciales seleccionados al azar. use la prueba de los signos para conocer si el monto mediano de ventas en la población no excede las 10 unidades, considerando un nivel de significancia del 5%.
ver explicación