jueves, 14 de febrero de 2013

Intervalos de Confianza

En el contexto de estimar un parámetro poblacional, un intervalo de confianza es un rango de valores (calculado en una muestra) en el cual se encuentra el verdadero valor del parámetro, con una probabilidad determinada, es decir, un intervalo de confianza es un par de números entre los cuales se estima que estará cierto valor desconocido con una determinada probabilidad de acierto.


La probabilidad de que el verdadero valor del parámetro se encuentre en el intervalo construido se denomina nivel de confianza, y se denota 1-alfa. La probabilidad de equivocarnos se llama nivel de significancia y se simboliza α (alfa). Generalmente se construyen intervalos con confianza 1-alfa=95% (o significancia α =5%). Menos frecuentes son los intervalos con alfa=10% o α =1%.


Para construir un intervalo de confianza, se puede comprobar que la distribución Normal Estándar cumple:


P(-1.96 < z < 1.96) = 0.95 

Luego, si una variable X tiene distribución N(µ ), entonces el 95% de las veces se cumple:


El resultado es un intervalo que incluye al µ el 95% de las veces. Es decir, es un intervalo de confianza al 95% para la media µ cuando la variable X es normal yes conocido.

lunes, 11 de febrero de 2013

Libros interesantes de Estadística (Parte 2)

Uno de los objetivos de Blog de Estadística, es proporcionar información a nuestros visitantes sobre técnicas estadísticas y de análisis de datos. Para lograrlo, todas las semanas vamos  a promocionar una serie de libros relacionados con la estadística que podréis comprar gracias a Amazon en papel o en formato digital. Puedes ver la primera entrega de Libros de Estadística en el siguiente link: Libros de Estadística (Parte 1)
  • Metodología de la Investigación y Formulación de Proyectos - Estadística y Probabilidades [Versión Kindle]: El libro "METODOLOGIA DE LA INVESTIGACIÓN y Formulación de Proyectos - Estadística y Probabilidades" constituye una respuesta a la sentida necesidad de estudiantes y profesionales para el aprendizaje del método cientifico en la investigación, pasando por el cálculo de la muestra , la formulación del trabajo de grado y el permanente uso de las estadísticas para elaborar conclusiones y hacer inferencias, además de los apoyos brindados por la estadística y las probabilidades.
  • Curso básico de Estadística para los grados en Economía y Administración y Dirección de Empresas: Obra planteada como curso introductorio de Estadística para los estudiantes de los grados en Economía y Administración y Dirección de Empresas. Consta de 19 capítulos divididos en tres partes: Estadística Descriptiva, Cálculo de Probabilidades e Inferencia Estadística. En cada uno de ellos se presenta la teoría con una sección de problemas resueltos y otra con propuestos. 
  • Estadística descriptiva con Microsoft Excel 2010: La ventaja de este manual es que puede desarrollar el aprendizaje simultáneamente con el programa Excel 2010, programa que incorpora cambios importantes sobre las versiones anteriores. Sin embargo, no se dedica a explicar todos los apartados de Excel 2010, sino que se van tratando los distintos temas estadísticos y se van viendo con detalle aquellas funciones de Excel que se van necesitando en cada momento. De esta forma, cuando alguien esté interesado en hacer un determinado análisis estadístico podrá encontrar en este manual una explicación teórica de lo que quiere hacer y el modo práctico de llevarlo a cabo con Excel 2010. Está ilustrado con ejemplos que se van realizando a lo largo de toda la explicación, así como un análisis de los resultados obtenidos. Todos los temas incluyen además ejercicios propuestos y ejercicios resueltos con los que el lector podrá practicar por su cuenta lo explicado.
Comprando directamente desde los enlaces inferiores, obtendrás el mejor precio y ayudarás a mantener nuestro blog:

jueves, 7 de febrero de 2013

Datos Atípicos o Outliers

Antes de realizar cualquier análisis estadístico con nuestros datos, es recomendable observar si existen entre las variables a estudiar, valores anómalos o extraños que pueden alterar el resultado final. En estadística, a estos valores se les denomina “outliers”.

Pueden ser valores extremadamente elevados o bajos. El diagrama de cajas (boxplot), es un instrumento gráfico de la estadística descriptiva que permite realizar un análisis más detallado y conciso respecto a la distribución de los datos y nos permite determinar si la muestra tiene elementos “outliers” y si presenta un sesgo a la izquierda a la derecha o izquierda.

Uno de los métodos más utilizados en estadística para la detección de outliers es el que utiliza el concepto de cuartil de un conjunto de datos. 

Si tenemos un conjunto de datos y lo ordenaremos de menor a mayor, el Cuartil 1, llamémosle Q1, es el valor tal que desde ese valor hacia su izquierda se encuentran la primera cuarta parte de los valores de este conjunto de datos. 

El Cuartil 2, llamémosle Q2, es el valor tal que desde ese valor hacia su izquierda se encuentran la primera mitad de los valores de este conjunto de datos. Y así sucesivamente. Para detectar valores outliers moderados, tendríamos: 

LímInf = Q1- 1.5(Q3-Q1)
LímSup = Q3 + 1.5(Q3-1) 

Los valores que sean menores que LímInf o mayores que LímSup se consideran valores outliers. Para detectar valores outliers extremos, tendríamos: 

LímInf = Q1- 3 (Q3-Q1) 
LímSup = Q3 + 3 (Q3-1) 

Los valores que sean menores que LímInf o mayores que LímSup se consideran valores outliers. 

¿Quieres ayudarnos a mantener vivo el blog?