sábado, 9 de junio de 2012

Distribuciones bidimensionales

INTRODUCCIÓN:

Estadística, rama de las matemáticas que se ocupa de reunir, organizar y analizar datos numéricos y que ayuda a resolver problemas como el diseño de experimentos y la toma de decisiones.
La estadística es un lenguaje que permite comunicar información basados en datos cuantitativos.
La estadística es un potente auxiliar de muchas ciencias y actividades humanas. Es una herramienta indispensable para la toma de decisiones. También es empleada para mostrare los aspectos cuantitativos de una situación.

CONCEPTOS:

Población: es el conjunto de todos los elementos a los que se somete a un estudio estadístico.
Individuo: es cada uno de los elementos que componen la población.
Muestra: es un conjunto representativo de la población de referencia, el número de individuos de una muestra es menor que el de la población.
Muestreo: es la reunión de datos que se desea estudiar, obtenidos de una proporción reducida y representativa de la población.
Valor: es cada uno de los distintos resultados que se pueden obtener en un estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos dos valores: cara y cruz.
Dato: es cada uno de los valores que se ha obtenido al realizar un estudio estadístico. Si lanzamos una moneda al aire 5 veces obtenemos 5 datos: cara, cara, cruz, cara, cruz.

ESTADÍSTICAS UNIDIMENSIONAL.

  • Parámetros estadísticos

MEDIDAS DE CENTRALIZACIÓN


Una medida de centralización es un valor, que es representativo de un conjunto de datos y que tiende a situarse en el centro del conjunto de datos, ordenados según su magnitud.
MedianaEs el valor de la variable estadística que divide en dos partes iguales a los individuos de una población, supuestos ordenados en orden creciente. En general, es el valor donde la función de distribuciónF(x) toma el valor 1/2, pero así definida puede no ser única en cuyo caso se toma la media aritmética de los valores de mediana, o no existir en cuyo caso se toma como mediana el valor de la población más cercano a esa mediana 'ideal'.
ModaEs el valor más frecuente de la variable estadística; valor que se corresponde al máximo del histograma.
Si la variable es discreta, puede darse el caso de que haya más de una mediana.
Media aritméticaEs la suma de los productos de los posibles valores que tome la variable xi, entre el número de valores que esa variable contenga.


MEDIDAS DE DISPERSIÓN


Son medidas que representan el grado en el que los valores numéricos tienden a extenderse alrededor de un valor medio.


RecorridoEs la diferencia entre el mayor y menor valor de una variable estadística.
Varianza.Una forma natural de medir la dispersión en torno a la media es calcular la media de las diferencias:

Desviación típica (o estándar).
Es la raíz cuadrada de la varianza.
Al igual que con la varianza, se distinguen los casos de variables aleatorias y estadísticas. En esta fórmula se expresa también la desviación típica muestral, que es la que usaremos.

Ejemplo:


ESTADÍSTICAS BIDIMENSIONALES:


Una variable estadística bidimensional (X , Y) es el resultado del estudio de dos características cuantitativas X e Y en los individuos de una población.

Covarianza

Para cuantificar la relación que existe entre ambas variables existen diferentes medidas. La mas simple de ellas es la covarianza y viene definida por:

S_{XY} = \frac 1n \sum_{i=1}^n { (x_i - \overline{x})(y_i - \overline{y})} = {1 \over n} \sum_{i,j}^n {x_{i.}y_{.j}n_{ij}} - \overline{x} \overline{y}


Coeficiente de correlacion lineal

El inconveniente de la covarianza como medida de la asociación lineal entre dos variables es que depende de las unidades de X e Y , por ello se define elcoeficiente de correlación entre dos variables X e Y , por:

\rho_{X,Y}={\sigma_{XY} \over \sigma_X \sigma_Y} ={E[(X-\mu_X)(Y-\mu_Y)] \over \sigma_X\sigma_Y}

Recta de regresión

Sobre la nube de puntos puede trazarse una recta que se ajuste a ellos lo mejor posible, llamada recta de regresión que se calcula de la siguiente manera: y - \bar{y} = \frac{S_{xy}}{S_{x}^2}\left\( x - \bar{x} \right\)

Imagen:Figura 2.jpg


El coeficiente de determinación
El coeficiente de determinación mide la proporción de variabilidad total de la variable dependiente (Y ) respecto a su media que es explicada por el modelo de regresión. Es usual expresar esta medida en tanto por ciento, multiplicándola por cien.

      s2 R2 = -2XY2
     sX sY

Ejemplo:




No hay comentarios:

Publicar un comentario