martes, 12 de abril de 2016

Medidas de Tendencia Central

Definiciones:

Las medidas de tendencia central son valores que se ubican al centro de un conjunto de datos ordenados según su magnitud. Generalmente se utilizan 4 de estos valores también conocidos como estadigrafos, la media aritmética, la mediana, la moda y al rango medio. 

La media aritmética es la medida de posición utilizada con más frecuencia. Si se tienen n valores de observaciones, la media aritmética es la suma de todos y caca uno de los valores dividida entre el total de valores: Lo que indica que puede ser afectada por los valores extremos, por lo que puede dar una imagen distorcionada de la información de los datos.

La Mediana, es el valor que ocupa la posición central en un conjunto de datos, que deben estar ordenados, de esta manera la mitad de las observaciones es menor que la mediana y la otra mitad es mayor que la mediana, resulta muy apropiada cuando se poseen observaciones extremas. 

La Moda es el valor de un conjunto de datos que aparece con mayor frecuencia. No depende de valores extremos, pero es más variables que la media y la mediana.

Rango Medio es la media de las observaciones menor y mayor. como intervienen solamente estas observaciones, si hay valores extremos, se distorsiona como medida de posición, pero 
ofrece un valor adecuado, rápido y sencillo para resumir al conjunto de datos. 

Datos Discretos
No Agrupados
Analicemos para ello las edades que utilizamos cuando se vió la organización y presentación de datos discretos:

12
15
14
15
16
18
19
14
15
17
15
17
18
16
19
16
17
15
15
17
16
18
17
19
17
23
16
17
18
19

Estos fueron loa datos mostrados originalmente, no se han ordenado ni agrupado, determinemos ahora los valores de la Media, la Mediana y la moda, para ello recurramos a las fórmulas de estas medidas que resumimos en la siguiente tabla:
Medida
Formula
Observaciones
Media
Donde xi se refiere a todo y cada uno de los elementos de la muestra y n es el numero total de elementos en la muestra.
Mediana
a)      p = (n/2)
Es la posición en donde se encuentra la mediana.
Si n es impar, entonces es la opción a, en caso contrario, la b.
El valor de la mediana se obtiene por observación
b)      p = (n/2) + 1
Moda

Se obtiene el valor por observación
Rango Medio
(Valor máximo + Valor Mínimo) / 2

Aplicando, se obtienen los siguientes valores:
Para la media:
    12 + 15 + 14 + 15 + 16 + 18 + 19 + 14 + 15 + 17 + 15 + 17 + 18 + 16 + 19 + 16 + 17 + 15 + 15 + 17 + 16 + 18 + 17 + 19 + 17 + 23 + 16 + 17 + 18 + 19  
X = -----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
                                                                                                     30

_         500
X = ------------ = 16.6667
             30

Para la mediana debera ordenarse el grupo de datos, como n = 30, utilizaremos la posición p = (30/2) = 15, el primer valor mayor a 15 corresponde a la clase 17.

La moda estaría determinada por observación directa, y correspondería al valor 17, que se presenta hasta 7 veces en la muestra.
El rango medio se determina por la suma entre 23 y 12 dividido entre 2 (23 + 12)/2 = 35/2 = 17.5
Si observamos los valores obtenidos veremos que solo para el cálculo de la mediana se obtiene tuvo que ordenar la información (así lo específica la definición), sin embargo podemos también observar que este ordenamiento no afecta de manera directa ninguno de los cálculos, de esta manera se puede construir la siguiente tabla:
Medida
Valor Calculado
Observaciones
Media
16.6667

Mediana
17
Se requirió el cálculo de la frecuencia acumulada
Moda
17

Rango Medio
17.5

Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de 17, no se notan cambios en los resultados comparados con los datos originales, sin embargo las formulas si se ven modificadas.
 

 
Agrupados
Recurramos ahora al agrupamiento de los datos discretos del ejercicio que hemos estado utilizando:
 Clase
Repeticiones
 Total de Años de la clase 
12
1
12
14
2
28
15
6
90
16
5
80
17
7
119
18
4
72
19
4
76
23
1
23
Total
30
500
En donde podemos observar la suma de las frecuencias y de los años multiplicados por la clase que agrupa a los datos coinciden con los datos utilizados cuando no se agruparon en la sección anterior, utilizando ahora las formulas de la siguiente tabla:
Medida
Formula
Observaciones
Media
Donde xi se refiere a todo y cada uno de los elementos de la muestra y n es el número total de elementos en la muestra y fi se refiere a la frecuencia de la clase.



Mediana



p = (n/2)


Es la posición en donde se encuentra la mediana.
Se ubica en la tabla el primer valor de frecuencia acumulada mayor a la posición calculada, si ese valor es mayor, entonces la mediana es la clase correspondiente al mismo. Si el valor es igual a la posición, entonces se suman el valor anterior más el valor obtenido y se divide entre 2.
Moda

Se obtiene el valor por observación de la mayor frecuencia
Rango Medio
(Valor máximo + Valor Mínimo) / 2

Aplicando, se obtienen los siguientes valores:
Para la media:
_      12 * 1 + 14 * 2 + 15 * 6 + 16 * 5 + 17 * 7 + 18 * 4 + 19 * 4 + 23 * 1           12 + 28 + 90 +  80 + 119 + 72 + 76 + 23
X = -------------------------------------------------------------------------------------------- = ---------------------------------------------------------------
                                                      30                                                                                            30

_         500
X = ------------ = 16.6667
             30

Para la Mediana, utilizaremos la frecuencia acumulada:

 Clase
Frecuencia
Frecuencia Acumulada
12
1
1
14
2
3
15
6
9
16
5
14
17
7
21
18
4
27
19
4
29
23
1
30
Total
30


Como n = 30, utilizaremos la posición p = (30/2) = 15, el primer valor mayor a 15 corresponde a la clase 17.

La moda estaría determinada por observación directa, y correspondería al valor 17, que se presenta hasta 7 veces en la muestra.
El rango medio se determina por la suma entre 23 y 12 dividido entre 2 (23 + 12)/2 = 35/2 = 17.5
Si observamos los valores obtenidos veremos que solo para el cálculo de la mediana se obtiene tuvo que ordenar la información (así lo específica la definición), sin embargo podemos también observar que este ordenamiento no afecta de manera directa ninguno de los cálculos, de esta manera se puede construir la siguiente tabla:
Medida
Valor Calculado
Observaciones
Media
16.6667

Mediana
17
Se requirió el cálculo de la frecuencia acumulada
Moda
17

Rango Medio
17.5

Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de 17, no se notan cambios en los resultados comparados con los datos originales, sin embargo las formulas si se ven modificadas.


Datos Continuos
No agrupados
Las medidas de tendencia central para datos continuos no agrupados no tienen mayor significación, ya que el comportamiento es similar al de datos discretos no agrupados, por ello utilizaremos las mismas formúlas, pero ahora con los datos continuos del ejercicio de la sección correspondiente:
1.25
1.2
1.28
1.29
1.2
1.24
1.27
1.21
1.32
1.27
1.18
1.29
1.2
1.23
1.25
1.28
1.24
1.28
1.27
1.25
1.24
1.25
1.27
1.28
1.29
1.18
1.21
1.24
1.2
1.23
1.25
1.27
1.28
1.24
1.29
1.21
Aplicando, se obtienen los siguientes valores:
Para la media, aplicando la formula de la media para datos no agrupados (vista en la sección de datos discretos):
_    1.25 + 1.2 + 1.28+1.29+1.2 + 1.24 + 1.27 + 1.21 + 1.32 + 1.27 + 1.18 + 1.29 + 1.2 + 1.23 + 1.25 + 1.28 + 1.24 + 1.28 + 1.27 + 1.25 + 1.24 + 1.25 + 1.27 + 1.28 + 1.29 + 1.28 + 1.21 + 1.24 + 1.2 + 1.23 + 1.25 + 1.27 + 1.28 + 1.24 + 1.29 + 1.21
X = ----------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
                                                                                                                    30
 _         44.93
X = ------------ = 1.24805556
             30

Para la Mediana, como n = 36, es par, utilizaremos la posición p = (36/2) = 18
Por lo que la mediana se encontrará entre los valores que se ubiquen (de manera ordenada) entre las posiciones 18 y 19 (observa que antes de esa posición hay 17 y después también hay 17 valores), se encuentran 1.25 y 1.25, por lo que la mediana sería 1.25.

La moda estaría determinada por observación directa, y corresponderían a los valores 1.24, 1.25 y 1.27 que se repiten en la muestra 5 veces, por lo que la característica según la moda es una muestra trimodal (normalmente se le conoce como multimodal).
El rango medio se determina por la sumaentre 1.18 y 1.32 dividido entre 2 (1.18 + 1.32)/2 = 2.5 / 2 = 1.25
Si observamos los valores obtenidos veremos que solo para el cálculo de la mediana se tuvo que ordenar la información (así lo específica la definición), sin embargo podemos también observar que este ordenamiento no afecta de manera directa ninguno de los cálculos, de esta manera se puede construir la siguiente tabla:
Medida
Valor Calculado
Observaciones
Media
1.24805556

Mediana
1.25
Se requirió del ordenamiento de los datos
Moda
1.24,1.25, 1.27
Muestra multimodal
Rango Medio
1.25

Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de 1.25.
Agrupados
Retomando los cálculos realizados en la sección correspondiente a organización y presentación de datos continuos agrupados.
Clases
Li
Ls
Mc
F
fa
fc
fr
fra
frc
I
1.175
1.203
1.189
6
6
30
16.67%
16.67%
83.33%
II
1.213
1.241
1.227
10
16
20
27.78%
44.44%
55.56%
III
1.251
1.279
1.265
10
26
10
27.78%
72.22%
27.78%
IV
1.289
1.317
1.303
9
35
1
25.00%
97.22%
2.78%
V
1.327
1.355
1.341
1
36
0
2.78%
100.00%
0.00%
En ella se pueden observar los límites superiores e inferiores de cada clase, lo que indica (de no conocer los datos originales) que por ejemplo esos 6 valores de la clase pueden ubicarse en cualquier valor del rango, pueden ser por ejemplo 1.17, 1.171, 1.20, 1.202, 1.18, 1.1901.
Es decir pueden tomar cualquier valor dentro del rango lo que dificulta tomar estos parametros como elementos para el cálculo de las medidas de tendencia central, por ello se realizó el cálculo de la Mc (Marca de Clase) que en otras palabras es el rango medio de cada clase, que servirá para el cálculo de la media como lo establecemos en la siguiente tabla de cálculo para las medidas de tendencia central:
Medida
Formula
Observaciones
Media
Donde Mc se refiere a la marca de clase de cada clase, n es el número total de elementos en la muestra y fi se refiere a la frecuencia de la clase.


Mediana


p = (n/2)


Es la posición en donde se encuentra la mediana.
Se ubica en la tabla el primer valor de frecuencia acumulada mayor a la posición calculada.
El valor de la mediana se calcula tomando la formula del 5to. Decil.
Moda


Donde Li es el límite inferior de la clase que tiene la mayor frecuencia.
fm es la frecuencia  modal (aquella donde se encuentra la frecuencia  mayor)
f(m -1) es la frecuencia anterior a la frecuencia modal, en caso de encontrarse en la primera clase, este valor es cero.
F(m+1) es la frecuencia posterior a la frecuencia modal, en caso de encontrarse en la última clase, este valor es cero.
A es la amplitud de la clase modal.
Rango Medio
(Valor máximo + Valor Mínimo) / 2

Aplicandolas para calcular la media y complementando la tabla anterior:
Clases
Li
Ls
Mc
F
fa
fc
fr
fra
frc
Mc * f
I
1.175
1.203
1.189
6
6
30
16.67%
16.67%
83.33%
7.134
II
1.213
1.241
1.227
10
16
20
27.78%
44.44%
55.56%
12.27
III
1.251
1.279
1.265
10
26
10
27.78%
72.22%
27.78%
12.65
IV
1.289
1.317
1.303
9
35
1
25.00%
97.22%
2.78%
11.727
V
1.327
1.355
1.341
1
36
0
2.78%
100.00%
0.00%
1.341

36

45.122
Con fundamento en la tabla podemos entonces obtener:
                   45.122
Media =  ---------------- = 1.253388889
                      36

Para el cálculo de la mediana, se utiliza la formula del 5to. Decil (puede ser el 50tavo percentil), para ello determinamos la posición de este estadígrafo, p = (36/10)*5 = 3.6 * 5 = 18.
Con este valor recurrimos a la columna de la frecuencia acumulada y observarmos que el primer elemento mayor al valor calculado se ubica en la clase III, aplicando la fórmula obtenemos:
                                       ((36/10)*5 – 16)                                            (18 – 16)
Mediana = 1.251 + (----------------------------) * 0.028 = 1.251 + (---------------) * 0.028
                                                  10                                                             10

                                         2
Mediana = 1.251 + ( ---------) * 0.028 = 1.251 + (0.2 * 0.028) = 1.251 + 0.0056 = 1.2566
                                        10
La moda se encontraría en las clases II y III, son las que mayores frecuencias manifiestan, por lo tanto podemos definir que existen una característica de multimodalida en la muestra, calculemos la primera moda (dejamos como actividad complementaria el cálculo de la segunda moda).
                              ( 10 – 6)                                                     4
Mo = 1.213 + ( -------------------------) 0.028 = 1.213 + (--------) * 0.028 = 1.213 + 0.028
                              (2* 10 – 6 – 10)                                         4
Mo = 1.241

El rango medio se determina por la sumaentre 1.18 y 1.32 dividido entre 2 (1.18 + 1.32)/2 = 2.5 / 2 = 1.25
Si observamos los valores obtenidos veremos que solo para el cálculo de la mediana se tuvo que ordenar la información (así lo específica la definición), sin embargo podemos también observar que este ordenamiento no afecta de manera directa ninguno de los cálculos, de esta manera se puede construir la siguiente tabla:
Medida
Valor Calculado
Observaciones
Media
1.253388889

Mediana
1.2566
Se requirió del uso de fórmulas del 5to decil, se pudieron usar las de 50tavo centil.
Moda
1.241
Muestra multimodal, solo se calculó la primera moda
Rango Medio
1.25

Es de notar lo cercano de todos los valores que se han calculado, que circundan el valor de 1.25.
Construyamos una tabla comparativa de resultados de cálculo de estas medidas;
Medida
No agrupados
Agrupados
Media
1.24805556
1.253388889
Mediana
1.25
1.2566
Moda
1.24,1.25, 1.27
1.241
Rango Medio
1.25
1.25

1 comentario:

  1. Best slots casinos - JTM Hub
    Looking for the best slot 충청북도 출장마사지 machine casinos? 안산 출장샵 Check 경상북도 출장샵 out the top slots casino reviews ✓ Play at the 제천 출장샵 best slots sites, with JTM Hub's list of 계룡 출장샵 top

    ResponderEliminar