TABLAS DE FRECUENCIA.
Concepto y finalidad de las tablas de frecuencia.
Cuando se dispone se una gran cantidad de datos a veces resulta muy difícil responder a ciertos cuestionarios que sobre una determinada variable se nos hagan. Existe una forma en estadística de organizar las informaciones que nos permite responder a este y otros cuestionamientos. A esta forma de organizar las informaciones se le llama distribución o tabla de frecuencias.
Un ejemplo de tabla de frecuencia podría ser la siguiente:
Cuando los datos se presentan en una tabla de frecuencias se les denomina datos agrupados. Cuando todos los datos observados de una variable se enumeran en forma desorganizada le vamos a denominar datos no agrupados.
Elaboración de una tabla de frecuencias.
El procedimiento para elaborar una tabla de frecuencias es mejor explicado con un ejemplo. El ejercicio que se desarrolla a continuación aspira mostrar la manera de organizar en una tabla de frecuencias las edades de un grupo de 40 asistentes a un concierto.
22 | 41 | 35 | 45 | 32 | 37 | 30 | 26 |
34 | 16 | 31 | 33 | 38 | 31 | 47 | 37 |
25 | 43 | 34 | 36 | 29 | 33 | 39 | 31 |
33 | 31 | 37 | 44 | 32 | 41 | 19 | 34 |
47 | 38 | 32 | 26 | 39 | 30 | 42 | 35 |
1. Rango (R)
2. Tamaño de los intervalos de clase (TIC)
El objetivo de una tabla de frecuencia es presentar la serie de datos de una manera resumida y fácil de entender a simple vista, por lo que es preferible redondear a el Tic a valores muy cerrados, tales como:
2 | 20 | 200 | 2000 | |
5 | 50 | 500 | 5000 | |
10 | 100 | 1000 | 10000 | etc. |
En este caso, el TIC es 5.8 y lo vamos a redondear a 5, que es de los valores anteriores el más cercano.
3. Los límites de los intervalos de clase
Usualmente, el límite inferior del primer intervalo de clase es un múltiplo del "TIC" que es igual o menor que el dato más pequeño. Si el "TIC" es más grande que el dato menor, el primer límite inferior es cero. En este problema el "TIC" es de 5, entonces el primer límite inferior será el mayor múltiplo de 5 que es inferior o igual al dato menor, el 15.
El límite inferior de los siguientes intervalos se calcula sumando el "TIC" al límite inferior del intervalo anterior hasta llegar a un número no mayor al dato mas grande. De tal forma que el segundo LI sería 15+5=20; el tercero: 20+5=25 y así sucesivamente, sin pasarnos del mayor que es 47.
Los límites superiores se calculan con la siguiente fórmula:
Donde LS son los límites superiores y LI son los límites inferiores.
Sustituyendo, el primer límite superior sería 15+5-1=19; el segundo 20+5-1=24 etc.
Después de realizar estos procedimientos las primeras dos columnas de nuestra tabla quedan de la siguiente manera:
LI | LS |
15 | 19 |
20 | 24 |
25 | 29 |
30 | 34 |
35 | 39 |
40 | 44 |
45 | 49 |
4. Límites Reales de Clase.
El límite superior real (LSR) es el punto medio entre el límite superior y el límite inferior del siguiente intervalo, entonces la fórmula sería:
LSR = | LS + LIsig |
2 |
El límite inferior real (LIR) es el igual al LSR de la clase anterior.
Cuando los límites son números enteros, una manera práctica de calcular los límites reales es restando y sumando media unidad (0,5) a los límites inferiores y superiores, respectivamente, es decir:
Después de realizar los cálculos pertinentes la tabla queda:
LI | LS | LIR | LSR |
15 | 19 | 14.5 | 19.5 |
20 | 24 | 19.5 | 24.5 |
25 | 29 | 24.5 | 29.5 |
30 | 34 | 29.5 | 34.5 |
35 | 39 | 34.5 | 39.5 |
40 | 44 | 39.5 | 44.5 |
45 | 49 | 44.5 | 49.5 |
5. Marca de clase (x)
La marca de clase, también llamada punto medio del intervalo de clase es la mitad de la distancia entre los límites inferior y superior de cada intervalo, es decir el promedio de los dos límites. La marca de clase es el valor más representativo de los valores del intervalo.
X = | LI + LS |
2 |
Después de realizar los cálculos correspondientes la tabla queda así:
LI | LS | LIR | LSR | X |
15 | 19 | 14.5 | 19.5 | 17 |
20 | 24 | 19.5 | 24.5 | 22 |
25 | 29 | 24.5 | 29.5 | 27 |
30 | 34 | 29.5 | 34.5 | 32 |
35 | 39 | 34.5 | 39.5 | 37 |
40 | 44 | 39.5 | 44.5 | 42 |
45 | 49 | 44.5 | 49.5 | 47 |
6. Clasificación de los datos y conteo de frecuencias (F)
El objetivo es determinar el número de observaciones que hay en cada clase. La práctica usual es marcar con una línea ( / ) que representa una observación. En el ejemplo la observación 22 se clasifica en el intervalo 20 – 24 porque se encuentra entre el 20 y el 24 inclusive. Una vez clasificados todos los datos se cuentan las líneas de cada intervalo y el resultado es la frecuencia de cada intervalo de clase.
Nuestra tabla quedaría de esta forma:
LI | LS | LIR | LSR | X | cuenta | F |
15 | 19 | 14.5 | 19.5 | 17 | // | 2 |
20 | 24 | 19.5 | 24.5 | 22 | / | 1 |
25 | 29 | 24.5 | 29.5 | 27 | //// | 4 |
30 | 34 | 29.5 | 34.5 | 32 | ///// ///// ///// | 15 |
35 | 39 | 34.5 | 39.5 | 37 | ///// ///// | 10 |
40 | 44 | 39.5 | 44.5 | 42 | ///// | 5 |
45 | 49 | 44.5 | 49.5 | 47 | /// | 3 |
7. Frecuencia relativa (FR)
Las frecuencias relativas son los porcentajes de observaciones de cada intervalo de clase en relación al total de datos. Para calcular las frecuencias relativas, se divide cada frecuencia de clase (f) entre el número total de observaciones (n) y se multiplica por cien.
FR = | F | · 100 |
n |
Después de calcular la "FR" para cada clase la tabla toma la siguiente forma:
8. Frecuencia acumulada (FA) y frecuencia relativa acumulada (FRA).
Las distribuciones de frecuencia acumulada se usan para determinar cuantas observaciones, o que porcentaje de observaciones están debajo de cierto valor.
La distribución de frecuencia acumulada de cierto intervalo se calcula sumando las frecuencias de clase desde el primer intervalo hasta la frecuencia de clase de la clase que nos interesa. Si queremos la frecuencia acumulada del intervalo 25 – 29, sumamos las frecuencias de clase 2 + 1 + 4 = 7.
La distribución de frecuencia relativa acumulada de cierta clase se calcula dividiendo la frecuencia acumulada entre el número total de observaciones.
FRA = | FA | · 100 |
n |
Después de hacer los respectivos cálculos obtendremos:
9. Sumatorias de FX y FX²
Por último, tenemos dos sumatorias que utilizaremos posteriormente en el cálculo de la media aritmética, la varianza y la desviación estándar. Para lo cual procederemos de la siguiente manera:
FX² = X · FX
Calculamos para cada renglón, y después de sumar tendremos:
En esta tabla por motivos de espacio suprimimos la columna auxiliar de "cuenta".
Hasta aquí queda terminada nuestra tabla de frecuencia, en próximos artículos revisaremos cómo calcular las medidas de tendencia central y las medidas de variabilidad.
1 comentario:
Excelente explicación, muchas gracias!!
Publicar un comentario