En Estadística Descriptiva y en Probabilidad hay dos tipos de medidas o de parámetros. Los llamados de centralización y los de dispersión. Los primeros nos indican en torno a qué valores de la variable estadística, o aleatoria, que estamos estudiando se concentra la distribución estadística o la de probabilidad, y los segundos cómo es la agrupación, si es más dispersa o mas concentrada.
Entre los primeros está la mediana y los cuantiles, aunque
la mediana también es un cuantil. La mediana es el valor de la variable que deja
igual masa probabilística, o igual cantidad de datos, a uno u otro lado: El 50%. Eso, diciéndolo de forma simplificada.
Los cuantiles, en vez de dejar a ambos lados la misma cantidad
de datos, dejan entre ellos, entre cada dos consecutivos, fracciones que no son ½,
sino ¼, y entonces se llaman cuartiles, 1/5, y entonces se llaman quintiles, un
décimo, y entonces se llaman deciles… o un centésimo de la masa de datos y
entonces se llaman centiles.
Los cuantiles fueron introducidos por primera vez por Kendall en
1940, matemático famoso también por su principal contribución a la estadística: el coeficiente
de correlación tau de Kendall, que recibió ese nombre en su honor.
Pero centrémonos en los cuartiles.
Son valores de la variable que dejan entre ellos una cuarta parte de la masa estadística, de la masa de datos.
Así, como se puede ver en la
figura, entre Q1 y Q2 hay un 25% de datos, entre Q2 y Q3 hay también una cuarta
parte de los datos. Igual procentaje hay por encima de Q3 y por debajo de Q1. A veces al
extremo superior de la variable, si lo hay, se le llama Q4.
Fuente de la imagen : Wikipedia Commons.
A los intervalos de la variable (o al intervalo del eje de abcisas, en la
gráfica) que hay entre dos cuartiles se les llama intervalos intercuartílicos. En
una distribución es muy interesante saber en qué intervalo intercuartílico está un determinado valor de la variable. Así, no es tan interesante saber la nota que
ha obtenido un alumno como el intervalo intercuartílico o interdecílico en que está. No todos los saberes ni
todas las destrezas se distribuyen igual. Sacar un seis en una distribución centrada puede ser más importante que sacar un 9 en una distribución desplazada a la derecha. También sucede con los pesos y con
las tallas de los recién nacidos, no es tan importante el valor como el intervalo
intercentílico, o el centil, donde está.
A veces a los intervalos intercuartílicos o intercentílicos
también se les llama cuartiles o centiles, por un abuso de lenguaje, y entonces
de dice que una nota está en el tercer cuartil o la talla de un niño al nacer en
el centil 95.
En resumen, para lo que nos interesa:
- Los cuartiles se numeran de menor a mayor subíndice, según vayan dejando por debajo más datos. Si el dato es positivo es mejor estar en Q4 que en Q1.
- La cantidad de datos que hay entre dos cuartiles, o en un intervalo intercuartílico o, como familiarmente se dice, en un cuartil es siempre la misma: Un 25%.
Pues bien, como después veremos, los cuartiles de SJR (SCImago Journal Rank) no cumplen ni una cosa ni la otra. Hasta donde sabemos los cuartiles de JCR tampoco cumplen la primera.
Curiosamente no sucede así con los centiles de CiteScore tampoco con los cuartiles de CiteScore, el índice de Scopus-Elsevier que no hay que confundir con SJR. En etas casos, como veremos después, sí cumplen la
definición de centiles y de cuartiles estadísticos.
Pero antes de seguir, y para ver después esta última cuestión,
concluyamos con los cuantiles estableciendo estas equivalencias (Q es cuartil
y C es centil):
Q1 = C25
Q2 = C50 = Mediana
Q3 = C75
Q4 = C100 = valor máximo de la variable, si lo hay.
En primer lugar, siguen en orden inverso a los cuartiles estadísticos.
El cuartil estadístico (o intervalo intercuartílico) más alto es Q4, y el más bajo Q1. Para SJR y también para JCR, y para todos los que los imitan, el valor más alto es Q1 y el más bajo Q4. Así las revistas siguientes están en los cuartiles de SJR y estadísticos que se citan ( Nos centramos en las revistas de Educación - Ciencias Sociales españolas, por ser más conocidas por los lectores habituales de este blog):
Revista |
Cuartil SJR |
Cuartil estadístico |
Comunicar |
Q1 |
Q4 |
Educación XX1 |
Q1 |
Q4 |
Pixel Bit |
Q2 |
Q3 |
RED |
Q3 |
Q2 |
Revista Española
de Educación Comparada |
Q4 |
Q1 |
En segundo lugar, no todos los intervalos intercuartílicos (cuartiles) tienen la misma cantidad de datos, el 25%.
Como ejemplo más palpable es el de la revista RED.
Se supone que cuartil se asigna por la posición de la revista
en la lista de Educación.
Pues bien RED está en la posición 723 de 1543. Estadísticamente
está en el centil 53 (53). Deja por debajo el 53% o más de las revistas. Y en
el SEGUNDO CUARTIL ESTADÍSTICO de mayor a menor importancia, es decir en el Q3.
Sin embargo, SJR la coloca en Q3, es decir su tercer cuartil
en importancia, como si tuviese por debajo menos del 50% de las revistas.
Eso sucede con una numerosa colección de publicaciones. desde la revista número 647, World Transactions on Engineering and Technology Education, hasta la 772, Teoría de la Educación, hay 126 revistas que deberían estar en el Q2 de SJR y están en Q3.
Alguien podría decir que el cuartil SJR lo asigna no por la especialidad, Educación, sino por el área. Pero entonces la cosa es peor.
RED está en la posición 2788 de entre las 7678 que hay en
Ciencias sociales. Es decir en el centil 63, en el Q3 estadístico, y en el Q2
de SJR. Es decir está en una posición relativamente superior, con más razón debería estar en el Q2 de SJR.
No hay comentarios:
Publicar un comentario