viernes, 21 de mayo de 2021

Los cuartiles estadísticos y los cuartiles de SCImago Journal Rank (SJR)

Imagen: Trinity College. Cambridge. Barrow y Newton.

¿Es tan poderosa SCImago que puede cambiar los convenios matemáticos?*


En Estadística Descriptiva y en Probabilidad hay dos tipos de medidas o de parámetros. Los llamados de centralización y los de dispersión. Los primeros nos indican en torno a qué valores de la variable estadística, o aleatoria, que estamos estudiando se concentra la distribución estadística o la de probabilidad, y los segundos cómo es la agrupación, si es más dispersa o mas concentrada.

Entre los primeros está la mediana y los cuantiles, aunque la mediana también es un cuantil. La mediana es el valor de la variable que deja igual masa probabilística, o igual cantidad de datos, a uno u otro lado: El 50%. Eso, diciéndolo de forma simplificada.

Los cuantiles, en vez de dejar a ambos lados la misma cantidad de datos, dejan entre ellos, entre cada dos consecutivos, fracciones que no son ½, sino ¼, y entonces se llaman cuartiles, 1/5, y entonces se llaman quintiles, un décimo, y entonces se llaman deciles… o un centésimo de la masa de datos y entonces se llaman centiles.

Los cuantiles fueron introducidos por primera vez por Kendall en 1940, matemático famoso también por su principal contribución a la estadística: el coeficiente de correlación tau de Kendall, que recibió ese nombre en su honor.

Pero centrémonos en los cuartiles.

Son valores de la variable que dejan entre ellos una cuarta parte de la masa estadística, de la masa de datos. 

Así, como se puede ver en la figura, entre Q1 y Q2 hay un 25% de datos, entre Q2 y Q3 hay también una cuarta parte de los datos. Igual procentaje hay por encima de Q3 y por debajo de Q1. A veces al extremo superior de la variable, si lo hay, se le llama Q4.

Fuente de la imagen : Wikipedia Commons.

A los intervalos de la variable (o al intervalo del eje de abcisas, en la gráfica) que hay entre dos cuartiles se les llama intervalos intercuartílicos. En una distribución es muy interesante saber en qué intervalo intercuartílico está un determinado valor de la variable. Así, no es tan interesante saber la nota que ha obtenido un alumno como el intervalo intercuartílico o interdecílico en que está. No todos los saberes ni todas las destrezas se distribuyen igual. Sacar un seis en una distribución centrada puede ser más importante que sacar un 9 en una distribución desplazada a la derecha. También sucede con los pesos y con las tallas de los recién nacidos, no es tan importante el valor como el intervalo intercentílico, o el centil, donde está.

A veces a los intervalos intercuartílicos o intercentílicos también se les llama cuartiles o centiles, por un abuso de lenguaje, y entonces de dice que una nota está en el tercer cuartil o la talla de un niño al nacer en el centil 95.

En resumen, para lo que nos interesa:

  • Los cuartiles se numeran de menor a mayor subíndice, según vayan dejando por debajo más datos. Si el dato es positivo es mejor estar en Q4 que en Q1.
  • La cantidad de datos que hay entre dos cuartiles, o en un intervalo intercuartílico o, como familiarmente se dice, en un cuartil es siempre la misma: Un 25%.

Pues bien, como después veremos, los cuartiles de SJR (SCImago Journal Rank) no cumplen ni una cosa ni la otra. Hasta donde sabemos los cuartiles de JCR tampoco cumplen la primera.

Curiosamente no sucede así con los centiles de CiteScore tampoco con los cuartiles de CiteScore, el índice de Scopus-Elsevier que no hay que confundir con SJR. En etas casos, como veremos después, sí cumplen la definición de centiles y de cuartiles estadísticos.

Pero antes de seguir, y para ver después esta última cuestión, concluyamos con los cuantiles estableciendo estas equivalencias (Q es cuartil y C es centil):

Q1 = C25

Q2 = C50 = Mediana

Q3 = C75

Q4 = C100 = valor máximo de la variable, si lo hay.

 

¿Qué pasa con los Q (cuartiles) de SJR?

En primer lugar, siguen en orden inverso a los cuartiles estadísticos.

El cuartil estadístico (o intervalo intercuartílico) más alto es Q4, y el más bajo Q1. Para SJR y también para JCR, y para todos los que los imitan, el valor más alto es Q1 y el más bajo Q4. Así las revistas siguientes están en los cuartiles de SJR y estadísticos que se citan ( Nos centramos en las revistas de Educación - Ciencias Sociales españolas, por ser más conocidas por los lectores habituales de este blog):

Revista

Cuartil SJR

Cuartil estadístico

Comunicar

Q1

Q4

Educación XX1

Q1

Q4

Pixel Bit

Q2

Q3

RED

Q3

Q2

Revista Española de Educación Comparada

Q4

Q1


En segundo lugar, no todos los intervalos intercuartílicos (cuartiles) tienen la misma cantidad de datos, el 25%.

Como ejemplo más palpable es el de la revista RED.

Se supone que cuartil se asigna por la posición de la revista en la lista de Educación.

Pues bien RED está en la posición 723 de 1543. Estadísticamente está en el centil 53 (53). Deja por debajo el 53% o más de las revistas. Y en el SEGUNDO CUARTIL ESTADÍSTICO de mayor a menor importancia, es decir en el Q3.

Sin embargo, SJR la coloca en Q3, es decir su tercer cuartil en importancia, como si tuviese por debajo menos del 50% de las revistas.

Eso sucede con una numerosa colección de publicaciones. desde la revista número 647, World Transactions on Engineering and Technology Education, hasta la 772, Teoría de la Educación, hay 126 revistas que deberían estar en el Q2 de SJR y están en Q3.


Alguien podría decir que el cuartil SJR lo asigna no por la especialidad, Educación, sino por el área. Pero entonces la cosa es peor.

RED está en la posición 2788 de entre las 7678 que hay en Ciencias sociales. Es decir en el centil 63, en el Q3 estadístico, y en el Q2 de SJR. Es decir está en una posición relativamente superior, con más razón debería estar en el Q2 de SJR.

Hasta aquí lo percibido en los resultados del reciente informe sobre SJR. El hecho tratado en primer lugar, el orden de los cuartiles, viene de antes, el segundo, el de los cuartiles de distinto tamaño, no lo sabría decir. Tampoco he encontrado una justificación de ello en la metodología que la agencia ofrece.

Lo curioso es que, hasta donde sé, ninguna autoridad matemática, algún académico, algún investigador o alguna institución como la Real Sociedad Matemática Española (RSME), que tiene estas cosas entre sus cometidos, tampoco haya alzado la voz para nada. tampoco han hecho una mención de carácter menor o irónico por ejemplo.

En el caso de los académicos e investigadores, editores, autores, etc. estaría más o menos justificado ante el temor de que sus publicaciones  revistas se vieran resentidas por la denuncia "nadie se atreve a decirle al rey (Elsevier) que no lleva camisa, aunque se vean sus impudicias desnudeces". Pero ¿quién le impide decirlo a la RSME por ejemplo? También a sus equivalentes internacionales. En este caso los españoles no somos diferentes.


Imagen: Trinity College. Cambridge. Barrow y Newton.

No hay comentarios:

Publicar un comentario

La América Hispana un páramo de la edición científica no sólo en Educación y en Computación (y II)

En el   post anterior  se analizaban los dos rankings de SCImago-JCR,   sobre la base de datos de Scopus:  el  de paises por su producción c...