Observatorio de palabras
Google Ngram Viewer: una herramienta para observar el uso real de las palabras en el tiempo
En el análisis del léxico, una de las dificultades más frecuentes consiste en fundamentar afirmaciones sobre el uso: qué formas son más habituales, cuáles han caído en desuso o cómo varían según la época. En este contexto, herramientas basadas en corpus como Google Ngram Viewer ofrecen una vía de observación empírica especialmente valiosa.
A diferencia de las intuiciones individuales o de las generalizaciones no verificadas, este tipo de recurso permite visualizar tendencias de uso a gran escala, lo que contribuye a matizar y precisar el análisis lingüístico.
¿Qué es Google Ngram Viewer?
Se trata de un corpus diacrónico construido a partir de millones de libros digitalizados. Su función principal es mostrar, mediante gráficos, la frecuencia relativa de palabras o secuencias de palabras (n-gramas) a lo largo del tiempo.
El eje horizontal representa los años (por ejemplo, de 1800 a 2019)
El eje vertical indica la frecuencia relativa de aparición en el corpus
Este enfoque permite observar el comportamiento histórico de unidades léxicas dentro de la lengua escrita.
¿Qué tipo de información proporciona?
1. Evolución del uso léxico
El recurso permite identificar si una palabra:
incrementa su presencia en determinados periodos
se mantiene estable
experimenta un declive progresivo
Esto resulta útil para describir procesos de obsolescencia, especialización o revitalización léxica.
2. Competencia entre formas
La comparación simultánea de varias unidades (por ejemplo, variantes léxicas o construcciones cercanas) permite observar fenómenos de alternancia y desplazamiento.
Ejemplo de aplicación:
comparación entre formas ortográficas
análisis de sinónimos en distintos periodos
3. Cambios discursivos y culturales
Dado que el corpus se nutre de textos publicados, las curvas también reflejan transformaciones en los discursos sociales y culturales. El aumento o descenso de ciertas palabras puede vincularse a cambios en los temas de interés o en los marcos conceptuales dominantes.
Alcance y limitaciones
Es importante delimitar con precisión el valor interpretativo de los datos:
El corpus refleja lengua escrita, no uso oral
Predomina el registro culto o editorializado
Existe un sesgo hacia lo que se publica, no necesariamente hacia lo que se dice
Por tanto, los resultados deben leerse como indicadores de tendencia, no como descripciones absolutas del sistema lingüístico.
Implicaciones para el análisis del uso
El acceso a datos cuantitativos permite sustituir afirmaciones categóricas por formulaciones más precisas, como:
“presenta una frecuencia decreciente a partir del siglo XX”
“se documenta con mayor frecuencia en determinados periodos”
“coexiste con otras formas, con distinta distribución temporal”
Este tipo de formulación favorece un enfoque más descriptivo, matizado y verificable del uso lingüístico.
A manera de ejemplo
La captura corresponde a una consulta en Google Ngram Viewer con los términos “bullying” (línea azul) y “acoso escolar” (línea roja), en el corpus en español, con un rango temporal de 1900 a 2022.
Ambas curvas permanecen prácticamente en valores nulos durante todo el siglo XX. A partir de finales de los años noventa y, sobre todo, desde comienzos del siglo XXI, se observa un incremento pronunciado en la frecuencia de ambos términos.
El crecimiento de bullying es más abrupto y alcanza valores más altos que acoso escolar. Este último también presenta un aumento sostenido, aunque con una pendiente más moderada y una frecuencia relativa inferior en todo el periodo reciente.
Jugando con las posibles interpretaciones
Una lectura plausible de esta gráfica apunta a un doble proceso de emergencia y difusión terminológica.
Por un lado, el incremento simultáneo de ambas formas sugiere que el fenómeno al que remiten —la violencia entre pares en el ámbito escolar— adquiere visibilidad discursiva reciente. Es decir, no necesariamente se trata de una realidad nueva, sino de una categoría que comienza a nombrarse y a problematizarse públicamente en las últimas décadas.
Por otro lado, la diferencia entre las curvas permite observar un desplazamiento en las preferencias denominativas. El término bullying, de origen inglés, muestra una expansión más rápida y una mayor frecuencia, lo que puede vincularse a su circulación en medios de comunicación, campañas institucionales y discursos globalizados.
En contraste, acoso escolar presenta un crecimiento más gradual y parece vincularse a registros más descriptivos o institucionales. La coexistencia de ambas formas no indica sustitución, sino una estratificación léxica, donde cada término activa matices distintos dentro del mismo campo semántico.
Este tipo de evidencia permite evitar formulaciones categóricas sobre el uso y, en su lugar, describir con mayor precisión cómo se introducen, compiten y se estabilizan las denominaciones en el discurso contemporáneo.
If this material is useful to you, you can
support this project here.
Comentarios
Publicar un comentario