Este artículo apareció por primera vez en The Conversation.
Tras el trágico tiroteo ocurrido en Bondi Beach la semana pasada, las teorías de conspiración y la desinformación deliberada se han extendido por las redes sociales.
Una cosa que ha llamado la atención de algunas personas es la idea de que los datos de Google Trends muestran un aumento en las búsquedas de “Naveed Akram” – el nombre del presunto atacante sobreviviente – desde Tel Aviv (u otros lugares) antes del tiroteo. En un giro sorprendente, esto sirve como prueba de que Akram debe ser un agente israelí.
Póngase al día con las novedades de la aplicación 7NEWS: descárguela hoy
Historias similares circularon cuando el activista estadounidense de derecha Charlie Kirk fue asesinado en septiembre y después de un ataque contra miembros de la Guardia Nacional estadounidense en noviembre.
Entonces, ¿qué está pasando aquí? Google le dijo a ABC que debido al “ruido estadístico”, Google Trends a veces puede mostrar búsquedas cuando en realidad no se ha realizado ninguna.
He estudiado extensamente la mecánica de Google Trends como parte de mi investigación y puedo confirmar que esto es cierto, y el “ruido” puede producir resultados extraños, especialmente cuando se buscan términos inusuales o provenientes de áreas pequeñas.
¿Cómo funciona Google Tendencias?
Google Trends muestra información sobre lo que las personas buscan en diferentes lugares y momentos. Los datos utilizados son lo que los estadísticos llaman “series temporales”, pero son inusuales en varios sentidos.
En primer lugar, puede seleccionar fácilmente diferentes escalas de tiempo, p. B. Minuto a minuto y año a año.
En segundo lugar está el hecho de que los datos son sólo una pequeña muestra del volumen verdaderamente gigantesco de búsquedas en Google. Las series temporales suelen contener todos los datos disponibles (por ejemplo, estas estadísticas sobre hospitalizaciones anuales).
La página de ayuda de Google Trends explica esto de la siguiente manera:
Si bien Google Trends solo utiliza una selección de búsquedas de Google, esto es suficiente ya que procesamos miles de millones de búsquedas todos los días.
Ruido estadístico y consultas de búsqueda raras
Sin embargo, mi investigación ha demostrado que las búsquedas se realizan relacionadas con términos que no se buscan comúnmente (por ejemplo, “Naveed Akram”). antes el tiroteo) o en regiones geográficas pequeñas (donde menos personas buscan) pueden mostrar grandes variaciones en los resultados de una muestra a la siguiente.
Muchas de las publicaciones engañosas en las redes sociales muestran resultados de tendencias de una región pequeña (por ejemplo, solo la ciudad de Tel Aviv), lo que exacerba la variación. La alta variación da como resultado un patrón muy claro de valores cero o cercanos a cero con algunos picos grandes aislados, que se pueden ver muy claramente en la siguiente publicación.

Estos picos a menudo son causados por “ruido estadístico” en los datos: pequeñas fluctuaciones aleatorias que se suavizan cuando observamos una mayor cantidad de eventos. Esto se puede ver claramente al compararlas con consultas de búsqueda que tienen un gran volumen.
Cómo cambian los resultados de Google Trends con el tiempo
Otro malentendido sobre las fechas tiene que ver con el tiempo. Algunas publicaciones mencionan que los resultados mostrados parecen cambiar de una vista a otra. Esto es exactamente lo que cabría esperar de los datos de Google Trends.
Esta es una combinación de la escala de tiempo utilizada y el hecho de que Google sólo utiliza una muestra de los datos completos. Para obtener resultados precisos, es necesario agregar muchas muestras de datos de Google Trends.
Sin embargo, esto presenta un nuevo desafío. Para datos a corto plazo (como los que se utilizan normalmente en estas publicaciones de redes sociales), Google actualiza continuamente los resultados en tiempo real. Para datos a más largo plazo, Google solo agrega una muestra nueva por día (aunque hemos desarrollado métodos para solucionar este problema).
Lo que realmente significan los números de Google Trends
Una tercera idea errónea es que los números que se muestran en los gráficos de Tendencias de Google representan la cantidad de búsquedas de un término en particular. Sin embargo, la Ayuda de Google Trends vuelve a explicar que los valores se “normalizan según el tiempo y la ubicación” y luego se “escalan a un rango de 0 a 100”.
Esto significa que el punto de la serie con el mayor número de búsquedas se establece en 100 y todos los demás puntos se escalan en relación con eso. Entonces, si el número máximo de búsquedas fuera 10, se mostraría como 100, y si hubiera tres búsquedas en otro momento, se mostraría como 30 (aunque Google suprime las búsquedas con un volumen muy bajo).


En cierto sentido, el número representa, para cada momento, la probabilidad de que se realice una búsqueda utilizando los términos especificados en esa ubicación en ese momento.
Por lo tanto, una publicación sobre las tendencias de búsqueda del presunto asesino de Charlie Kirk que afirma que las probabilidades de que esto suceda son “menos de 1 en 1 MIL MILLONES” es falsa.
En realidad, es muy probable que si “Tyler James Robinson” (el presunto asesino de Charlie Kirk) tuviera 30 búsquedas y “Lance Twiggs” (el socio de Robinson) tuviera 40, verías exactamente este patrón (si 40 se escala a 100; 30 se escala a 75 en consecuencia).
El poder del sentido común
Incluso si no comprende toda esta información sobre los datos de Google Trends, un poco de sentido común puede resultar útil. Por ejemplo, hay muchas personas llamadas Naveed Akram, incluido un jugador de fútbol paquistaní llamado Muhammad Naveed Akram.
Por lo tanto, no es sorprendente que se hayan realizado algunas búsquedas de “Naveed Akram” antes del 14 de diciembre. (Google Trends devuelve cualquier búsqueda que contenga la consulta, por lo que “Naveed Akram” también devuelve “Muhammad Naveed Akram”).
Los datos de Google Trends pueden resultar increíblemente útiles para comprender eventos en tiempo real. Por ejemplo, se ha utilizado para predecir –con cierto margen de error– los resultados de elecciones y referendos.
Sin embargo, para hacer esto correctamente y no perpetuar una ficción, es necesario comprender los datos e interpretar correctamente los resultados. Y Google Trends ciertamente no nos dice nada sobre Naveed Akram y el ataque terrorista de Bondi.
Jacques Raubenheimer es investigador senior en bioestadística en la Universidad de Sydney.