Blog

SESGOS COGNITIVOS O POR QUÉ LOS SEOS NO TENEMOS (A VECES) NI IDEA DE CÓMO FUNCIONA GOOGLE

Qué pasa lectores! Gente del mundo SEO bloggero y mejores personas ;D Hoy vamos con un post donde aparecerá de nuevo mi amigo Kloster. Uno de los SEOs más objetivos, analíticos y rigurosos que conozco dentro de esta disciplina.

Vamos a hablar de una gran verdad de la que pocas veces se habla dentro del sector del posicionamiento en buscadores: los sesgos cognitivos dentro del SEO, la correlación y causalidad. Te prometo que si lees con calma lo vas a entender todo y además vas a aprender. ¡Go!

Los profesionales que trabajamos en temas de posicionamiento utilizamos diariamente una herramienta de tracking de posiciones (en mi caso por ejemplo uso RankBOX Advanced).

Esto nos ayuda a “comprender” los movimientos de ajedrez de Google cuando una palabra clave sube o baja, pero siempre nos basamos en interpretaciones con cierto margen de error: es precisamente de ese margen de error del que Kloster va a hablar hoy

Andrés Kloster es uno de los cachorros de Blogger3cero.

Alguien a quién ayudé en la fase inicial con su visibilidad y ahora también amigo y profesional del que yo mismo aprendo con cada nuevo episodio de su podcast, el cual crece como un tiro.

Te dejo con él.

Algunas cosas de Google que no sabemos…

En esta sección voy a hacer una brutal simplificación de cómo opera el buscador.

Necesito crear un modelo mucho más sencillo que la realidad, para sobre eso poder montar algunos ejemplos.

Ya sé que hacer SEO no es así de ‘fácil’. Quiero que veamos los errores lógicos que cometemos aún en un modelo totalmente simplificado.

Supongamos que Google muestra los mismos resultados a todos los usuarios cuando realizan la misma búsqueda.

Supongamos que solamente existen los resultados azules de toda la vida en formato texto.

Cada vez que se googlea una keyword, Google toma todas las páginas de su índice y las ordena jerárquicamente.

Pone primero la que considera que mejor responde a la query y luego en orden descendente.

Para Google, el resultado 5 satisface mejor lo que el usuario está buscando que el resultado 10, pero no tan bien como el resultado 1.

Sabemos que cuando se busca ‘ tostadora ’, la intención de búsqueda puede ser:

  • Comprar una tostadora
  • Ver información sobre tostadoras
  • Ver imágenes sobre tostadoras
  • Ver un video sobre cómo funciona una tostadora
  • etcétera.

Hoy vamos a suponer (seguimos acotando) que trabajamos con keywords cuya intención de búsqueda tiene una sola interpretación (“cómo funciona una tostadora”, por ejemplo) y que no existen las palabras polisémicas.

¿Cómo define Google cuál página va antes y cuál después?

Inferimos que trabaja con una función similar a esta:

Coeficiente de Keyword = Ponderación Factor A * Puntaje Factor A + Ponderación Factor B * Puntaje Factor B + Ponderación Factor C + Puntaje Factor C …

Donde:

Factor X (A/B/C… etc.): lo que los SEOs llamamos factores de posicionamiento. Por ejemplo: backlinks, fuerza del dominio raíz, keyword presente en title, CTR en las SERPs… etc.

Puntaje Factor X (A/B/C… etc.): número entre 0 y 1, que significa qué tan relevante Google considera que la página cumple con el “factor de posicionamiento X”. Por ejemplo: el factor backlinks, Google considera que mi página está muy bien trabajada y puntúa ese factor con un 0,8 sobre 1.

Ponderación Factor X (A/B/C… etc.): número entre 0 y 1, que significa qué tanta importancia le asigna Google al factor de posicionamiento X dentro de su algoritmo para posicionar en las SERPs.

Google le ‘pasa’ esta función a las billones de páginas de su índice y luego muestra primero la que obtiene el mayor puntaje, segundo la del segundo mayor puntaje y así sucesivamente.

Nótese que una página puede obtener un puntaje bajo para un factor de posicionamiento en una keyword y para el mismo factor obtener un puntaje alto en otra keyword. Por ejemplo, el puntaje del factor ‘keyword presente en el contenido’, depende justamente de cuál sea la key.

Los que nos dedicamos a esto conocemos más o menos cuáles son los factores de posicionamiento (que si enlaces… que si contenido…). Google nos lo indica en sus directrices y en diversas declaraciones oficiales y no tanto.

➔  Lo que desconocemos por completo son las ponderaciones de la función : o lo que es lo mismo, el valor que le asigna Google a cada factor individual dentro de su algoritmo.

Tanto la presencia de la keyword en el atributo “title” de la página como la presencia de la keyword en el atributo “alt” de las imágenes incluidas en la página son factores de posicionamiento, y eso creo está fuera de discusión.

Intuimos que la presencia de la keyword en el title es más relevante que la presencia de la keyword en el atributo alt de la imagen.

Pero no sabemos cuánto más relevante es.

Nota de Dean: por tanto, la discusión entre los SEOs que consideran que el linkbuilding es el arma más poderosa para rankear y aquellos que no le asignan tanta relevancia, en definitiva es una discusión acerca del valor del multiplicador “Ponderación Factor Linkbuilding”.

Experimentos SEO y sesgos cognitivos

Desde que existen los buscadores, los SEOs han hecho el siguiente razonamiento:

No sé qué factor es más importante para posicionar mi página. Creo que Google pondera mejor el factor A que el B, por lo que probaré optimizando el factor A en deterioro del factor B… Si mi web mejora posiciones para esa keyword, se comprobará mi hipótesis ¡a optimizar A, que es lo que da resultados!

No sé si me siguen, pero ese razonamiento tiene agujeros por todos lados:

Primer agujero

Por más que nos enfoquemos únicamente en mejorar el puntaje de A, hay muchísimos otros factores que seguirán siendo tenidos en cuenta por Google y que no podemos controlar pausándolos para que no alteren el experimento.

No le podemos pedir al algoritmo que aísle el factor A, para poder ver qué tanto afecta “la optimización de A” a nuestro ranking.

 

Segundo agujero

Supongamos que optimizamos A y mejora nuestro posicionamiento. No sabemos qué hubiera pasado si no optimizábamos A: a lo mejor el posicionamiento mejoraba igual.Google evalúa muchas cosas de nuestra página web y algunas las puede tener en cuenta a lo largo del tiempo y de manera progresiva, tanto si las tiene en cuenta de forma positiva como negativa.

Comparación no-SEO: llega un chico con resfriado a un hospital y el médico le dice que tiene que tomar agua tibia con azúcar todas las noches durante una semana para curarse. Lo hace y al cabo de una semana se cura. ¿El agua tibia con azúcar lo curó? Claramente no. Si no tomaba nada, se iba a curar igual.

Para poder medir si efectivamente el posicionamiento mejoró por A, deberíamos tener otra página idénticacon todos los factores igualmente ponderados antes de comenzar el experimento, al cual no le optimizamos A, y ver si mejora también los rankings.

Lo que en la ciencia recibe el nombre de Grupo de Control o Variable de Control. Obviamente, esto es casi imposible o muy complicado: sería contenido duplicado y entrarían en juego penalizaciones de Google que ‘ensuciarían’ (aún más) el experimento.

Tercer agujero

Mejorar posiciones en las SERPs no implica necesariamente una mejora en lo que conceptualicé previamente como el coeficiente de una determinada keyword. Podemos rankear mejor porque quienes estaban arriba fueron penalizados, o bajaron su puntaje para algunos factores. Entonces, a lo mejor el factor A no sirvió para mejorar nuestro coeficiente, pero como subimos de posiciones, deducimos erróneamente que sí.

Ejemplo no-SEO: en el ranking, un tenista puede subir en dicho ranking porque aumenta su puntaje o porque los tenistas que están encima suyo pierden puntos.

Cum hoc ergo propter hoc (en latín, ‘con esto, por tanto a causa de esto’) es una falacia que se comete al inferir que dos o más eventos están conectados causalmente porque se dan juntos.

La falacia consiste en inferir que existe una relación causal entre dos o más eventos por haberse observado una correlación estadística entre ellos. Esta falacia muchas veces se refuta mediante la frase «correlación no implica causalidad».”

Miren esta hermosura de gráfica. La inversión de Estados Unidos en ciencia y tecnología correlaciona casi perfectamente con la cantidad de suicidios por estrangulamiento.

Cada vez que aumentó o disminuyó la inversión, aumentó o disminuyó casi exactamente en la misma proporción ese tipo de suicidios.

¡Alguien podría decir que los dólares que pone USA en inversión tecnológica están provocando más gente ahorcándose!

Obviamente no es así.

Que la variable A y la variable B se muevan en conjunto (correlación) no implica necesariamente que la variable A cause el movimiento de la variable B (causalidad).

A los humanos nos encanta encontrar causalidades donde en realidad hay simples coincidencias. Le da sentido a un mundo mucho más azaroso de lo que nos gustaría creer que es.

Cada vez que encontramos una mejora de un proyecto en las SERPs, queremos encontrar la causa de esa subida en el posicionamiento. Lógicamente: si la encontramos, descubriremos una relación causal que nos permitirá mejorar los rankings de otros proyectos.

Me ha pasado. Me encuentro con una mejora en los rankings y no entiendo por qué se dio. Me pongo a pensar y me acuerdo que un par de semanas antes llevé a cabo alguna optimización en el sitio. Y llego a la conclusión “mis rankings mejoraron por causa de esa optimización”.

Bueno, no necesariamente. Pueden haber sido otro montón de causas: empeoró el posicionamiento de los otros sitios que compiten por esa key, incluso otros factores que no estamos teniendo en cuenta.

Es posible que la optimización que hicimos haya mejorado el posicionamiento, pero que no explique un 100% la mejora en los rankings, sino solo una parte.

Y recordemos que partimos de un modelo hiper simplificado de cómo funciona Google. Aún así podemos estar todo el tiempo (bueno, diré la mayor parte del tiempo para no sentirnos tan mal) equivocándonos.

Sobre los estudios de correlación en el SEO

Existen estudios hechos por gente muy seria, como MOZ o SearchMetrics, que escogen una cantidad (limitada) de keywords y una serie (subjetiva) de factores de posicionamiento.

El estudio consiste en detectar cuáles factores correlacionan mejor con la posición que ocupan las webs en los resultados de búsqueda de Google.

➔ Si un factor aparece mucho en los primeros resultados y cada vez menos a medida que nos alejamos de la primera página de las SERPs,  la correlación será buena  (cercana a 1). Y viceversa.

El problema es que estos estudios no sirven para determinar cuáles factores toma en cuenta Google para posicionar y cuáles no.

Veamos algunos ejemplos.

La cantidad de shares en Facebook suele correlacionar muy bien con la posición de las páginas.

Pero… ¿los shares en Facebook provocan que la web se posicione mejor o que la web esté bien posicionada genera mayores shares en Facebook?

La cantidad y calidad (medidas de diversas formas) de backlinks recibidos suele correlacionar muy bien con la posición de las páginas. ¿Los links generan el buen posicionamiento o el buen posicionamiento (al estar tu web más arriba y ser más visible lógicamente) genera los links?

Por otro lado, la presencia de la keyword en el atributo title (que todos sabemos que  es un factor de posicionamiento) correlaciona muy mal con los resultados en Google… 😱

¿Por qué? Porque como todos los resultados de las primeras páginas tienen la keyword en el atributo title, no hay una correlación positiva: esta se da cuando el factor está muy presente en los primeros resultados y cada vez menos en los siguientes resultados.

Que las variables A (presencia de factor de posicionamiento) y B (posición en las SERPs) se muevan juntos puede ser:

  • Que A cause B. Lo que nos interesa, porque si replicamos A en otros proyectos similares, obtendremos mejores posiciones.
  • Que B cause A.
  • Que haya un factor C que cause tanto A como B.
  • Que sea una mera coincidencia.

Si quieren profundizar sobre este apasionante tema, les recomiendo este WhiteBoard Friday de Rand Fishkin (SEO Ranking Factors & Correlation: What Does It Mean When a Metric Is Correlated with Google Rankings? – Whiteboard Friday).

Sesgo de confirmación

El sesgo de confirmación es la tendencia a favorecer, buscar, interpretar y recordar la información que confirma las propias creencias o hipótesis de uno mismo, dando desproporcionadamente menos consideración a posibles alternativas.

Hay gente que tiene amuletos porque le dan suerte.

Los amuletos no dan suerte. Un objetivo, una superstición o rezar no hacen que sucedan mejores cosas que las que iban a acontecer.

Quienes creen en que su trébol de cuatro hojas que llevan en el bolsillo en momentos especiales les atrae la buena fortuna, lo justifican diciendo “siempre que lo tengo, me pasan cosas buenas”.Ya vimos que correlación no implica causalidad: puede ser una mera casualidad.

Pero… y acá es donde la cosa se pone interesante. Es posible que esta persona vea tal correlación porque está condicionada a verla. Ni siquiera existe.

Cuando las cosas le salen bien teniendo el amuleto encima, le asignan al amuleto el poder de dar suerte. Cuando las cosas le salen mal teniendo el amuleto encima, desechan inconscientemente ese dato. Luego, sienten que siempre que tienen el amuleto encima las cosas salen bien. ¡Están borrando evidencia!

Volvamos al SEO.

Supongamos que el algoritmo de Google (que simplifiqué brutalmente en una mera función) es uno solo y opera en todos los sectores igual.

¿Por qué habría tanta diferencia de criterios entre los SEOs acerca de qué variables son más importantes? ¿No deberíamos, luego de tantos y tantos proyectos a los que les hicimos SEO, estar cada día más de acuerdo?

Cuando un SEO defensor del White Hat posiciona un sitio, el sesgo de confirmación lo hará recordar ciertas acciones que realizó para rankearlo en desmedro de otras. Seguramente fue gracias a la respuesta de usuario y el SEO on page.

Cuando un SEO Black Hat posiciona un sitio, el sesgo de confirmación lo hará recordar las acciones más ‘blackhateras’ que llevó adelante. Seguro que los backlinks masivos y las PBN fueron lo realmente determinante.

“Ja! posicioné esto sin PBN, las PBN han muerto y ESTA ES LA PRUEBA” twittea uno.

“JA, miren lo que posicioné con mi PBN y ALGUNOS DICEN QUE YA NO FUNCIONAN”, twittea el otro.

Todos estamos sesgados por nuestra creencia previa de cómo funciona el algoritmo. Vemos la evidencia que nos lo confirma.

Conclusiones

El tema da para discutir un largo rato, sobre todo si nos ponemos a ejemplificar.

No paro de ver argumentaciones de ‘lo que funciona en el SEO’ que caen marcadamente en sesgos cognitivos. Correlaciones que podrían no ser causales, experimentos mal aislados, variables recortadas para que la hipótesis tenga más sentido, muestras no representativas, entre un largo etcétera.

Me encantaría que me cuentes lo que tú consideras como “el factor SEO principal” ¡y debatir de ese modo si eso podría llegar a ser realmente así o si está condicionado por tu propio sesgo cognitivo!

Gracias a todos y en especial gracias a Dean.

Andrés Kloster.

Leave a Comment

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *

Menú