¿Los SEO están subestimando la fuga de Yandex?

Publicado: 2023-04-01

Muchos SEO se han apresurado a descartar la fuga del código fuente de Yandex. ¿Hay algo que les falta? ¿O los SEO están subestimando lo que la filtración podría ayudarlos a aprender y comprender sobre SEO?

Aquí hay una pequeña historia de fondo:

Hacia fines de enero (2023), se informó que un pirata informático consiguió alrededor de 45 GB de código fuente de Yandex, incluidos sus coeficientes (pesos) y la lista de factores de clasificación.

Eso es el equivalente a descubrir los algoritmos de búsqueda de Google. Hubo mucha expectación a su alrededor, y una gran parte de la comunidad de SEO ha estado trabajando día y noche tratando de decodificar el material.

Sin embargo, eso no fue sin que algunos dudaran de Thomas, y rápidamente descartó la filtración con argumentos como:

  • Yandex no es Google
  • No podemos determinar si la fuga es real.
  • ¿Qué es esta obsesión con los factores de clasificación?
  • Eso es solo una copia. Yandex raspó Google.
  • La fuga es solo una pequeña fracción del código fuente de Yandex. No dice nada sobre cómo Yandex clasifica los sitios web.
  • No hay nada nuevo aquí.
  • El repositorio de código está desactualizado

¿Esto grita ignorancia, o tienen razón?

La filtración puede no ser exhaustiva, pero sigue siendo útil. Incluso si el código está fechado, revela cómo han evolucionado los motores de búsqueda.

La mayoría de nosotros nunca hemos encontrado mejores conocimientos sobre cómo funcionan los motores de búsqueda modernos. Mucho de lo que sabemos es pura especulación.

Nuestra opinión: la reacción que vemos se basa principalmente en el miedo a lo desconocido, estar equivocado, tener menos espacio para la interpretación y perder tiempo y esfuerzo.

Ser cauteloso está bien, pero descartar la filtración por completo grita ignorancia.

No se quede atrás: sumerjámonos y exploremos.

Las objeciones más comunes a la fuga del código fuente de Yandex

The Most Common Objections to the Yandex Source Code Leak | MediaOne Marketing Singapore

Algunos SEO se han apresurado a pasar por alto el potencial de esta filtración, con algunas objeciones interesantes. Examinemos estos argumentos y veamos si se sostienen.

Objeción 1: Yandex no es Google

Yandex y Google son, de hecho, dos motores de búsqueda muy diferentes. Pero encontrará algunas superposiciones cuando compare sus resultados de búsqueda.

Ejecutemos algunas consultas de búsqueda y comparemos los resultados. Por ejemplo, busque "las mejores tarjetas de crédito" en Yandex y Google.

Estos son los diez primeros resultados:

Las mejores tarjetas de crédito
Google Yandex
Posición 1 Las mejores tarjetas de crédito Singapur 2023 | ¡Aplica ya! – MoneySmart Las mejores tarjetas de crédito Singapur 2023 | ¡Aplica ya! – Dinero inteligente
Posición 2 Las mejores tarjetas de crédito en Singapur 2023 - Value Champion Los 5 mejores planes de tarjetas de crédito en Singapur para todas las necesidades (2021) – Bestinsingapore
Posición 3 Las mejores promociones de tarjetas de crédito en Singapur (marzo de 2023) – Sing Saver Las mejores tarjetas de crédito en Singapur para 2023 | Finder Singapur – finder.com
Posición 4 Las mejores tarjetas de crédito en Singapur 2023 – Seedly Compara las mejores tarjetas de crédito en Singapur [2023] – Finty
Posición 5 Los mejores bonos de registro de tarjetas de crédito en Singapur (marzo de 2023) – Suite Smile Las 5 mejores tarjetas de crédito en Singapur para gastos generales (2023) – Préstamo instantáneo
Posición 6 Compara las mejores tarjetas de crédito en Singapur [2023] – Finty Tarjetas de crédito en Singapur: ofertas de febrero de 2023 | SingSaver
Posición 7 Comparar Tarjetas de Crédito Singapur – DBS Bank Las 5 MEJORES tarjetas de crédito en Singapur 2021 – YouTube
Posición 8 Solicitar una Tarjeta de Crédito por Trust | Trust Bank Singapur Las mejores tarjetas de crédito para compras en línea y pagos móviles: Value Champion

Como puede ver, la mitad de los resultados son los mismos.

1/10 de los resultados ocupan la misma posición.

Ahora hagamos lo mismo con otras palabras clave y veamos cómo se acumulan:

Palabras clave El número de resultados similares en el top 10 El número de resultados con la misma posición.
Las mejores tarjetas de crédito en Singapur 5/10 1/10
Los mejores hoteles en Nueva York 6/10 0/10
El mejor software CRM 2/10 0/10
Cómo eliminar una rama en Git 3/10 1/10
Cómo entrenar a un cachorro para ir al baño 1/10 1/10
Apartamento de 3 Dormitorios en Moscú 5/10 0/10
Síntomas del resfriado común 2/10 0/10

Podría discutir qué resultados son mejores, pero las superposiciones nos dicen algo interesante. Es una señal de que existen factores de clasificación similares en ambos motores de búsqueda y que no son completamente diferentes.

Entonces, el hecho de que Yandex no sea Google no significa que la filtración sea irrelevante.

Objeción 2: No podemos determinar si la fuga es real

Yandex confirmó oficialmente la filtración, por lo que no hay duda de que sucedió ( fuente ).

Pero si no lo cree, mire el repositorio del código. Puede compararlo con otros proyectos y ver cómo la estructura, el formato y la sintaxis coinciden con lo que esperaría de un código profesional.

Objeción 3: ¿Qué es esta obsesión con los factores de clasificación?

La obsesión con los factores de clasificación es comprensible cuando consideras cuánto tiempo y dinero se dedica al SEO. Es natural querer una ventaja sobre su competencia.

LEA TAMBIÉN ¿Cómo lanzar una academia de aprendizaje en línea?

Conocer los factores de clasificación puede ayudarlo a optimizar mejor su sitio web. Le brinda una comprensión de cómo funcionan los motores de búsqueda y le permite adaptar su contenido en consecuencia.

Objeción 4: Eso es solo una copia.Yandex Raspó Google

Algunos de los factores de clasificación descubiertos a partir de la filtración de Yandex coinciden con los utilizados por Google. Pero eso no significa que Yandex haya copiado su algoritmo.

obtener anuncio de ranking de google

Los dos motores de búsqueda utilizan métodos diferentes para calcular la relevancia del contenido. Yandex tiene su propio enfoque único, que puede ver en el repositorio de código.

Yandex puede haber tomado algunas de las mejores prácticas de Google, pero todavía hay muchos puntos de venta únicos en el código.

Objeción 5: La fuga es solo una pequeña fracción del código fuente de Yandex

Eso puede ser cierto, pero aún nos da una idea de cómo funciona Yandex. El código fuente es una gran parte del rompecabezas; entenderlo puede proporcionar información valiosa.

El argumento de la mayoría de los SEO es que solo se filtró un repositorio y que un motor de búsqueda tan gigante no puede reducirse a un único repositorio de código.

Bueno, aunque la mayor parte del motor de búsqueda de Google se basa en un solo repositorio, sigue siendo el motor de búsqueda más poderoso del mundo.

fuente

Objeción 6: No hay nada nuevo aquí

De hecho, la mayoría de los factores de clasificación descubiertos por la filtración del código fuente de Yandex no son innovadores. Son cosas que ya sabíamos y de las que llevábamos años hablando.

Pero eso no es cierto:

Lo que afirmamos saber ya han sido puras conjeturas.

Sabemos de SEO por nuestras experiencias, experimentos, estudios teóricos, anécdotas, etc.

Nunca habíamos visto estas señales de clasificación en el código fuente hasta ahora. Esta es la primera vez que los profesionales pueden confirmar estas teorías y tener evidencia real para respaldarlas.

Aspectos destacados de SEO del código fuente de Yandex

Algunos SEO se encargaron de estudiar el código fuente y desglosar lo que encontraron.

Éstos son algunos de los aspectos más destacados:

#1.Lista de factores de clasificación de Yandex por Martin MacDonald

Martin MacDonald , autor y fundador de Web Marketing School, compiló una lista de factores de clasificación de Yandex a partir de la fuga del código fuente.

Descubrió que hay mucho más de 1922 factores de clasificación individuales, comenzando en Page Rank (PR) y pasando a elementos basados ​​en texto/contenido, metaetiquetas, estructura de enlaces y más.

Ben Wills revisó el código y calculó el número real. Resulta que Yandex tiene 17854 factores de clasificación.

#2.El 19 % de los factores de clasificación se centran en las señales de los usuarios, el 6 % en la relevancia del contenido y el 6 % en los enlaces (por Malte Landwehr)

Malte Landwehr, jefe de SEO en Idealo, analizó a fondo el código fuente y extrajo información valiosa.

Descubrió que el 19 % de los factores de clasificación de Yandex se centran en las señales de los usuarios (p. ej., la tasa de rebote), el 6 % en la relevancia del contenido (p. ej., la densidad de palabras clave) y el 6 % en los enlaces (p. ej., la calidad del enlace entrante).

Los hallazgos de Malte parecen confirmar lo que informó SEMrush cuando publicaron su estudio del factor de clasificación que mostró que el tráfico a un sitio web tenía el coeficiente de clasificación más alto. La comunidad de SEO los criticó rápidamente, pero los hallazgos de Malte concuerdan con su afirmación.

#3.Había alrededor de 40 factores de clasificación relacionados con la calidad en el código (Malte Landwehr)

A partir de su análisis, Malte Landwehr también descubrió que el código tenía alrededor de 40 factores de clasificación relacionados con la calidad.

Estos factores de clasificación se dividieron en tres:

  • Anfitrión
  • Página
  • Texto

Sitio/Host/Calidad

Yandex presta atención a los detalles del sitio. Observan la actualización promedio del contenido, la calidad promedio del texto y el rendimiento histórico de su contenido (más de 10 factores). Luego proceden a categorizar el sitio de alojamiento como de calidad baja, aceptable, buena o excelente.

Sus reglas YMYL son específicas del host, no específicas del documento. En otras palabras, Yandex analiza el contenido de su sitio web de manera integral en lugar de página por página.

Calidad de la página

Yandex también analiza la calidad de la página en sí.

Verán el código de estado 404 del contenido incrustado o vinculado. Marcarán su página como de baja calidad si no se encuentra el contenido.

Los archivos de video rotos son los peores; Yandex marcará su página como de baja calidad si se detecta una.

Calidad del texto

Yandex también mira el texto de una página.

Primero, observarán la ocurrencia natural de verbos, pronombres, adjetivos, sustantivos, adverbios y otras partes del discurso.

También emplean varios métodos para detectar contenido generado automáticamente y contenido plagiado.

Los factores de clasificación son específicos de la consulta

Durante mucho tiempo se ha argumentado que los factores de clasificación son cada vez más específicos de la categoría.

Esto ha sido cierto para Google y otros motores de búsqueda, pero Yandex va más allá.

No solo miran la categoría o la palabra clave, sino que también miran la consulta en sí.

LEA TAMBIÉN Las mejores aplicaciones de compras en línea en Singapur

Su código fuente incluye factores de clasificación estáticos, binarios y específicos de consultas.

Los factores estáticos se aplican al sitio web, los factores dinámicos se aplican a la consulta y los factores del usuario están conectados con el idioma del usuario, el historial de búsqueda, la ubicación y otros datos.

Los factores de clasificación de 17854

Martin MacDonald, Ben Wills y Malte Landwehr están de acuerdo en que Yandex tiene factores de clasificación impresionantes.

Combinados, calcularon que hay 17854 factores de clasificación individuales.

Estos factores de clasificación se construyen en torno a diferentes modalidades. Sin embargo, a partir de esto, solo 1922 no está en desuso.

De la misma manera que los humanos son malos para comprender el impacto del interés compuesto, es increíblemente difícil estimar el resultado de estos algoritmos. Agregue a la mezcla factores de clasificación de gradiente y binarios, específicos de consulta y específicos del usuario, y obtendrá una pesadilla algorítmica.

La ingeniería inversa se vuelve casi imposible. El hecho de que haya tantas partes móviles, sin olvidar el ecosistema web, hace que el algoritmo de Yandex sea un gran enigma. También lo hace alentador porque muestra que los gigantes de los motores de búsqueda están considerando diferentes aspectos de un sitio web para determinar su clasificación en lugar de centrarse solo en una o dos facetas.

Yandex parece seguir mejores prácticas de recuperación de información similares a las de Google

Si bien su algoritmo es increíblemente complejo y difícil de aplicar ingeniería inversa, existen similitudes con las mejores prácticas de Google, como el índice invertido o las incrustaciones.

Yandex también utiliza diferentes modelos, como la red neuronal MatrixNet, para determinar sus coeficientes de clasificación. Recuerde que MatrixNet existía en ese entonces antes de que CatBoost lo reemplazara en 2007.

Saber cómo y dónde se usa MatrixNet en su algoritmo le dará una idea de cuánto ajustan y afinan sus modelos de clasificación los motores de búsqueda modernos.

Entonces, ¿los SEO están subestimando la fuga de Yandex?

Para comprender las verdaderas implicaciones de la filtración algorítmica de Yandex, los SEO deben comenzar a pensar como investigadores.

Imagínese si los investigadores tuvieran la secuencia completa de ADN del cáncer en ratones. Usando el mismo razonamiento que usan los SEO para descartar la filtración de Yandex, ¿argumentarían que los ratones no son humanos y que las secuencias de ADN son inútiles?

Por supuesto que no.

Es hora de que los SEO den un paso adelante y se den cuenta de que la filtración de Yandex es más que un conjunto de factores de clasificación. Es una oportunidad para aprender sobre los algoritmos de los motores de búsqueda de adentro hacia afuera.

10 cosas que aprendemos de la fuga de fuentes de Yandex

En resumen, aquí hay diez cosas que aprender de los factores de clasificación filtrados de Yandex:

#1.MatrizNet

MatrixNet se anunció por primera vez en 2009. CatBoost lo reemplazaría en 2007.

Yandex lo menciona en sus factores de clasificación.

Sin embargo, esto valida aún más la afirmación de que este es un repositorio obsoleto.

Originalmente, MatrixNet se introdujo como un nuevo algoritmo central para el SERP de Yandex. Consideró miles de factores de clasificación, asignando pesos en función de la consulta de búsqueda, la ubicación del usuario y la intención de búsqueda percibida.

Lanzado seis años antes que RankBrain de Google, MatrixNet de Yandex fue considerado uno de los algoritmos de búsqueda más avanzados.

Otros algoritmos se han construido sobre MatrixNet. En 2016, Yandex lanzó el algoritmo Palekh que usaba redes neuronales profundas para generar resultados más precisos, mientras que el algoritmo Pinet se enfocaba en reducir los resultados falsos positivos.

El algoritmo de Palekh podía procesar 150 páginas web a la vez, lo que lo convertía en una de las versiones más potentes jamás lanzadas. En 2017, Yandex lanzó una versión aún más avanzada llamada Korolyov update, que procesó 200 000 páginas a la vez e incluso llegó a considerar la profundidad de la página.

#2.Factores de URL y nivel de página

Yandex considera muchos factores de nivel de página y URL al clasificar las páginas web. Éstas incluyen:

  • La presencia de números en la URL
  • La presencia y el número de barras inclinadas finales (¿las estás usando en exceso?)
  • La presencia y número de letras mayúsculas en la URL

Yandex también considera la antigüedad de la página y la fecha de la última actualización. Todos sabemos que Google valora el contenido nuevo y Yandex no es diferente, particularmente para consultas de búsqueda relacionadas con noticias.

La filtración también muestra que Yandex usó marcas de tiempo, no para clasificar sino para reordenar. Aunque ya no lo usan.

En la versión obsoleta del algoritmo, se usaban palabras clave en la URL. Por supuesto, ya no lo usan, pero aún puede usarlo para tener una idea de cómo clasifican las páginas.

#3.Profundidad de rastreo

Google tiene constancia de que la profundidad de rastreo no es explícitamente un factor de clasificación. Sin embargo, Yandex tiene un código activo en su algoritmo que considera la profundidad de rastreo de una página.

Por profundidad de rastreo, nos referimos a la cantidad de clics que le toma a un usuario llegar a una página específica desde la página de inicio.

Las URL a las que se puede acceder fácilmente desde la página de inicio tendrán una clasificación más alta que aquellas que requieren más clics. Eso es porque Yandex cree que las páginas más cercanas a la página de inicio probablemente sean más importantes y relevantes para el uso.

LEE TAMBIÉN Monetizar Instagram: 15 cosas que debes saber para monetizar Instagram

Refleja la declaración de John Muller de que Google da un poco más de peso a las páginas más cercanas a la página de inicio.

El código filtrado también tiene un token específico para ponderar páginas huérfanas, es decir, páginas que no están vinculadas a ninguna otra página del sitio web.

#4.Clic y CTR

Yandex escribió una publicación de blog en 2011 sobre cómo utilizan los clics y las tasas de clics como factores de clasificación.

También hablaron sobre cómo el SEO podría verse tentado a usar este factor de clasificación para manipular sus clasificaciones.

Los factores de clic específicos destacados en la filtración nos dan una idea de lo siguiente:

  • La proporción de clics que recibe el enlace en relación con la proporción de todos los clics en el resultado de la búsqueda
  • Lo mismo que el anterior, pero desglosado por región
  • ¿Con qué frecuencia hacen clic los usuarios en las páginas de los resultados de búsqueda?
  • A partir de la filtración, podemos ver que Yandex considera los datos de los clics cuando clasifica las páginas en su motor de búsqueda.

Cuantos más clics recibe una página, más alto se clasifica. Es un factor de clasificación indirecto, pero tiene un impacto en las clasificaciones.

#5.Haga clic en Manipulación

La manipulación de clics ha sido un tema de interés en los círculos de SEO durante años. También conocida como "secuestro de clics", la práctica consiste en inflar artificialmente los clics en un enlace para mejorar su clasificación.

Parece que Yandex es consciente de esto y está tratando activamente de evitar que suceda.

Tienen un filtro (el filtro PF) que escanea e identifica activamente patrones de clic sospechosos.

Parece que si un enlace tiene un patrón no natural de clics, será penalizado en las clasificaciones.

#6.Comportamiento del usuario

La sección de comportamiento del usuario de la fuga es particularmente interesante.

Los SEO sin escrúpulos han estado tratando de jugar con el sistema durante años, desde la compra de enlaces hasta el relleno de palabras clave.

Pero Yandex está tomando medidas enérgicas contra todas estas prácticas y está tratando activamente de recompensar los sitios que realmente brindan una excelente experiencia de usuario.

Yandex usa el filtro PF, el mismo filtro que usa para la manipulación de clics, para identificar sitios que intentan manipular deliberadamente el comportamiento del usuario.

Analiza el tiempo dedicado a una página, la cantidad de páginas visitadas y otras métricas para decidir si una página proporciona un valor real.

#7.Tiempo de permanencia

El tiempo de permanencia es la cantidad de tiempo que un usuario pasa en una página.

En uno de sus 102 factores de clasificación, Yandex tiene esta etiqueta "TG_USERFEAT_SEARCH_DWELL_TIME".

También hacen referencia al dispositivo, la duración del usuario y el tiempo de permanencia promedio.

Han desaprobado alrededor de 39 de estos factores, pero el tiempo de permanencia sigue siendo un factor de clasificación en su algoritmo.

El término Dwell Time fue utilizado por primera vez por Bing (en su publicación de blog de 2011).

Sin embargo, Google ha dicho que no utiliza el tiempo de permanencia o señales de interacción similares como factor de clasificación.

#8.YMYL

YMYL, o Your Money, Your Life, es un término utilizado para describir sitios web que contienen información relacionada con transacciones de dinero, salud y seguridad.

La filtración toca factores de clasificación específicos para sitios web médicos, financieros y legales.

Nada nuevo: en 2019, durante la conferencia para webmasters de Yandex, anunciaron la métrica de calidad de búsqueda de Proxima.  

Entonces, ¿cómo debería explorar la fuga de Yandex?

So, How Should you Go About Exploring the Yandex Leak? | MediaOne Marketing Singapore

Pensar en los factores de clasificación de Yandex como base para las hipótesis de prueba de SEO es la mejor manera de abordar esta fuga.

Si bien no puede aislar factores de clasificación individuales, especialmente aquellos con coeficientes bajos, puede comprender las tendencias generales en su algoritmo e intentar aplicarlas a su propio sitio web.

Claro, no será una ciencia perfecta, pero al menos tendrás algo con lo que trabajar cuando pruebes nuevas estrategias y tácticas de SEO. Pruebe, mida y ajuste hasta que encuentre una fórmula ganadora.

Por ejemplo, nunca miramos la antigüedad de los enlaces cuando analizamos los perfiles de los enlaces, pero Yandex sí lo hace. Por lo tanto, tiene mucho sentido que comencemos a observar la antigüedad de los enlaces y la usemos como un factor al tomar decisiones sobre los enlaces.

El hecho de que Yandex tenga 17854 factores de clasificación no significa que deba revisarlos todos. Mire la imagen más grande y encuentre patrones.

Incluso si los motores de búsqueda cambiaran y adoptaran el modelo similar a Chat GPT, ¿no te hubiera gustado saber cuál fue la fórmula ganadora durante todos estos años?

Algo de resumen

Está claro que Yandex ha ido más allá de las tácticas básicas de SEO comunes y corrientes y está aprovechando su gran cantidad de datos para recompensar a los sitios web que ofrecen una excelente experiencia de usuario.

La filtración arroja algo de luz sobre el funcionamiento interno del algoritmo de Yandex, y parece que los SEO pueden haber pasado por alto algunos factores de clasificación importantes.