Lista de verificación técnica de rastreabilidad de SEO

¿Qué Tal? hablemos de Lista de verificación técnica de rastreabilidad de SEO

La capacidad de rastreo es la base de su estrategia técnica de SEO. Los robots de búsqueda rastrearán sus páginas para recopilar información sobre su sitio.

Si estos bots están bloqueados de alguna manera para rastrear, no pueden indexar ni clasificar sus páginas. El primer paso para implementar el SEO técnico es asegurarse de que todas sus páginas importantes sean accesibles y fáciles de navegar.

A continuación, cubriremos algunos elementos para agregar a su lista de verificación, así como algunos elementos del sitio web para auditar y garantizar que sus páginas sean óptimas para el rastreo.

1. Cree un mapa del sitio XML.

¿Recuerdas la estructura del sitio que repasamos? Eso pertenece a algo llamado Mapa del sitio XML que ayuda a los robots de búsqueda a comprender y rastrear sus páginas web. Puede pensar en ello como un mapa para su sitio web. Enviarás tu mapa del sitio a Consola de búsqueda de Google y Herramientas para webmasters de Bing una vez que esté completo. Recuerde mantener su mapa del sitio actualizado a medida que agrega y elimina páginas web.

2. Maximice su presupuesto de rastreo.

Su presupuesto de rastreo se refiere a la las páginas y los recursos de su sitio los robots de búsqueda rastrearán.

Dado que el presupuesto de rastreo no es infinito, asegúrese de priorizar las páginas más importantes para el rastreo.

Aquí hay algunos consejos para asegurarse de que está maximizando su presupuesto de rastreo:

  • Elimina o canonicaliza las páginas duplicadas.
  • Arregle o redirija cualquier enlace roto.
  • Asegúrese de que sus archivos CSS y Javascript se puedan rastrear.
  • Comprueba tus estadísticas de rastreo con regularidad y observa si hay descensos o aumentos repentinos.
  • Asegúrese de que cualquier bot o página que no haya permitido rastrear esté destinado a ser bloqueado.
  • Mantenga su mapa del sitio actualizado y envíelo a las herramientas para webmasters correspondientes.
  • Pode su sitio de contenido innecesario o desactualizado.
  • Tenga cuidado con las URL generadas dinámicamente, que pueden hacer que la cantidad de páginas de su sitio se dispare.

3. Optimice la arquitectura de su sitio.

Su sitio web tiene varias páginas. Esas páginas deben organizarse de una manera que permita a los motores de búsqueda encontrarlas y rastrearlas fácilmente. Ahí es donde entra en juego la estructura de su sitio, a menudo denominada arquitectura de información de su sitio web.

De la misma manera que un edificio se basa en el diseño arquitectónico, su arquitectura del sitio es cómo organizas las páginas de tu sitio.

Las páginas relacionadas se agrupan; por ejemplo, la página de inicio de su blog se vincula a publicaciones de blog individuales, cada una de las cuales se vincula a sus respectivas páginas de autor. Esta estructura ayuda a los robots de búsqueda a comprender la relación entre sus páginas.

La arquitectura de su sitio también debe moldear y ser moldeada por la importancia de las páginas individuales. Cuanto más cerca esté la página A de su página de inicio, más páginas se vincularán a la página A y mayor será la equidad de los enlaces. aquellas tienen las páginas, más importancia le darán los motores de búsqueda a la página A.

Por ejemplo, un enlace desde su página de inicio a la página A demuestra más importancia que un enlace desde una publicación de blog. Cuantos más enlaces a la página A, más «significativa» se vuelve esa página para los motores de búsqueda.

Conceptualmente, la arquitectura de un sitio podría verse así, donde el Acerca de, Producto, Noticias, etc. las páginas se colocan en la parte superior de la jerarquía de importancia de la página.

Fuente

Asegúrese de que las páginas más importantes para su negocio estén en la parte superior de la jerarquía con la mayor cantidad de enlaces internos (¡relevantes!).

4. Establezca una estructura de URL.

Estructura de URL se refiere a cómo estructura sus URL, que podría ser determinada por la arquitectura de su sitio. Voy a explicar la conexión en un momento. Primero, aclaremos que las URL pueden tener subdirectorios, como blog.nosotros.comy/o subcarpetas, como nosotros.com/blogque indican a dónde lleva la URL.

Como ejemplo, una publicación de blog titulada Cómo acicalar a tu perro caería bajo un subdominio o subdirectorio de blog. La URL podría ser www.bestdogcare.com/blog/how-to-groom-your-dog. Mientras que una página de producto en ese mismo sitio sería www.bestdogcare.com/products/grooming-brush.

Ya sea que use subdominios o subdirectorios o «productos» versus «tienda» en su URL, depende totalmente de usted. La belleza de crear su propio sitio web es que puede crear las reglas. Lo importante es que esas reglas sigan una estructura unificada, lo que significa que no debe cambiar entre blog.yourwebsite.com y yourwebsite.com/blogs en diferentes páginas. Cree una hoja de ruta, aplíquela a su estructura de nombres de URL y apéguese a ella.

Aquí hay algunos consejos más sobre cómo escribir sus URL:

  • Utilice caracteres en minúsculas.
  • Use guiones para separar las palabras.
  • Hágalos breves y descriptivos.
  • Evite el uso de caracteres o palabras innecesarias (incluidas las preposiciones).
  • Incluya sus palabras clave objetivo.

Una vez que haya abrochado su estructura de URL, enviará una lista de URL de sus páginas importantes a los motores de búsqueda en forma de un mapa del sitio XML. Si lo hace, le da a los robots de búsqueda un contexto adicional sobre su sitio para que no tengan que averiguarlo mientras rastrean.

5. Utilice robots.txt.

Cuando un robot web rastrea su sitio, primero verificará /robot.txt, también conocido como el Protocolo de exclusión de robots. Este protocolo puede permitir o impedir que robots web específicos rastreen su sitio, incluidas secciones específicas o incluso páginas de su sitio. Si desea evitar que los bots indexen su sitio, usará una metaetiqueta de robots noindex. Analicemos ambos escenarios.

Es posible que desee bloquear ciertos bots para que no rastreen su sitio por completo. Desafortunadamente, existen algunos bots con intenciones maliciosas, bots que rasparán su contenido o enviarán spam a los foros de su comunidad. Si nota este mal comportamiento, usará su robot.txt para evitar que ingresen a su sitio web. En este escenario, puede pensar en robot.txt como su campo de fuerza de los bots malos en Internet.

Con respecto a la indexación, los robots de búsqueda rastrean su sitio para recopilar pistas y encontrar palabras clave para que puedan relacionar sus páginas web con consultas de búsqueda relevantes. Pero, como veremos más adelante, tiene un presupuesto de rastreo que no desea gastar en datos innecesarios. Por lo tanto, es posible que desee excluir las páginas que no ayuden a los robots de búsqueda a comprender de qué se trata su sitio web, por ejemplo, un Gracias página de una oferta o una página de inicio de sesión.

No importa qué, tu El protocolo robot.txt será único. dependiendo de lo que le gustaría lograr.

6. Agregue menús de migas de pan.

Recuerda la vieja fábula Hansel y Gretel donde dos niños tiraron migas de pan al suelo para encontrar el camino de regreso a casa? Bueno, estaban en algo.

Las migas de pan son exactamente lo que parecen: un rastro que guía a los usuarios al inicio de su viaje en su sitio web. Es un menú de páginas que les dice a los usuarios cómo se relaciona su página actual con el resto del sitio.

Y no son solo para los visitantes del sitio web; los robots de búsqueda también los usan. breadcrumb-navegacion-menu-tecnica-seo

Fuente

Las migas de pan deben ser dos cosas: 1) visibles para los usuarios para que puedan navegar fácilmente por sus páginas web sin usar el Atrás y 2) tener un lenguaje de marcado estructurado para brindar un contexto preciso a los robots de búsqueda que rastrean su sitio.

¿No está seguro de cómo agregar datos estructurados a sus migas de pan? Use esta guía para BreadcrumbList.

7. Usa la paginación.

¿Recuerdas cuando los profesores te pedían que numeraras las páginas de tu trabajo de investigación? Eso se llama paginación. En el mundo del SEO técnico, la paginación tiene un papel ligeramente diferente, pero aún puedes pensar en ella como una forma de organización.

La paginación usa código para indicar a los motores de búsqueda cuándo las páginas con distintas URL están relacionadas entre sí. Por ejemplo, puede tener una serie de contenido que divide en capítulos o en varias páginas web. Si desea facilitar que los robots de búsqueda descubran y rastreen estas páginas, entonces utilizará la paginación.

La forma en que funciona es bastante simple. irás a la de la página uno de la serie y uso

rel=”siguiente” para decirle al robot de búsqueda qué página rastrear en segundo lugar. Luego, en la página dos, usará rel=”anterior” para indicar la página anterior y rel=”siguiente” para indicar la página siguiente, y así sucesivamente.

Se parece a esto…

En la página uno:

 

 

<link rel=“next” href=“https://www.website.com/page-two” />

En la página dos:

 

 

<link rel=“prev” href=“https://www.website.com/page-one” />

<link rel=“next” href=“https://www.website.com/page-three” />

Tenga en cuenta que paginación es útil para el descubrimiento de rastreo, pero Google ya no lo admite para indexar páginas por lotes como antes.

8. Verifique sus archivos de registro de SEO.

Puede pensar en los archivos de registro como una entrada de diario. Los servidores web (el diario) registran y almacenan datos de registro sobre cada acción que realizan en su sitio en archivos de registro (el diario). Los datos registrados incluyen la hora y la fecha de la solicitud, el contenido solicitado y la dirección IP solicitante. También puede identificar el agente de usuario, que es un software de identificación única (como un robot de búsqueda, por ejemplo) que cumple con la solicitud de un usuario.

Pero, ¿qué tiene esto que ver con el SEO?

Bueno, los robots de búsqueda dejan un rastro en forma de archivos de registro cuando rastrean su sitio. Puede determinar si, cuándo y qué se rastreó revisando los archivos de registro y filtrando por el agente de usuario y motor de búsqueda.

Esta información es útil para usted porque puede determinar cómo se gasta su presupuesto de rastreo y qué barreras para la indexación o el acceso está experimentando un bot. Para acceder a sus archivos de registro, puede preguntarle a un desarrollador o usar un analizador de archivos de registro, como Rana Gritando.

El hecho de que un robot de búsqueda pueda rastrear su sitio no significa necesariamente que pueda indexar todas sus páginas. Echemos un vistazo a la siguiente capa de su auditoría técnica de SEO: indexabilidad.

Publicado originalmente el 11 de noviembre de 2019 a las 12:45:00 p. m., actualizado el 26 de marzo de 2020

Hasta luego fué un gusto

sobre el autor

Estuardo Monroy

Te gustaría saber más sobre el autor, te invito que veas la sección de Nosotros en Consultor SEO, donde se extiende hablando sobre su experiencia, conocimientos y un poco de información personal.