Etiquetas Canonical: guía simple para principiantes |
Posted: May 31, 2020 |
¿Deseas aprender qué son las etiquetas canonical y cómo utilizarlas para eludir los temidos problemas de contenido copiado? Las etiquetas canonical no son nada nuevo. Han estado por ahí. Google, Microsoft y Yahoo se unieron para crearlas. ¿Su objetivo? Suministrar a los propietarios de sitios una forma de resolver los inconvenientes de contenido copiado de forma rápida y fácil. ¿Funcionan? Sí, perfectamente… ¡pero sólo si sabes cómo usarlas! En esta guía, aprenderás: ¿Qué es una etiqueta canonical?Una etiqueta canonical (rel=“canonical”) es un fragmento de código HTML que define la versión primordial para páginas duplicadas, casi duplicadas y afines. En otras palabras, si tienes el mismo (o bien similar) contenido disponible en diferentes URLs, puedes emplear etiquetas canonical para precisar qué versión es la principal y por tanto, la que debería ser indexada. ¿Cómo se ve una etiqueta canonical?Las etiquetas canonical utilizan una sintaxis simple y consistente, y se sitúan dentro de la sección <head> de una página web: <link rel=“canonical” href=“/pagina-ejemplo/” /> Esto es lo que significa cada una parte de ese código:
A Google no le agrada el contenido duplicado. Hace que sea más difícil para ellos elegir:
Demasiado contenido duplicado también puede afectar a tu “crawl budget”. Esto quiere decir que Google puede acabar perdiendo el tiempo rastreando múltiples versiones de la misma página en vez de descubrir otro contenido importante en tu sitio web. La verdad sobre el crawl budget Obligar a Google a perder el tiempo rastreando contenido duplicado es naturalmente algo que debe evitarse en lo posible. Sin embargo, Google afirma que no es un inconveniente para la mayoría de los sitios web. Si las nuevas páginas tienden a ser rastreadas exactamente el mismo día de su publicación, el crawl budget no es algo en lo que los webmasters deban centrarse. De igual manera, si un lugar tiene menos de unas pocas miles y miles de URLs, la mayoría de las veces se rastreará de forma eficiente. Las etiquetas canonical resuelven todos estos problemas. Permiten indicar a Google qué versión de una página deben indexar y posicionar, y dónde consolidar “link equity”. Si no se detalla una URL canonical, Google se encargará de estos asuntos . Si no indicas una URL canonical, identificaremos lo que pensamos que es la mejor versión o URL. Confiar en Google de esta manera no es una gran idea; es posible que escojan una versión de tu página que no quieras que sea canonical. Google que usualmente respetan la URL canonical que configuras, pero no siempre y en todo momento. Esto es porque las etiquetas canonical son pistas, no directivas. Siempre y cuando se respeten, cualquier señal como los enlaces, deberían afianzarse en la URL canonical. Ejecutar buenas prácticas de etiquetas canonical también ayuda a atenuar el peligro de que Google vea una versión no deseada de la página como canonical. No tengo contenido copiado ¿o sí?Dado que probablemente no has estado publicando exactamente las mismas entradas y páginas varias veces, es fácil asumir que tu sitio web no tiene contenido copiado. Pero los motores de búsqueda rastrean las URLs, no las páginas web. Esto quiere decir que ven Se llaman URLs parametrizadas y son una causa común de contenido duplicado, especialmente en sitios de con navegación facetada/filtrada. Por ejemplo, /en-gb/clothing/shirts.html Si filtras sólo para camisetas XL, se añade un parámetro a la URL: /en-gb/clothing/shirts.html Si entonces también aplicas el filtro sólo para camisetas azules, se añade otro parámetro: /en-gb/clothing/shirts.html Todas estas son páginas separadas a los ojos de Google, aunque el contenido sea sólo marginalmente diferente. Pero no son sólo los sitios de comercio electrónico los que caen víctimas de contenido copiado. Aquí hay algunas otras causas comunes de contenido copiado que se aplican a todos los modelos de sitios web:
En estas situaciones, el uso conveniente de las etiquetas canonical es crucial. Además, los problemas de contenido copiado entre dominios cruzados también son un problema. Si estás sindicando contenido, la mejor práctica es utilizar una etiqueta canonical autorreferencial en tu artículo y hacer que el contenido sindicado señale tu versión como la canonical con una etiqueta canonical de un dominio a otro. Esto no siempre impide que el contenido sindicado aparezca en los resultados de búsqueda, pero ayuda a reducir el riesgo de superar a la original.
Algunos sitios se negarán a añadir un enlace canonical. En semejantes casos, depende de ti si deseas correr el riesgo. Los fundamentos de la implementación de canonicalsLas etiquetas canonical son fáciles de incorporar. Discutiremos 4 maneras diferentes de hacerlo en un momento. No importa el método que escojas, hay 5 reglas de oro que deberías rememorar en todo instante. Regla #1: Usa URLs absolutasJohn Mueller de Google afirma que es una buena práctica no utilizar caminos relativos con el elemento de link rel=“canonical”.
Así que deberías usar la siguiente estructura: <link rel=“canonical” href=“ Al contrario de: <link rel=“canonical” href=” Regla #2: Usa URLs en minúsculasDado que Google puede tratar las URLs en mayúsculas y en minúsculas como 2 URL diferentes, primero debes asegurarte de y entonces utilizar URLs en minúsculas para tus etiquetas canonical. Regla #3: Utiliza la versión correcta de dominio (HTTPS vs. HTTP)Si has alterado a SSL, asegúrate de no declarar ninguna URL no-SSL (o sea, HTTP) en tus etiquetas canonical. Hacerlo puede teóricamente llevar a confusión y a resultados inesperados. Si estás en un dominio seguro, asegúrate de emplear la próxima versión de tu URL: <link rel=“canonical” href=“ Al contrario de: <link rel=“canonical” href=“ Si no estás usando HTTPS entonces haz lo contrario. Regla #4: Usa etiquetas canonical autorreferencialesJohn Mueller de Google afirma que aunque no es obligatorio, las etiquetas canonical autorreferenciales son. Recomiendo [usar una] canonical autorreferencial porque realmente nos deja en claro qué página deseas que se indexe, o cuál debería ser la URL cuando se indexe. Incluso si tienes una página, en ocasiones hay diferentes variaciones de URLs que pueden hacer que esa página cambie. Por ejemplo, con parámetros al final, quizás con mayúsculas y minúsculas o www y no www. Todas estas cosas pueden ser solucionadas con una etiqueta canonical. En caso de que no estés seguro de cómo marcha una canonical autorreferencial, se trata básicamente de una etiqueta canonical en una página que apunta a sí misma. Por poner un ejemplo, si la URL fuera <link rel=“canonical” href=“/ejemplo-pagina” /> La mayoría de los Content Management System modernos y populares añaden automáticamente URLs autorreferenciales, pero necesitarás que tu desarrollador lo codifique si usas un CMS adaptado. Regla #5: Utiliza una etiqueta canonical por páginaSi una página tiene múltiples etiquetas canonical,. En caso de que haya múltiples declaraciones de rel=canonical, es probable que Google ignore todos esos rastros de rel=canonical. ¿Cómo implementar canonicalsHay cinco formas conocidas de detallar URLs canonical. Estas son las llamadas señales de canonicalización:
Para inconvenientes y ventajas de cada método, mira la. 1. Configurar canonicals usando etiquetas en código HTML rel=“canonical”El empleo de una etiqueta rel=canonical es la forma más simple y obvia de precisar una URL canonical. Simplemente añade el siguiente código a la sección <head> de cualquier página duplicada <link rel=“canonical” href=“/pagina-canonical/” /> EjemploDigamos que tienes un sitio web de ecommerce de venta de camisetas. Quieres que Simplemente añade la próxima etiqueta canonical a cualquier página duplicada: <link rel=“canonical” href=“/camisetas/camisetas-negras/” /> Ten en cuenta que si estás utilizando un Content Management System, no es preciso que te metas con el código de tu página. Hay una forma más fácil. Configurar etiquetas canonical en WordPress:Instala y las etiquetas canonical autorreferenciales se añadirán automáticamente. Para establecer canonicals adaptados emplea la sección “Avanzado” en cada post o bien página. Configurar etiquetas canonical en Shopify:Shopify añade de forma predeterminada URLs canonical autorreferenciales para productos y publicaciones de blog. Para establecer URLs canonical adaptadas necesitarás editar los archivos de la plantilla (.liquid) directamente. tiene algo de información sobre cómo hacerlo. Configurar etiquetas canonical en Squarespace:Squarespace añade también, por defecto, URLs autorreferenciales. Mas, como en el caso de Shopify, necesitas editar el código de forma directa si deseas añadir una URL canonical personalizada. 2. Configurar canonicals en el HTTP headerPara documentos como PDFs no hay forma de poner etiquetas canonical en la cabecera de una página por el hecho de que no hay una sección <head> en una página. En tales casos, necesitarás utilizar el HTTP header para establecer las canonicals. Puedes también emplear una canonical en HTTP header de páginas web estándar. EjemploImagina que creamos una versión PDF de este artículo y lo situamos en una subcarpeta de nuestro weblog (ahrefs.com/blog/*). Así es cómo se vería nuestra cabecera HTTP para ese archivo: Content-Type: application/pdf
Link: </blog/canonical-tags/>; rel=“canonical”
3. Configurar canonicals en sitemapsGoogle que las páginas no-canonical De todas formas. No siempre seleccionarán URLs en sitemaps como canonicals. No garantizamos que consideremos a las URLs de los sitemaps como canonicals, pero es una forma fácil de definirlas para un sitio grande, y los sitemaps son una forma útil de señalar a Google qué páginas consideras más importantes en tu lugar. 4. Configurar canonicals con redirecciones 301Utiliza redirecciones trescientos uno cuando desees desviar el tráfico de una URL duplicada y hacia la versión canonical. EjemploSupón que se puede acceder a tu página a través de estas URLs:
Elige una URL como la canonical y redirecciona las otras URLs cara allí. Deberías hacer lo mismo para asegurar las versiones HTTPS/HTTP y www/no-www de tu lugar. Escoge una versión canonical y redirecciona las otras hacia ella. Por ejemplo, la versión canonical de
5. Enlaces internosLa forma en que se enlaza de una página a otra a través de tu lugar es una señal de canonicalización. El webmasters analista de tendencias de Google, John Mueller, cubre las señales empleadas para determinar las URLs canonical en: Cuanto más consistente seas con todas y cada una estas señales, más fácil será para los motores de búsqueda determinar tu URL canonical preferida. Tal y como menciona John en el vídeo, Google también tiene preferencia por las URLs HTTPS sobre las HTTP, y por las URLs más bonitas. Errores comunes de canonicalización a evitarLa canonicalización es de alguna manera un tópico complejo. Como tal, existen muchos malentendidos y conceptos erróneos sobre cómo canonicalizar apropiadamente. Aquí existen algunos errores comunes que la gente comete al intentar hacerlo: Error #1: Bloquear la URL canonicalizada a través de robots.txtBloquear una URL en impide que Google lo rastree, lo que quiere decir que no podrán ver ninguna etiqueta canonical en esa página. Esto, por su parte, impide que transfieran “link equity” de la página no-canonical a la canonical. Error #2: Configurar la URL canonicalizada como ‘noindex’Nunca mezcles noindex y rel=canonical. Son instrucciones contradictorias. Google acostumbra comercio online ‘noindex’, como asevera John Mueller. Mas prosigue siendo una mala práctica. Si no deseas indexar y a la vez canonicalizar una URL, usa una redirección trescientos uno. En caso contrario, utiliza rel=canonical. Error #3: Establecer un código de estado HTTP 4XX para la URL canonicalizadaEstablecer un código de estado HTTP 4XX para una URL canonicalizada tiene el mismo efecto que emplear la etiqueta ‘noindex’: Google no podrá ver la etiqueta canonical y transferirá “link equity” a la versión canonical. Error #4: Canonicalizar todas y cada una de las páginas paginadas a la principalLas páginas paginadas no deben ser canonicalizadas a la primera página paginada de la serie. En su lugar, se deben usar canonicals autorreferenciales en todas y cada una de las páginas paginadas. ¿Por qué? Como John Mueller de Google, este es un empleo inapropiado de la rel=canonical. Ya que este post es sobre la canonicalización, lo primordial que hay que eludir es utilizar rel=canonical en la página 2 que apunta a la página 1. La página 2 no es equivalente a la página 1, por lo que el empleo de rel=canonical así sería incorrecto. También deberías emplear etiquetas rel=prev/next para la paginación. Estas, mas. Error #5: No emplear etiquetas canonical con hreflangse usan para concretar el idioma y la meta geográfico de una página web. Google que cuando se emplea hreflang, se debe “especificar una página canonical en el mismo idioma, o el mejor idioma sustituto posible si no existe una canonical para exactamente el mismo idioma”. Error #6: Tener múltiples etiquetas rel=canonicalEl hecho de tener múltiples etiquetas rel=canonicals hará que probablemente sean ignoradas por Google. En muchos casos esto ocurre pues las etiquetas se insertan en un sistema en distintos puntos como por ejemplo por el Content Management System, el tema, y el/los plugin(s). Es por esto que muchos plugins tienen una opción de sobreescritura para cerciorarse de que son la única fuente de etiquetas canonical. Otra área en la que esto puede ser un problema es en las canonicals añadidas con JavaScript. Si no tienes una URL canonical concretada en la contestación HTML y después añades una etiqueta rel=canonical con JavaScript entonces debería ser respetada cuando Google renderice la página. No obstante, si tienes una canonical especificada en HTML e intercambias la versión preferida con JavaScript, estás mandando señales confusas a Google. Error #7: Rel=canonical en el <body>Rel=canonical debería aparecer solo en la <head> de un documento. Una etiqueta canonical en la sección <body> de una página será ignorada. Donde esto puede convertirse en un inconveniente es con el análisis sintáctico de un documento. Mientras que el código fuente de una página puede tener la etiqueta rel=canonical en la ubicación correcta, cuando la página se edifica realmente en un navegador o bien se renderiza por un motor de búsqueda, muchas cosas diferentes como etiquetas no cerradas, JavaScript inyectado, o <iframes> en la sección <head> pueden causar que el <head> termine prematuramente mientras que se renderiza. En estos casos, una etiqueta canonical puede ser accidentariamente lanzada al <body> de una página renderizada donde no será respetada. ¿Cómo localizar y solucionar problemas de canonicalización en tu lugar?Es fácil cometer errores con la canonicalización, con lo que merece la pena auditar con regularidad tu sitio para los problemas relacionados con las etiquetas canonical y arreglarlos cuanto antes. Para ello, puede usar la. Site Audit rastrea tu sitio por más de cien problemas posicionamiento en buscadores, incluyendo aquellos relacionados con las etiquetas canonical. Aquí hay doce problemas relacionados con el etiquetado canonical que Site Audit puede localizar, y cómo arreglarlos: 1. Canonical apunta a 4XXEsta advertencia se activa cuando una o bien más páginas son canonicalizadas a una URL 4XX. Por qué es un problemaLos motores de búsqueda no indexan páginas 4XX pues no marchan. Como resultado, ignoran cualquier etiqueta canonical que apunte a tales páginas y de forma frecuente acaban indexando la versión incorrecta (no canonical) de la página. Cómo solucionarloRevisa las páginas afectadas y sustituye los enlaces canonicals muertos (4XX) por links a páginas que funcionen (200) que desees indexar. 2. Canonical apunta a 5XXEsta advertencia se activa cuando una o más páginas son canonicalizadas a una URL 5XX. Por qué es un problemaLos códigos de estado HTTP 5XX señalan problemas en el servidor, que dan como resultado una página canonical inalcanzable. No es muy probable que Google indexe páginas inalcanzables, por lo que podría ignorar el código canonical. Cómo solucionarloReemplazar cualquier URL canonical errónea con URL válidas. Verifica si hay configuraciones erróneas en el servidor si el canonical concretado parece adecuado. Ten en cuenta que esto puede ser un problema temporal si el rastreo se generó cuando tu lugar se estaba caído por mantenimiento o bien el servidor de tu sitio estaba sobrecargado. 3. Canonical apunta a redirecciónEsta advertencia se activa en el momento en que una o bien más páginas son canonicalizadas a una URL redireccionada. Por qué es un problemaLas canonicals deben siempre y en todo momento señalar la versión con mayor autoridad de una página. Este no es el caso con la redirección de URLs. Como resultado, los motores de búsqueda pueden tergiversar o bien ignorar la etiqueta. Cómo solucionarloReemplazar los links canonicals por enlaces directos a la versión con mayor autoridad de la página (o sea, una que devuelva un código de estado HTTP doscientos y no redireccione). 4. Páginas duplicadas sin canonicalEsta advertencia se activa cuando existen una o bien más páginas duplicadas o muy similares que no detallan una versión canonical. Por qué es un problemaDado que no se detalla ninguna canonical, Google intentará identificar la versión más adecuada para mostrarla en los propios resultados de búsqueda. Posiblemente esta no sea la versión que quieres indexar. Cómo solucionarloRevisa los conjuntos de duplicados. Elige una versión canonical que debería ser indizada en los resultados de búsqueda. Especifica ésta como la versión canonical en todos los duplicados (y añade una etiqueta canonical autorreferencial a la versión canonical). 5. Hreflang a no-canonicalEsta advertencia se activa en el momento en que una o más páginas detallan una URL no canonical en sus anotaciones de hreflang. Por qué es un problemaLos enlaces en las etiquetas hreflang Cómo solucionarloSustituir los links en las anotaciones de hreflang de las páginas afectadas por su canonical. 6. URL canonical no tiene links internos entrantesEsta advertencia se activa cuando una o bien más URLs canonical especificadas no tienen enlaces entrantes internos. Por qué es un problemaLas URLs canonical sin links internos son inalcanzables para los visitantes del sitio web. En algún sitio del lugar se las dirige a una versión no-canonical de la página en su sitio. Cómo solucionarloReemplazar cualquier enlace interno a páginas canonicalizadas con enlaces directos a la canonical. 7. Página no-canonical en sitemapEsta advertencia se activa en el momento en que una o bien más páginas no-canonical aparecen en el sitemap. Por qué es un problemaGoogle diseño de páginas web en santander que no debes incluir URLs no-canonical en tu sitemap; la razón es que ven las páginas de los sitemaps como sugerencias canonical. Sólo deberías incluir en los sitemaps las páginas que desees que se indexen. Cómo solucionarloElimina URLs no-canonical de tu sitemap.. 8. Página no canonical especificada como canonicalEsta advertencia se activa cuando una o más páginas especifican una URL canonical que también es canonicalizada a una página diferente. Esto crea una “cadena de canonicals” en la que la página A es canonicalizada a la página B, que por su parte es canonicalizada a la página C. Por qué es un problemaLas cadenas canonicals pueden confundir y engañar a los motores de búsqueda. Como resultado, pueden malinterpretar o bien ignorar sus especificaciones. Cómo solucionarloSustituir los links no canonical en las etiquetas canonical de las páginas perjudicadas por links directos a la canonical. Por servirnos de un ejemplo, si la página A es canonicalizada a la página B, que a su vez es canonicalizada a la página C, reemplaza el enlace canonical de la página A por un enlace a la página C. 9. URL de Open Graph no coincidente con canonicalEsta advertencia se dispara cuando hay un desajuste entre la canonical detallada y la URL de Open Graph en una o más páginas. Por qué es un problemaSi la URL del Open Graph no coincide con la URL canonical, entonces se compartirá una versión no canonical de una página en redes sociales. Cómo solucionarloReemplaza la URL de Open Graph en las páginas perjudicadas por la URL canonical. Asegúrate de que las 2 URLs sean las mismas. Las URLs dentro de las etiquetas de Open Graph deben ser absolutas y utilizar los protocolos http:// o bien https://, como es el caso de las canonicals. 10. Canonical de HTTPS a HTTPEsta advertencia se activa cuando una o bien más páginas seguras (HTTPS) especifican una versión no segura (HTTP) como la canonical. Por qué es un problema, por lo que tiene sentido especificar versiones seguras de las páginas como canonicals cuando sea posible. Cómo solucionarloRedirigir la página HTTP al equivalente HTTPS. Si no es posible, añade un link rel=“canonical” de la versión HTTP de la página a la HTTPS. 11. Canonical de HTTP a HTTPSEsta advertencia se activa en el momento en que una o bien más páginas no seguras (HTTP) detallan una versión segura (HTTPS) como la canonical. Por qué es un problemaSe prefiere HTTPS a HTTP. Tener una versión HTTP de una página y luego concretar la versión HTTPS como canonical es ilógico. Es probable que esto no cause un gran problema, mas vale la pena arreglarlo si es posible. Cómo solucionarloImplementar una redirección 301 de HTTP a HTTPS. También deberías reemplazar cualquier enlace interno a la versión HTTP de la página con links directamente a la versión HTTPS. 12. Páginas no-canonicals reciben tráfico orgánicoEsta advertencia se activa en el momento en que una o más páginas no-canonicals aparecen en los resultados de búsqueda y obtienen tráfico de búsqueda orgánico (lo cual no debería ocurrir). Por qué es un problemaO bien las etiquetas canonical están configuradas de forma incorrecta o Google ha optado por ignorar la canonical concretada. Cómo solucionarloComprueba que las etiquetas rel=canonical estén configuradas correctamente en todas las páginas reportadas. Si no es así, usa la herramienta de inspección de URL de Google Search Console para revisar si consideran que la URL canonical detallada es canonical verdaderamente. Si hay una incompatibilidad, investiga por qué es así. ConclusionesLas etiquetas canonical no son Sólo recuerda que las etiquetas canonical no son una directiva sino más bien una señal para los motores de búsqueda. En otras palabras, podrían escoger una canonical diferente a la que has declarado. Puedes emplear la en Google Search Console para poder ver tanto la canonical declarada por el usuario como la escogida por Google. Estas son las clasificaciones que Google utiliza en su Informe del índice de cobertura de Google Search Console relacionadas con las URLs canonical:
¿Alguna pregunta? Déjala en los comentarios o escribeme.
|
||||||||||||||||
|