Explorá

Paso a paso / 9 min de lectura

¿Cómo aplicar “noindex” a una página en WordPress? 4 métodos sencillos

someone searches for information using a laptop

Tener tus páginas y publicaciones en una alta posición en los motores de búsqueda significa que estás implementando buenas prácticas de SEO. En general, eso es bueno, pero a veces puede ser lo contrario de lo que querés. Esto se debe a que no querés que los motores de búsqueda indexen ciertas páginas o publicaciones y las presenten a los usuarios en los resultados.

Este artículo explora cuatro métodos para aplicar el noindex a publicaciones o páginas en WordPress y evitar que aparezcan en los resultados de búsqueda.

¿Qué es el “noindex”?

noindex es una etiqueta HTML que le dice a los robots de los motores de búsqueda (“crawlers”) que no indexen una página web en particular, impidiendo que aparezca en los resultados de búsqueda. Para ponerlo en contexto, tené en cuenta que los motores de búsqueda tienen tres funciones principales: rastreo, indexación y clasificación.

  • Rastreo es explorar internet, recorriendo el código y contenido de cada URL que los rastreadores de motores de búsqueda pueden encontrar. Un “crawler” o “araña web” es un programa que los motores de búsqueda utilizan para rastrear páginas.
  • Indexación es el almacenamiento y organización del contenido explorado durante el proceso de rastreo.
  • Clasificación es proveer el contenido más relevante para la consulta del usuario; lo que ves en los resultados de búsqueda es lo que el motor de búsqueda clasificó de más a menos relevante para tu consulta.

Cuando una página web es indexada (añadida al índice, una base de datos extensa de páginas rastreadas), compite con otras páginas para posicionarse en los resultados de búsqueda para palabras clave específicas. Lo que hace la etiqueta noindex es evitar que esa página sea añadida al índice y, por lo tanto, evitar que aparezca en los resultados de búsqueda.

¿Por qué querrías aplicar noindex a una página?

Aunque al principio parece contraintuitivo, hay casos en los que vas a querer evitar que los motores de búsqueda indexen páginas específicas de tu sitio web.

Una de las razones más comunes para excluir páginas de la indexación es porque no están relacionadas con las palabras clave que tu sitio web apunta.

Por ejemplo, si tu sitio web se posiciona bien en los resultados de búsqueda para un tema específico como el desarrollo de WordPress, puede que quieras excluir las páginas que no contribuyen a los rankings de motor de búsqueda para las palabras clave relacionadas con el tema.

Un caso común sería las páginas de “Gracias” a las que llegan los visitantes después de unirse a tu newsletter, suscribirse a un servicio o comprar productos. Incluso si es una buena página de “Gracias”, indexarla puede reducir la densidad de palabras clave de tu sitio para las búsquedas en las que querés posicionarte.

Otros casos donde podrías querer aplicar la etiqueta noindex incluyen los siguientes:

  • Páginas “Solo para miembros” a las que los usuarios solo pueden acceder después de enviar su información de contacto.
  • Versiones para imprimir de páginas, que los motores de búsqueda pueden detectar como contenido duplicado y penalizar tu sitio por ello.
  • Archivos de autor en blogs donde hay un solo autor, ya que los archivos pueden ser etiquetados como contenido duplicado.
  • Páginas de administración y de inicio de sesión.
  • Páginas que aún están en construcción.
  • Resultados de búsquedas internas.
  • Páginas de categorías y etiquetas que están desviando tráfico de contenido valioso.
  • Entornos de prueba.
  • Páginas protegidas por contraseña.

4 Métodos para noindexar una página en WordPress

Hay múltiples maneras de aplicar noindex a una página en WordPress. Hemos incluido los 4 métodos que consideramos los más fáciles, rápidos y amigables para el usuario.

Método #1: noindexar una página o entrada con las configuraciones “Avanzadas” de Yoast SEO

Podés usar el plugin Yoast SEO para aplicar la etiqueta noindex. Dada su popularidad, probablemente sea el método más fácil y amigable para el usuario. Para aplicar una etiqueta noindex usando las configuraciones de Yoast SEO, andá a la entrada o página que querés mantener fuera de los resultados de búsqueda, desplazate hacia abajo y hacé clic en la pestaña Avanzado.

Opciones avanzadas de Yoast SEO en WordPress, destacando la opción para permitir al motor de búsqueda mostrar esta página

Probablemente también notaste la opción “¿Deben los motores de búsqueda seguir los enlaces en este Blog?”. La mayoría de las veces, querrás elegir “Sí”, pero en algunos casos, como entradas y páginas que contienen enlaces en los comentarios o de marcas afiliadas, puede que prefieras elegir “No.” Esto se debe a que el contenido patrocinado y los enlaces ingresados por los usuarios pueden perjudicar el SEO de tu sitio.

Método #2: noindexar una página o entrada con el archivo robots.txt

robots.txt es un archivo de texto en la carpeta raíz de tu sitio web en WordPress. Desde el archivo robots.txt, podés emitir comandos que indicen a los rastreadores de motores de búsqueda qué recursos de tu sitio pueden acceder.

Para acceder al archivo robots.txt, podés conectarte a tu sitio web vía FTP usando FileZilla o una aplicación similar, usar el Administrador de Archivos de cPanel, o usar Yoast SEO yendo a SEO > Herramientas y haciendo clic en Editor de Archivos en la pantalla siguiente. Independientemente del método, necesitarás ingresar una sola línea de código:

Disallow: /URL-de-tu-página/

Si bien este método funciona, no es ideal por razones que explicaremos en una sección abajo.

Método #3: noindexar una página o entrada con una Meta Tag HTML

Como se explicó al inicio del artículo, noindex es una meta tag HTML. Como tal, podés insertar una línea de código en el archivo HTML de tu entrada o página para lograr los mismos resultados que el método de Yoast SEO. Ingresá el siguiente código en la sección <head> del archivo:

​​<meta name="robots" content="noindex" />

Para que este método funcione, no podés usarlo junto con el método robots.txt, ya que éste sobrescribirá la meta tag HTML y evitará que los rastreadores lo analicen.

Método #4: Usar la Directiva “noindex” en el Encabezado de Respuesta HTTP

Finalmente, este método es un poco más avanzado pero logra los mismos resultados. Necesitás agregar la etiqueta X-Robots-Tag y añadir esta respuesta HTTP en el encabezado del archivo header.php:

header("X-Robots-Tag: noindex", true);

Tened en cuenta que usar este método agrega la etiqueta noindex a todas las páginas y entradas, no solo a las específicas, a menos que agregues código extra para especificar. Por esta razón, generalmente no es el método recomendado, a menos que sea exactamente lo que buscas.

Factores que influyen en la etiqueta “noindex”

Hay algunos factores que influyen en la efectividad de la etiqueta noindex.

Directiva de “Disallow” en robots.txt

Uno de los métodos explicados anteriormente involucraba el uso de la directiva Disallow en robots.txt. Aunque este método funciona, también puede no hacerlo, dependiendo de varios factores.

Un caso donde no funcionará es si tenés enlaces internos de otras entradas o páginas en tu sitio que lleven a la URL especificada en la directiva Disallow. Los enlaces desde páginas externas que también conducen a esa URL tienen el mismo efecto.

En ambos casos, los motores de búsqueda pueden encontrar esa URL y aún así indexar esa página, a pesar de la directiva. Por esa razón, la directiva Disallow es el método menos fiable para usar.

Finalmente, usar la directiva Disallow además de la etiqueta noindex impide que la etiqueta noindex sea efectiva porque los rastreadores analizarán primero el archivo robots.txt y nunca analizarán los contenidos de la URL asignada a la directiva Disallow.

Directiva de “noindex” en robots.txt

El archivo robots.txt también admite una directiva noindex, que podés usar para desindexar una página, páginas o carpetas enteras de tu sitio. Sin embargo, esta directiva también es poco confiable, y es mejor evitarla.

Meta Tag HTML “nofollow”

La etiqueta HTML nofollow está relacionada con la opción “¿Deben los motores de búsqueda seguir los enlaces en este Blog?” del método de Yoast SEO. Cuando aplicás el HTML noindex a una página a través del método que prefieras, todavía estás permitiendo que los motores de búsqueda la rastreen. En el proceso de rastrearla, explorarán los enlaces contenidos en tu página.

En algunos casos, querrás evitar que los motores de búsqueda sigan esos enlaces, ya que podrían conducir a sitios web que no podés respaldar (por ejemplo, enlaces dejados por bots en la sección de comentarios). Si los motores de búsqueda determinan que algunos de esos enlaces son maliciosos o incurren en técnicas de SEO de sombrero negro, podrían penalizar tu sitio.

Para prevenir esto, podés agregar la etiqueta nofollow a enlaces específicos que no respaldás o seleccionar “No” en la opción “¿Deben los motores de búsqueda seguir los enlaces en este Blog?” para evitar que los motores de búsqueda sigan cualquier enlace en tu entrada.

WordPress te permite aplicar la etiqueta nofollow sin editar el código. Para hacerlo, hacé clic en un enlace en el editor y luego marcá “Los motores de búsqueda deberían ignorar este enlace (marcar como nofollow).”

Menú modal de WordPress para gestionar enlaces

Hay múltiples maneras de noindexar páginas en WordPress

Como hemos visto, hay múltiples formas de aplicar noindex a una página web. La mayoría son igualmente efectivas, excepto la opción de robots.txt, que tiende a ser poco fiable por varias razones. Además, si editás header.php afecta a todas las páginas y entradas por defecto, por lo que necesitas agregar código extra para evitarlo.

En general, Yoast SEO es el método más fácil y confiable ya que es rápido, simple y efectivo.

Tened en cuenta que estos métodos llevan tiempo para funcionar porque los rastreadores web probablemente necesiten rastrear tu página una vez más para detectar la etiqueta noindex y mantener tu página fuera de los resultados de búsqueda.

Preguntas Frecuentes (FAQs)

¿Debería noindexar páginas de White Paper?

Deberías aplicar noindex a las páginas de white paper solo si el white paper no es tuyo. Si estás alojando un white paper de terceros como documentación que tus usuarios pueden consultar, dejá el white paper pero usá la etiqueta noindex en él. Como el autor original probablemente ya está alojando la versión original en su sitio, es poco probable que tu copia reciba tráfico. Si el white paper es tuyo, deberías dejarlo indexado.