El 26% del top 100 de sitios web están bloqueando a GPTBot

Al menos 26 de los 100 sitios web más populares (y 242 de los 1.000 principales) ahora están bloqueando GPTBot, el rastreador web OpenAI presentado el 7 de agosto, según un análisis actualizado.

  • Eso es un aumento del 250% desde el mes pasado, cuando solo 69 de los 1.000 sitios web principales habían bloqueado GPTBot, según un análisis actualizado del servicio de plagio y contenido de inteligencia artificial Originality.ai.

Por qué nos importa. ¿Bloquear o no bloquear ChatGPT? Esa ha sido una gran pregunta para muchos SEO porque ChatGPT no cita ni vincula sus fuentes. Hemos dejado que los motores de búsqueda rastreen nuestro contenido porque existe un claro beneficio potencial: obtenemos tráfico a través de enlaces directos/citas. Claramente, incluso más sitios web más populares han decidido bloquear GPTBot, presumiblemente porque no quieren que OpenAI extraiga sus datos para ayudar a entrenar sus modelos, al menos no sin algún tipo de compensación.

12 sitios web populares ahora bloquean GPTBot. Entre las nuevas incorporaciones de los 100 sitios más populares del mes pasado, la mayoría de los cuales publican noticias e información:

  • pinterest.com
  • de hecho.com
  • theguardian.com
  • cienciadirect.com
  • usatoday.com
  • stackexchange.com
  • alamy.com
  • webmd.com
  • diccionario.com
  • washingtonpost.com
  • npr.org
  • cbsnews.com

Un gran cambio. Curiosamente, Foursquare, que bloqueaba GPTBot el mes pasado, ya no lo hace.

Puede interesarte  Google lanza Bard, su función ChatGPT, a probadores de confianza (SEOs preocupados)

¿Qué pasa con CCbot? El rastreador web de Common Crawl todavía está menos bloqueado: solo 130 sitios web. Como recordatorio, Common Crawl proporciona parte de los datos de entrenamiento utilizados por OpenAI, Google y otros.

  • 109 de los 1.000 sitios web principales bloquean tanto GPTBot como CCbot.

Limitaciones. 67 archivos robots.txt de los 1000 sitios web no fueron identificados/inspeccionados como parte de este análisis. (Es por eso que escribí “al menos” en la oración inicial).

Análisis actualizado de Originality.ai. Sitios web que han bloqueado GPTBot de OpenAI: estudio de 1000 sitios web

Un poco más. ¿Debería impedir que el complemento del navegador web de ChatGPT acceda a su sitio web?

Fuente en inglés

Comentarios

Comenta