¿Afectará el bloqueo de Cloudflare a los rastreadores de IA a tu tienda Shopify?
Te contamos lo que tienes que hacer con tu ecommerce
La reciente decisión de Cloudflare de bloquear por defecto los rastreadores de inteligencia artificial (IA) ha desatado un debate intenso sobre el futuro del acceso a contenidos en Internet. Esta medida, que ya se está aplicando en millones de sitios web, tiene como objetivo devolver el control a los propietarios de las webs frente a las grandes empresas de IA que entrenan modelos utilizando contenido sin permiso. Pero… ¿cómo afectará esto a tu tienda Shopify?
Si tienes un ecommerce en Shopify o trabajas en este ecosistema, este post te interesa. Aquí desgranamos en detalle qué implica este movimiento de Cloudflare, cómo puede impactar en el SEO, el tráfico y la visibilidad de tu tienda, y qué medidas puedes tomar para estar un paso por delante.
¿Qué ha hecho exactamente Cloudflare?
Cloudflare, uno de los mayores proveedores de servicios de seguridad y rendimiento web, ha empezado a bloquear de forma predeterminada los rastreadores de IA, es decir, los bots que utilizan las principales empresas tecnológicas para extraer datos de sitios web y entrenar sus modelos.
Entre los bots bloqueados están algunos como:
- OpenAI (ChatGPT)
- Anthropic (Claude)
- Google AI
- Perplexity AI
- Midjourney
La decisión implica que más de 170.000 sitios web ya están limitando el acceso a estos rastreadores sin que los administradores tengan que configurar nada. Este enfoque se basa en el principio de que el acceso debe estar permitido explícitamente por los propietarios de los contenidos, en lugar de asumir que está abierto por defecto.
¿Afectará este bloqueo a tu tienda Shopify?
Shopify no usa Cloudflare como proxy, pero sí como DNS
Primero, un dato técnico clave: Shopify no pasa su tráfico a través de los servidores proxy de Cloudflare como lo hacen otras plataformas o sitios propios. Sin embargo, Shopify sí utiliza Cloudflare en la gestión de su DNS, lo que significa que parte de la seguridad y del control de tráfico está influenciada por Cloudflare.
Aún así, actualmente los bloqueos a rastreadores IA de Cloudflare no afectan a las tiendas Shopify de forma directa.
¿Podría afectar en el futuro?
- Si Shopify decide integrar más profundamente los servicios de proxy de Cloudflare, sí podría haber implicaciones directas.
- También podría verse afectado si algún proveedor de Apps, temas o servicios complementarios utiliza Cloudflare para proteger sus servidores.
Por ahora, si tu tienda está únicamente en el entorno SaaS cerrado de Shopify, no deberías notar ningún impacto en el acceso de bots de IA o en la indexación de Google, Bing u otros motores de búsqueda convencionales.
¿Esto afecta al SEO de mi ecommerce?
NO afecta al SEO tradicional.
Googlebot, Bingbot y los bots de los principales buscadores siguen accediendo con normalidad.
Solo afecta a los bots de IA que entrenan modelos generativos como ChatGPT, Perplexity o Gemini.
Esto quiere decir que tus fichas de producto, descripciones, imágenes o contenido del blog seguirán posicionando en Google sin problema.
ChatGPT, especialmente en su modo con capacidad de navegación o “Browse with Bing”, no realiza rastreo independiente de la web, sino que se alimenta en gran medida del índice de Bing para obtener información actualizada es.wikipedia.org.
Por ejemplo, desde mayo de 2023, OpenAI implementó que ChatGPT Plus utilizase Bing como buscador predeterminado para acceder a datos en tiempo real como explica este artículo.
Esto significa que cuando preguntamos sobre asuntos recientes o específicos, ChatGPT no está “explorando” la Internet desde cero, sino que obtiene resultados directamente de la base de datos de Bing, los analiza y los presenta en formato conversacional. En consecuencia, si un sitio web no está indexado por Bing, ChatGPT no puede usar su contenido, lo cual resalta la importancia de estar bien indexado en ese buscador .
¿De dónde obtiene ChatGPT su información y por qué no siempre rastrea de forma independiente?
Es importante destacar que aunque herramientas como ChatGPT son vistas como entidades autónomas, la realidad es que no siempre realizan búsquedas independientes en la web. Como veíamos antes, desde mayo de 2023, ChatGPT (especialmente en su versión Plus) depende en gran medida del buscador Bing para obtener información actualizada en tiempo real. Esto implica que cuando le pides a ChatGPT información reciente, no está rastreando activamente tu página web por sí mismo, sino que utiliza los resultados previamente indexados por Bing.
Dicho de otra forma, si tu tienda Shopify está bien indexada en Bing, tienes más posibilidades de aparecer en los resultados generados por ChatGPT.
Por el contrario, si Bing no ha indexado tu sitio (normalmente indexan parecido pero he visto de todo…), ChatGPT tampoco podrá utilizar esa información, así que se limita tu exposición potencial ante usuarios que emplean IA para búsquedas. Este detalle refuerza la importancia de una correcta optimización SEO enfocada no solo en Google, sino también en Bing, especialmente en contextos de creciente uso de inteligencia artificial en consultas online.
¿Cómo rastrean Perplexity AI y Google Gemini?
Perplexity AI utiliza un modelo similar al de ChatGPT en cuanto a que tampoco realiza rastreos independientes en tiempo real. Más bien, Perplexity toma información a partir de motores de búsqueda ya establecidos, principalmente Bing, pero también de otros índices públicos. Cuando los usuarios hacen una pregunta en Perplexity, esta herramienta genera una respuesta combinando contenido previamente indexado en fuentes disponibles, citándolas explícitamente en los resultados. Por eso, al igual que ocurre con ChatGPT, si tu tienda Shopify no está correctamente indexada en buscadores populares como Bing o Google, no aparecerá en los resultados ofrecidos por Perplexity, reduciendo tu alcance a usuarios que emplean esta herramienta.
En el caso de Google Gemini, la situación tiene matices diferentes, pero sigue principios similares. Gemini es el modelo generativo de inteligencia artificial de Google, lo que significa que depende directamente del índice de Google para obtener información actualizada. Al estar directamente vinculado con Google Search, Gemini se beneficia enormemente del amplio rastreo de Googlebot. Esto implica que, aunque Gemini no haga directamente búsquedas independientes por sí mismo, cualquier contenido que Google haya indexado eficazmente estará disponible para esta IA. Así que, si tu tienda Shopify está bien optimizada para Google, automáticamente tendrás mayor visibilidad en los resultados ofrecidos por Gemini.
Por tanto, si quieres aprovechar al máximo la visibilidad frente a las herramientas más populares de inteligencia artificial como ChatGPT, Perplexity AI y Google Gemini, es fundamental asegurarte de que tu tienda Shopify está bien indexada tanto en Bing como en Google, dado que estas plataformas son la fuente principal de información actualizada para dichas herramientas generativas.
¿Y qué pasa con los contenidos de mi tienda? ¿Pueden ser usados por IA?
Mi recomendación personal es que permitas a las IA utilizar tu contenido, pero si quieres evitar que las IA utilicen los textos e imágenes de tu tienda Shopify para entrenar sus modelos (algo que podría acabar beneficiando a tus competidores), te recomendamos tomar medidas adicionales:
1. Usa un archivo llms.txt
en tu tienda
Este archivo es un equivalente al famoso robots.txt, pero pensado específicamente para bloquear rastreadores de IA. Algunos motores de IA ya lo respetan.
En Pango Studio hemos desarrollado una App para Shopify que permite añadir fácilmente un llms.txt
personalizado a tu tienda, bloqueando los bots que desees. Aunque no está oficialmente adoptado por todos, su objetivo es convertirse en un nuevo estándar, como robots.txt en su momento.
Si quieres saber qué hacer para que tu Shopify administre bien la IA contáctanos y te ayudamos a implementarlo.
2. Opciones más avanzadas
- Usar cabeceras HTTP específicas (
X-Robots-Tag
) - Aplicar bloqueos a nivel CDN (para tiendas headless o personalizadas)
- Crear contenido exclusivo y difícil de replicar por IA
¿Podría Cloudflare cambiar esto en cualquier momento?
Sí. El mercado de la IA está evolucionando a toda velocidad y no es descabellado pensar que:
- Shopify podría integrar bloqueos automáticos en el futuro.
- Cloudflare podría permitir modelos de pago o acuerdos con las empresas de IA.
- Las IAs empiecen a adoptar el estándar llms.txt u otros de forma oficial o fáctica.
Por tanto, lo ideal es anticiparte y preparar tu ecommerce desde ya.
¿Debes preocuparte si tienes Shopify?
- Hoy por hoy, no tienes que preocuparte si tu tienda Shopify funciona dentro del entorno estándar de la plataforma. Si tienes un Headless hay que darle una vuelta.
- Este movimiento no afecta al SEO ni al tráfico orgánico tradicional.
- Si te preocupa que tus textos, fichas de producto o fotos acaben en un modelo de IA sin obtener «recompensa» por ello (como que aparezcan tus productos en las respuestas de la IA), puedes tomar medidas preventivas como el uso de
llms.txt
.
En general, te recomendamos no poner diques al mar y adaptarte a las nuevas tecnologías para sacar partido de ellas. Al fin y al cabo, nadie sabe cómo va a estar el sector del ecommerce dentro de un par de años, pero parece que los LLMs van a ser una pieza importante.