Ir al contenido

Descubrimiento por IA y AEO

Qué es esto

Cómo los sitios de ComStack son encontrados, citados y utilizados por asistentes de IA. La canalización de publicación genera contenido estructurado y puntos finales legibles por máquina para que los LLM puedan indexar, citar y consultar su sitio sin configuración manual.

Cómo funciona

Datos estructurados (JSON-LD)

Cada página emite JSON-LD automáticamente según su plantilla y metadatos:

  • FAQPage — las páginas con is_faq: true emiten datos estructurados FAQPage. Question.name proviene de metadata.title; Answer.text de metadata.description. Esta es la señal de mayor valor para las superficies de respuesta de IA: cada página de preguntas frecuentes es una unidad de preguntas y respuestas citable.
  • BreadcrumbList — cada página emite migas de pan Inicio → [Sección →] Página para el contexto de navegación.
  • SpeakableSpecification — marca la meta descripción y el primer párrafo del artículo como legibles por voz.
  • Organization + WebSite — emitidos en la página de inicio local desde la configuración de marca.
  • Basado en plantillas — las plantillas con un schema_org_type (p. ej., RealEstateListing) emiten automáticamente el JSON-LD de ese tipo.

llms.txt

Un índice legible por máquina que sigue la especificación llmstxt.org. Se genera en el momento de la publicación a partir de su contenido publicado.

El archivo comienza con un encabezado de nombre de proyecto y una descripción (el preámbulo, configurado en la configuración del proyecto → settings/llmstxt.content), seguido de una lista plana de entradas de preguntas frecuentes ordenadas según la barra lateral, y luego un catálogo de documentación de todas las páginas públicas. Estructura de ejemplo:

[Site name heading]
> Your one-line description
## Frequently Asked Questions
- [Do you need a NIE?](/faq/nie-spain) — Yes. A NIE is mandatory for any property purchase.
## Documentation
- [Getting started](/get-started) — Set up your project in 30 minutes.

Las páginas de preguntas frecuentes aparecen primero, ya que contienen contenido de respuesta de mayor densidad. /llms-full.txt entrega los cuerpos completos de las páginas para la ingesta de RAG.

Sitemap y robots.txt

Cuando el acceso al sitio está configurado como Public:

  • robots.txt permite explícitamente los principales rastreadores de IA: GPTBot, ClaudeBot, PerplexityBot, Google-Extended y otros.
  • El sitemap incluye alternativas hreflang <xhtml:link> para páginas traducidas.
  • Las URL de i18n de respaldo (p. ej., /es/en-slug) se excluyen y se marcan como noindex para evitar la indexación duplicada.

Servidor MCP como superficie de herramientas

Su proyecto se expone como una herramienta que los asistentes de IA pueden consultar directamente a través del servidor MCP. Una IA puede llamar a get-page-content, search-docs o list-pages para recuperar contenido estructurado en vivo, no desde una caché de rastreo.

Esto hace que su sitio sea accionable: una IA puede responder una pregunta específica consultando la página exacta en tiempo real.

hreflang para sitios multilingües

Los slugs traducidos (p. ej., /guides/buying/es/guias/comprar) requieren un hreflang correcto que no se puede inferir de la estructura de la URL. La canalización de publicación inyecta las etiquetas <xhtml:link rel="alternate" hreflang> correctas en el sitemap y en el <head> de la página, utilizando la URL traducida real.

Sin redirección automática por idioma: las páginas nunca sirven contenido diferente basado en Accept-Language o IP. Los rastreadores de IA, que no envían Accept-Language o envían un valor predeterminado en-US codificado, siempre ven el contenido del idioma real de la URL. Esto asegura que todas las variantes de idioma permanezcan indexadas correctamente.

Cuándo usarlo

Estas funciones se activan automáticamente cuando el acceso al sitio es Public. Puede influir en señales específicas:

SeñalCómo controlar
Clasificación de FAQ en llms.txtEstablezca metadata.sidebar.order en páginas con is_faq: true; los números más bajos aparecen primero
Preámbulo de llms.txtEstablezca settings/llmstxt.content: escriba el nombre del sitio, la descripción y el contexto que los agentes de IA deben entender sobre su negocio
Prioridad del SitemapEstablezca sitemap_priority (0.0–1.0) y sitemap_changefreq en páginas individuales
Tarjeta social por páginaEstablezca metadata.og_image para una imagen OpenGraph (recurre al valor predeterminado del proyecto)

Errores comunes

ErrorCausaSolución
FAQ no aparece en llms.txtEl is_faq de la página es false, o el acceso al sitio no es PublicEstablezca is_faq: true en la página; verifique el acceso al sitio en la configuración
Rastreadores de IA bloqueadosEl acceso al sitio no es PublicCuando el acceso es Unlisted, Members, Agents o Disabled, robots.txt bloquea todos los rastreadores
URL incorrecta en hreflangEl slug cambió después de crear la traducciónVuelva a publicar: el sitemap y las etiquetas hreflang se regeneran en cada publicación
JSON-LD faltante para una plantillaLa plantilla no tiene schema_org_typeSpeakableSpecification y BreadcrumbList siempre se emiten; el JSON-LD basado en plantillas requiere un schema_org_type declarado

Relacionado

Última actualización: