Descubrimiento por IA y AEO

Qué es esto

Cómo los sitios de ComStack son encontrados, citados y utilizados por asistentes de IA. La canalización de publicación genera contenido estructurado y puntos finales legibles por máquina para que los LLM puedan indexar, citar y consultar su sitio sin configuración manual.

Cómo funciona

Datos estructurados (JSON-LD)

Cada página emite JSON-LD automáticamente según su plantilla y metadatos:

FAQPage — las páginas con is_faq: true emiten datos estructurados FAQPage. Question.name proviene de metadata.title; Answer.text de metadata.description. Esta es la señal de mayor valor para las superficies de respuesta de IA: cada página de preguntas frecuentes es una unidad de preguntas y respuestas citable.
BreadcrumbList — cada página emite migas de pan Inicio → [Sección →] Página para el contexto de navegación.
SpeakableSpecification — marca la meta descripción y el primer párrafo del artículo como legibles por voz.
Organization + WebSite — emitidos en la página de inicio local desde la configuración de marca.
Basado en plantillas — las plantillas con un schema_org_type (p. ej., RealEstateListing) emiten automáticamente el JSON-LD de ese tipo.

llms.txt

Un índice legible por máquina que sigue la especificación llmstxt.org. Se genera en el momento de la publicación a partir de su contenido publicado.

El archivo comienza con un encabezado de nombre de proyecto y una descripción (el preámbulo, configurado en la configuración del proyecto → settings/llmstxt.content), seguido de una lista plana de entradas de preguntas frecuentes ordenadas según la barra lateral, y luego un catálogo de documentación de todas las páginas públicas. Estructura de ejemplo:

[Site name heading]
> Your one-line description

## Frequently Asked Questions
- [Do you need a NIE?](/faq/nie-spain) — Yes. A NIE is mandatory for any property purchase.

## Documentation
- [Getting started](/get-started) — Set up your project in 30 minutes.

Las páginas de preguntas frecuentes aparecen primero, ya que contienen contenido de respuesta de mayor densidad. /llms-full.txt entrega los cuerpos completos de las páginas para la ingesta de RAG.

Sitemap y robots.txt

Cuando el acceso al sitio está configurado como Public:

robots.txt permite explícitamente los principales rastreadores de IA: GPTBot, ClaudeBot, PerplexityBot, Google-Extended y otros.
El sitemap incluye alternativas hreflang <xhtml:link> para páginas traducidas.
Las URL de i18n de respaldo (p. ej., /es/en-slug) se excluyen y se marcan como noindex para evitar la indexación duplicada.

Servidor MCP como superficie de herramientas

Su proyecto se expone como una herramienta que los asistentes de IA pueden consultar directamente a través del servidor MCP. Una IA puede llamar a get-page-content, search-docs o list-pages para recuperar contenido estructurado en vivo, no desde una caché de rastreo.

Esto hace que su sitio sea accionable: una IA puede responder una pregunta específica consultando la página exacta en tiempo real.

hreflang para sitios multilingües

Los slugs traducidos (p. ej., /guides/buying → /es/guias/comprar) requieren un hreflang correcto que no se puede inferir de la estructura de la URL. La canalización de publicación inyecta las etiquetas <xhtml:link rel="alternate" hreflang> correctas en el sitemap y en el <head> de la página, utilizando la URL traducida real.

Sin redirección automática por idioma: las páginas nunca sirven contenido diferente basado en Accept-Language o IP. Los rastreadores de IA, que no envían Accept-Language o envían un valor predeterminado en-US codificado, siempre ven el contenido del idioma real de la URL. Esto asegura que todas las variantes de idioma permanezcan indexadas correctamente.

Cuándo usarlo

Estas funciones se activan automáticamente cuando el acceso al sitio es Public. Puede influir en señales específicas:

Señal	Cómo controlar
Clasificación de FAQ en llms.txt	Establezca `metadata.sidebar.order` en páginas con `is_faq: true`; los números más bajos aparecen primero
Preámbulo de llms.txt	Establezca `settings/llmstxt.content`: escriba el nombre del sitio, la descripción y el contexto que los agentes de IA deben entender sobre su negocio
Prioridad del Sitemap	Establezca `sitemap_priority` (0.0–1.0) y `sitemap_changefreq` en páginas individuales
Tarjeta social por página	Establezca `metadata.og_image` para una imagen OpenGraph (recurre al valor predeterminado del proyecto)

Errores comunes

Error	Causa	Solución
FAQ no aparece en llms.txt	El `is_faq` de la página es `false`, o el acceso al sitio no es `Public`	Establezca `is_faq: true` en la página; verifique el acceso al sitio en la configuración
Rastreadores de IA bloqueados	El acceso al sitio no es `Public`	Cuando el acceso es `Unlisted`, `Members`, `Agents` o `Disabled`, `robots.txt` bloquea todos los rastreadores
URL incorrecta en hreflang	El slug cambió después de crear la traducción	Vuelva a publicar: el sitemap y las etiquetas hreflang se regeneran en cada publicación
JSON-LD faltante para una plantilla	La plantilla no tiene `schema_org_type`	`SpeakableSpecification` y `BreadcrumbList` siempre se emiten; el JSON-LD basado en plantillas requiere un `schema_org_type` declarado

Relacionado

Concepto de traducciones: cómo se generan las variantes multilingües
Referencia de idiomas: códigos BCP-47 y enrutamiento de URL
Solución: ChatGPT no recomienda mi negocio