Descubrimiento por IA y AEO
Qué es esto
Cómo los sitios de ComStack son encontrados, citados y utilizados por asistentes de IA. La canalización de publicación genera contenido estructurado y puntos finales legibles por máquina para que los LLM puedan indexar, citar y consultar su sitio sin configuración manual.
Cómo funciona
Datos estructurados (JSON-LD)
Cada página emite JSON-LD automáticamente según su plantilla y metadatos:
- FAQPage — las páginas con
is_faq: trueemiten datos estructuradosFAQPage.Question.nameproviene demetadata.title;Answer.textdemetadata.description. Esta es la señal de mayor valor para las superficies de respuesta de IA: cada página de preguntas frecuentes es una unidad de preguntas y respuestas citable. - BreadcrumbList — cada página emite migas de pan
Inicio → [Sección →] Páginapara el contexto de navegación. - SpeakableSpecification — marca la meta descripción y el primer párrafo del artículo como legibles por voz.
- Organization + WebSite — emitidos en la página de inicio local desde la configuración de marca.
- Basado en plantillas — las plantillas con un
schema_org_type(p. ej.,RealEstateListing) emiten automáticamente el JSON-LD de ese tipo.
llms.txt
Un índice legible por máquina que sigue la especificación llmstxt.org. Se genera en el momento de la publicación a partir de su contenido publicado.
El archivo comienza con un encabezado de nombre de proyecto y una descripción (el preámbulo, configurado en la configuración del proyecto → settings/llmstxt.content), seguido de una lista plana de entradas de preguntas frecuentes ordenadas según la barra lateral, y luego un catálogo de documentación de todas las páginas públicas. Estructura de ejemplo:
[Site name heading]> Your one-line description
## Frequently Asked Questions- [Do you need a NIE?](/faq/nie-spain) — Yes. A NIE is mandatory for any property purchase.
## Documentation- [Getting started](/get-started) — Set up your project in 30 minutes.Las páginas de preguntas frecuentes aparecen primero, ya que contienen contenido de respuesta de mayor densidad. /llms-full.txt entrega los cuerpos completos de las páginas para la ingesta de RAG.
Sitemap y robots.txt
Cuando el acceso al sitio está configurado como Public:
robots.txtpermite explícitamente los principales rastreadores de IA:GPTBot,ClaudeBot,PerplexityBot,Google-Extendedy otros.- El sitemap incluye alternativas hreflang
<xhtml:link>para páginas traducidas. - Las URL de i18n de respaldo (p. ej.,
/es/en-slug) se excluyen y se marcan comonoindexpara evitar la indexación duplicada.
Servidor MCP como superficie de herramientas
Su proyecto se expone como una herramienta que los asistentes de IA pueden consultar directamente a través del servidor MCP. Una IA puede llamar a get-page-content, search-docs o list-pages para recuperar contenido estructurado en vivo, no desde una caché de rastreo.
Esto hace que su sitio sea accionable: una IA puede responder una pregunta específica consultando la página exacta en tiempo real.
hreflang para sitios multilingües
Los slugs traducidos (p. ej., /guides/buying → /es/guias/comprar) requieren un hreflang correcto que no se puede inferir de la estructura de la URL. La canalización de publicación inyecta las etiquetas <xhtml:link rel="alternate" hreflang> correctas en el sitemap y en el <head> de la página, utilizando la URL traducida real.
Sin redirección automática por idioma: las páginas nunca sirven contenido diferente basado en Accept-Language o IP. Los rastreadores de IA, que no envían Accept-Language o envían un valor predeterminado en-US codificado, siempre ven el contenido del idioma real de la URL. Esto asegura que todas las variantes de idioma permanezcan indexadas correctamente.
Cuándo usarlo
Estas funciones se activan automáticamente cuando el acceso al sitio es Public. Puede influir en señales específicas:
| Señal | Cómo controlar |
|---|---|
| Clasificación de FAQ en llms.txt | Establezca metadata.sidebar.order en páginas con is_faq: true; los números más bajos aparecen primero |
| Preámbulo de llms.txt | Establezca settings/llmstxt.content: escriba el nombre del sitio, la descripción y el contexto que los agentes de IA deben entender sobre su negocio |
| Prioridad del Sitemap | Establezca sitemap_priority (0.0–1.0) y sitemap_changefreq en páginas individuales |
| Tarjeta social por página | Establezca metadata.og_image para una imagen OpenGraph (recurre al valor predeterminado del proyecto) |
Errores comunes
| Error | Causa | Solución |
|---|---|---|
| FAQ no aparece en llms.txt | El is_faq de la página es false, o el acceso al sitio no es Public | Establezca is_faq: true en la página; verifique el acceso al sitio en la configuración |
| Rastreadores de IA bloqueados | El acceso al sitio no es Public | Cuando el acceso es Unlisted, Members, Agents o Disabled, robots.txt bloquea todos los rastreadores |
| URL incorrecta en hreflang | El slug cambió después de crear la traducción | Vuelva a publicar: el sitemap y las etiquetas hreflang se regeneran en cada publicación |
| JSON-LD faltante para una plantilla | La plantilla no tiene schema_org_type | SpeakableSpecification y BreadcrumbList siempre se emiten; el JSON-LD basado en plantillas requiere un schema_org_type declarado |
Relacionado
- Concepto de traducciones: cómo se generan las variantes multilingües
- Referencia de idiomas: códigos BCP-47 y enrutamiento de URL
- Solución: ChatGPT no recomienda mi negocio