En este artículo intento explicar la transición del SEO tradicional al GEO, una nueva disciplina que busca optimizar los contenidos para que los motores de respuestas basados en IA los citen textualmente.
Descubre cómo la generación aumentada por recuperación cambia el papel del enlace por la frase citada, detallo buenas prácticas técnicas y de contenido y repaso métricas, riesgos regulatorios y futuras tendencias, subrayando que la combinación de SEO y GEO será esencial para mantener visibilidad y credibilidad en el ecosistema digital que viene.
Vamos al lio.
La transición del SEO tradicional al GEO
Ayer buscábamos en Google, leíamos una lista de enlaces y pinchábamos en el que más nos convencía. Hoy, con los motores de respuestas (answer engines) —por ejemplo ChatGPT, Gemini o Perplexity— recibimos directamente un párrafo que ya resume, explica y, a veces, cita las fuentes en un chasquido.
Para aparecer dentro de esa respuesta nace el GEO (Generative Engine Optimization), evolución natural del SEO (Search Engine Optimization). El SEO procura la mejor posición en la página de resultados; el GEO persigue que la inteligencia artificial copie tu contenido y te mencione. Aunque hay mucho debate sobre esto, vamos a dar por valida estas definiciones para partir de algún sitio más o menos razonable.
Te aclaro dos conceptos, por si estás verde en esto:
- Motor de respuestas (Answer engines): capa de IA que redacta la contestación completa, en lugar de mostrar diez enlaces.
- IA o LLM (Large Language Model): programa entrenado con enormes volúmenes de texto capaz de generar lenguaje natural.
Evolución del índice al párrafo generado
Te resumo mucho el cambio desde que empezó todo en 1998 hasta ahora, y una imagen que ya es historia de la tecnología: Una captura de pantalla de Google Beta.
1998‑2012 | 2012‑2022 | 2023‑hoy |
---|---|---|
Típicos enlaces azules, algoritmo PageRank. | Palabras clave, Búsqueda semántica, E‑E‑A‑T (Experiencia, Conocimiento, Autoridad, Fiabilidad). | Motores de respuestas con modelos generativos y técnica RAG que buscan datos externos y los integran. |


RAG (Retrieval‑Augmented Generation): Es el enfoque que combina recuperación (“retrieval”) y generación (“generation”). En lugar de basarse solo en lo que el modelo “recuerda” de su entrenamiento, recupera información externa justo cuando se formula la pregunta y luego la fusiona en la respuesta.
Los pasos son:
- Retrieve: identifica en milisegundos los fragmentos más relevantes.
- Augment: incorpora esos fragmentos en el proceso de generación.
- Generate: produce la respuesta final, mezclando la capacidad creativa del LLM con hechos extraídos al vuelo.
Claves de SEO frente a GEO
SEO | GEO | |
---|---|---|
Objetivo | Salir en 1º pág. de Google. | Ser citado literalmente por la IA. |
Buenas prácticas | Palabras claves, enlaces entrantes (backlinks), velocidad (Core Web Vitals). | Claridad, formato citable y autoridad demostrada |
Métrica reina | CTR (Porcentaje de clics). | Frecuencia de citas correctas en las respuestas de IA. |
Riesgo | Penalización algorítmica. | Alucinación: la IA inventa un dato y te lo atribuye. |
Te aclaro otro concepto, por si acaso:
Alucinación (de IA)
Cuando el modelo “suelta” algo que suena creíble, pero es falso. Pura invención con tono convincente.
Arquitectura técnica amigable para la IA
- Marcado semántico (JSON‑LD / Schema.org)
Es un lenguaje de marcado que “explica” a la máquina el contenido de tu página. Piensa en él como carteles en un museo: “Esto es un cuadro”, “Autor: Velázquez”, “Año: 1656”. - Archivo
llms.txt
Primo hermano derobots.txt
. Sirve para decir a los robots de IA qué pueden usar y cómo deben citar. (Aunque aún no es algo demostrable 100% como apunto más abajo) - APIs y feeds
Un feed RSS enriquecido o una API propia entregan tu contenido “sin ruido”, facilitando la ingestión por parte de la IA. - Base de vectores (Vector DB)
Almacena embeddings (una especie de “huella digital” matemática de cada párrafo), lo que permite búsquedas internas rapidísimas y refuerza tu chatbot corporativo.
Apunte sobre los archivos llms.txt
El empleo de los archivos llms.txt aún no es una práctica oficial, dejo un comentario del Ryan Law dando su opinión en el blog de Ahref:
No hay pruebas de que llms.txt mejore la recuperación de IA, aumente el tráfico o mejore la precisión de los modelos. Y ningún proveedor se ha comprometido a analizarlo.
Pero también es muy fácil de configurar. Si ya tienes contenido estructurado, como páginas de productos o documentos para desarrolladores, compilar un llms.txt es trivial. Es un archivo Markdown, alojado en tu propio sitio web. Puede que no se observen beneficios, pero tampoco hay riesgos. Si finalmente los LLM lo siguen como estándar, podría haber alguna pequeña ventaja por ser los primeros en adoptarlo.
Creo que llms.txt está ganando adeptos porque todos queremos influir en la visibilidad de los LLM, pero carecemos de las herramientas para hacerlo. Así que nos aferramos a ideas que nos parecen controlables.
Pero en mi opinión personal, llms.txt es una solución en busca de un problema. Los motores de búsqueda ya rastrean y comprenden su contenido utilizando estándares existentes como robots.txt y sitemap.xml. Los LLM utilizan gran parte de la misma infraestructura.
Consejos para la estrategia de contenido
Es posible que ya tengas una checklist para optimizar tu contenido para los motores de búsquedas basado en palabras claves. Ahora hay que prestar también atención a los modelos de lenguaje, así que puede que estos cuatro puntos también te ayuden para aparecer citado en los LLMs. A empezar a trabajar el posicionamiento GEO:
a) TL;DR al inicio: TL;DR significa Too Long; Didn’t Read (“Demasiado largo; no lo he leído”). Es un mini‑resumen de palabras que permite a la IA (y al lector con prisa) captar la idea principal sin escrolar.
b) Texto citable Frases cortas y datos con fuente: así la IA puede copiar la oración sin perder contexto.
c) Autoridad visible: Incluye bio del autor, estudios o colegiación. Si puedes, añade un sello de certificación (logotipo de un colegio profesional o asociación reconocida) que confirme que el contenido ha sido revisado por expertos, igual que la “etiqueta de calidad” en un queso D.O.P. (oye, me encanta el queso)
d) Actualización periódica: Muestra claramente la fecha “Última revisión: 18 de abril de 2025” y un pequeño changelog con los cambios relevantes.
e) Fuentes de verdad: Aparecer en medios reputados como blogs, prensa, comunidades relevantes, etc. Sigue siendo importante y los LLMs rastrean qué dicen de ti y desde dónde.
Seguimiento y métricas básicas
Métrica | ¿Qué mide? | Herramientas |
---|---|---|
Citation Frequency | Número de veces que la IA cita tu dominio. | Perplexity Analytics |
Share of Voice (SoV) | Porcentaje de presencia frente a competidores. | Scripts + API de OpenAI |
Tráfico chatbot | Visitas que llegan desde respuestas de IA. | Google Analytics (fuente “chatbots”) |
Sectores y ejemplos
Antes de bucear en casos concretos, es útil recordar que el GEO no avanza al mismo ritmo en todos los sectores. La rapidez con la que un contenido es citado por los LLM depende de la frecuencia de actualización de los datos, de la criticidad de la información (salud ≠ ocio) y de la volatilidad de la intención de búsqueda. Por eso veremos enfoques dispares: desde el turismo —donde la frescura y la geolocalización pesan mucho— hasta el B2B SaaS, donde priman la autoridad y los KPI verificables. Con esta idea en mente, observa cómo se materializa la estrategia GEO en los distintos verticales.
- Turismo: Top 10 planes en Sevilla; añade datos de temperatura media y geolocalización.
- E‑commerce: Ficha de móvil con tabla de compatibilidades y FAQ (Frequently Asked Questions).
- Salud: Artículo sobre hipertensión revisado por un médico colegiado, con referencias a guías clínicas.
- B2B SaaS: Caso de éxito que presente KPIs y ROI claros.
Riesgos éticos y regulatorios
Optimizar para motores de respuestas no consiste solo en «gustarle» a la IA: hay que proteger al usuario, salvaguardar la autoría y cumplir la ley. El salto del enlace a la cita textual amplifica la responsabilidad: un dato incorrecto se propaga al instante y con tono de “verdad absoluta”. Además, el marco normativo europeo (Ley de Propiedad Intelectual, AI Act) coloca el foco en la trazabilidad y el consentimiento. A continuación sintetizo los principales riesgos que cualquier estrategia GEO debe vigilar de forma proactiva.
- Desinformación si se prioriza «contenido optimizado” sobre investigaciones académicas.
- Copyright: en España, la Ley de Propiedad Intelectual exige consentimiento para reutilizar textos extensos.
- AI Act europeo: exigirá transparencia y trazabilidad de las fuentes en sistemas de alto riesgo.
- Prompt hacking: trucos para engañar a la IA y que revele información no prevista. Conviene monitorizar.
Checklist exprés
En Disruptivos somos muy de listas de control, check list para todo. De esta forma vamos en orden. Te paso esta para que la copies.
- Auditar fuentes: todas las cifras deben enlazar al estudio original.
- Crear
llms.txt
. (Este paso puedes saltarlo, aún no queda claro) - Añadir TL;DR en cada página clave.
- Añadir un marcado schema correcto.
- Mostrar autoría y, si procede, sello de certificación.
- Configurar alertas de mención en ChatGPT/Gemini.
- Revisar contenido cada 90 días.
- Promocionarte en medios de alta autoridad.
Motores de búsqueda tradicionales vs. modelos de lenguaje: presente y futuro (abril 2025 → 2027)
Dos lógicas distintas que ya conviven
- Buscador clásico (Google, Bing): indexa páginas, las puntúa y muestra enlaces ordenados por relevancia; su núcleo sigue siendo PageRank, señales on‑page/off‑page y métricas de experiencia (Core Web Vitals).
- LLM / motor de respuestas (ChatGPT, Gemini): genera un texto nuevo a partir de trozos relevantes del corpus y —cuando puede— los cita. El ranking se traslada del “enlace” a la oración, y la pertinencia se decide en tiempo de inferencia mediante embeddings (Cada vez que haces una pregunta, el modelo convierte tu texto en vectores y vuelve a calcular la similitud con los vectores de su base de datos) y RAG.
Situación actual
- Google Search → AI Overviews & AI Mode
- Ya disponibles en 9 países europeos, español incluido, y con un “AI Mode” que permite alternar entre vista clásica y respuesta generativa alimentada por Gemini 2.0.
- Bing → Deep Search
- Casi el 70% de las empresas Fortune 500 ahora usan Microsoft 365 porque su Copilot integrado, impulsado por IA generativa, automatiza tareas rutinarias, permite crear agentes y flujos personalizados sin necesidad de programar y garantiza seguridad de extremo a extremo gracias a la Secure Future Initiative.
- ChatGPT → Navegación nativa + o3/o4‑mini
- El modo Buscar en la web integra enlaces con metadatos, y la nueva familia‑o3 razona sobre imágenes y documentos al vuelo, reduciendo alucinaciones.
- Perplexity AI → Citas en tiempo real
- Consolida su posición como “resumen con fuentes” al mostrar siempre la URL y el fragmento citado. (doc. oficial)
Lo que podría venir en unos años
Tendencia | Impacto esperado | Qué deben preparar las marcas o negocios |
---|---|---|
Modos “AI‑only” por defecto | Tráfico directo a la respuesta ⇒ menos clics. | Contenido citable, APIs de datos y feeds estructurados. |
Agentes navegadores (p. ej. Operator de OpenAI) | La IA ejecutará tareas dentro de sitios web. | Interfaces claras, semántica “GUI‑friendly”, permisos granularizados. |
Modelos verticales y multimodales | Respuestas con tablas, vídeo y 3D integrados. | Optimizar también imágenes (SVG, alt descriptivo) y clips cortos transcritos. |
Regulación (AI Act UE, Copyright) | Transparencia obligatoria de fuentes y datasets. | Documentar licencias, registrar cambios (changelog). |
Métrica de confianza algorítmica | “Citation‑score” o “Authority‑embedding” podría sustituir al PageRank tradicional dentro del modelo. | Reforzar E‑E‑A‑T con sellos, bio de autor y enlaces de calidad. |
En qué se diferenciarán mañana
- El buscador será el quién decidirá si mostrar enlaces, un resumen IA, o lanzar un agente que interactúe por el usuario.
- El LLM se convertirá en el motor semántico que rellena ese espacio intermedio: resume, compara, razona y produce el texto‑respuesta.
- Ambos compartirán inventario de señales (schema, autoridad, velocidad) pero con pesos distintos: los LLM premiarán la nitidez contextual y las citas verificables; el buscador seguirá valorando la popularidad y la experiencia de usuario.
Qué significa para tu estrategia SEO
- Doble optimización permanente: no abandones el SEO técnico (sitemaps, core web vitals) mientras impulsas el posicionamiento GEO con una estrategia de contenidos adaptada.
- Invertir en datos propios: API pública o feed enriquecido = atajo para que la IA acceda a contenido limpio.
- Monitorizar menciones IA: sigue tu Citation Frequency y ajusta títulos, bio de autor y lo que toque.
- Plan de revisión trimestral: la ventana de frescura se estrecha; Google y los LLM priorizan contenido actualizado (< 90 días). Aunque es posible que pueda variar por determinados sectores.
- Prepararse para la interacción agente‑sitio: simplifica flujos de compra o reserva y añade etiquetas ARIA para facilitar “hacer clic” sin confusión, si es necesario.
Última aclaración:
Las etiquetas ARIA son atributos HTML que mejoran la accesibilidad a personas con discapacidades.