BOE Simplificado: buscador semántico sobre normativa oficial
Buscador semántico sobre normativa oficial, con normas vectorizadas, recuperación contextual y generación de resúmenes o respuestas asistidas con LLMs.
Cómo pasar de una fricción concreta a un sistema más claro, más revisable y más preparado para sostener trabajo real.
No mires solo la tecnología. Mira qué parte del proceso se ordena, qué riesgo se reduce y qué base queda preparada para crecer.

El punto de partida
El BOE contiene un volumen enorme de normativa oficial. El problema no es solo acceder a las normas, sino encontrarlas por significado, relacionarlas, resumirlas y convertirlas en respuestas útiles.
La fricción que había que resolver
La búsqueda tradicional por palabras clave no siempre funciona bien cuando el usuario no sabe exactamente qué término jurídico usar. Además, procesar normativa a gran escala exige controlar costes de embeddings, almacenamiento, recuperación y generación.
No era solo una tarea lenta. Era un sistema de trabajo con demasiada fricción.
Cuando un proceso depende de revisar información dispersa, reconstruir decisiones o repetir tareas manuales, el coste no está solo en el tiempo. También está en los errores, las interrupciones, la falta de visibilidad y la dificultad para escalar.
- Vectorización de normativa oficial publicada en el BOE.
- Búsqueda semántica con PostgreSQL, pgvector y embeddings.
- Generación de resúmenes y respuestas asistidas con LLMs.
- Optimización de costes en procesos masivos de embeddings, búsqueda y generación.
- Base preparada para consulta normativa avanzada.
Lo importante no es añadir tecnología. Es cambiar cómo fluye el trabajo.
- Normativa oficial extensa y difícil de explorar solo mediante búsquedas exactas.
- Necesidad de localizar normas por significado, no solo por coincidencia textual.
- Coste elevado potencial al procesar grandes volúmenes de documentos.
- Dificultad para convertir normativa en respuestas o resúmenes útiles.
- Normativa vectorizada y preparada para búsqueda semántica.
- Consultas en lenguaje natural sobre normativa oficial.
- Recuperación contextual y generación asistida con LLMs.
- Optimización de coste y arquitectura para procesos masivos.
Cómo se planteó la solución
El enfoque fue tratar la normativa como un corpus semántico masivo. Se vectorizan normas, se construye recuperación sobre PostgreSQL y pgvector, y se conecta la búsqueda con generación asistida para producir resúmenes y respuestas más útiles.
Qué se construyó o se dejó preparado
Se implementó un sistema de búsqueda semántica sobre normas publicadas en el BOE, usando embeddings, PostgreSQL, pgvector y LLMs para recuperación, resumen y generación asistida.
Del problema operativo a una base de trabajo más clara
Preparación del corpus normativo
Se organiza el conjunto de normas oficiales para poder procesarlo de forma estructurada y escalable.
Vectorización masiva
Se generan embeddings de normativa oficial, controlando coste, estructura y almacenamiento.
Búsqueda semántica
Se implementa recuperación con PostgreSQL y pgvector para localizar contenido por significado.
Resúmenes y respuestas
Los LLMs ayudan a generar explicaciones, resúmenes y respuestas asistidas sobre el contexto recuperado.
Qué cambia cuando el proceso deja de depender de parches
El resultado es una base normativa consultable semánticamente, capaz de encontrar contenido por significado, generar explicaciones y optimizar procesos masivos de embeddings, búsqueda y generación.
La mejora importante no está solo en automatizar una parte del trabajo. Está en que el negocio pueda ver mejor qué ocurre, actuar con menos fricción y evolucionar sobre una base más limpia.
El equipo entiende mejor en qué punto está cada cosa y qué decisión toca tomar.
Se reducen tareas repetitivas y puntos donde el error humano aparece por exceso de fricción.
El sistema queda preparado para añadir integraciones, métricas, automatizaciones o nuevos módulos.
El valor del caso está en el patrón, no solo en el proyecto.
Aunque cada negocio tenga su contexto, muchos problemas comparten una misma lógica: información poco estructurada, decisiones poco visibles y procesos que han crecido sin una base clara.
Búsqueda por significado
La recuperación semántica permite encontrar normativa relevante aunque el usuario no use exactamente las mismas palabras del texto legal.
Escala y coste desde el diseño
Cuando el corpus supera miles de registros, el coste de embeddings, búsqueda y generación forma parte de la arquitectura.
Normativa convertida en conocimiento
El valor no está solo en indexar normas, sino en facilitar consulta, resumen y comprensión práctica.
Qué problemas y soluciones conecta este caso
Un buen caso no solo enseña una pantalla o una tecnología. Ayuda a reconocer patrones: qué fricción aparece, por qué importa y qué tipo de solución tiene sentido aplicar.
Información técnica, jurídica o interna que cuesta interpretar, resumir y convertir en decisiones prácticas.
Cambios normativos, operativos o comerciales que llegan más rápido de lo que el equipo puede revisar y convertir en acciones claras.
Datos, documentos, decisiones y conversaciones repartidos entre correo, hojas de cálculo, carpetas, aplicaciones y memoria del equipo.
Aplico IA, OCR, RAG, extracción y búsqueda semántica para consultar, clasificar, resumir o reutilizar documentación propia con más control sobre fuente, contexto y revisión.
Automatizo tareas repetitivas, validaciones, avisos y traspasos de información para que el trabajo avance con menos intervención manual, menos errores y más trazabilidad.
Diseño una base editorial preparada para posicionar, explicar valor y convertir visitas en conversaciones comerciales: problemas, soluciones, sectores, casos, recursos y CTAs conectados.
Este patrón también puede entenderse por sector o por proceso.
Si el caso te resulta familiar, no hace falta copiar exactamente la misma solución. Lo útil es identificar qué proceso se parece al tuyo, qué sector tiene una fricción parecida y qué parte merece convertirse en sistema.
Cuando los contactos entran por varios canales y necesitan convertirse en información útil para decidir.
Cuando buena parte del trabajo empieza en emails, adjuntos, solicitudes o respuestas repetidas.
Cuando el trabajo necesita estados, responsables, tareas, trazabilidad y menos coordinación manual.
Cuando hay documentos valiosos, pero cuesta consultarlos, clasificarlos, resumirlos o reutilizarlos.
Tiene sentido valorar algo parecido
- Ya existe una operativa real, pero está demasiado apoyada en tareas manuales.
- La información importante vive entre correos, documentos, hojas de cálculo o herramientas inconexas.
- El equipo necesita más trazabilidad, menos dependencia de memoria y más control sobre estados.
- Quieres usar IA o automatización, pero dentro de un flujo seguro y revisable.
Mejor no construir por construir
- Solo buscas una herramienta barata sin revisar primero el proceso.
- No hay una persona responsable para validar decisiones y aportar criterio operativo.
- El problema puede resolverse mejor con una herramienta estándar bien configurada.
- La prioridad real todavía no está clara y no hay urgencia operativa o comercial.
Otros patrones parecidos

PortalLex: portal privado e intake legal para despachos profesionales
Sistema privado para despachos que conecta captación, admisión, clientes, expedientes, documentos y comunicación en una base interna más clara.

ExamenAbogacia.com: SaaS para preparar el examen de acceso con tutor IA jurídico
Plataforma SaaS para preparar el examen de acceso a la abogacía, con usuarios, pagos, seguimiento y tutor IA conectado a documentación jurídica.

VektorRAG: sistema RAG documental reutilizable con PostgreSQL y pgvector
Sistema RAG documental reutilizable para ingerir, trocear, vectorizar, almacenar y recuperar información semánticamente desde documentos propios.
Si tu caso se parece, lo primero es aterrizarlo bien.
No hace falta que tu problema sea idéntico. Si hay trabajo manual, información dispersa, poca trazabilidad o sistemas que ya no acompañan, merece la pena valorar qué parte conviene resolver primero.
La conversación inicial sirve para entender el proceso, detectar el cuello de botella y decidir si tiene sentido automatizar, integrar, aplicar IA o construir una base propia.