Arquitectura de referencia

La Stack de Referencia SIA

Arquitectura modular para sistemas de IA soberana

El Estándar define qué debe lograr la IA soberana. La Stack de Referencia define cómo — una arquitectura modular en componentes que las implementaciones conformes a SIA deben incluir.

Estos son bloques de construcción arquitectónicos, no un catálogo de productos. Las tecnologías e implementaciones específicas variarán. Los requisitos funcionales no.

Infraestructura central

La capa fundacional. Gobernanza del tráfico, gestión de modelos, aplicación del cumplimiento.

Router inteligente

Clasifica la sensibilidad de las consultas en tiempo real. Enruta a inferencia local o endpoints externos aprobados según reglas definidas. El guardián de todo el tráfico de IA.

Capa de abstracción de modelos

API unificada sin importar el modelo subyacente. Cambia de modelo foundation sin modificar aplicaciones. La clave del agnosticismo LLM.

Motor de gobernanza

Logging centralizado, pistas de auditoría y aplicación de políticas. Cada inferencia registrada con contexto completo.

Gestión de prompts

Almacenamiento versionado de prompts con historial de auditoría. Configuración como código para el comportamiento de la IA.

Optimización de inferencia

Caché, cuantización, batching. Rendimiento sin comprometer la soberanía.

Inteligencia y recuperación

Cómo la IA soberana accede y aplica el conocimiento.

RAG soberano

Generación aumentada por recuperación en tu infraestructura. Tus documentos, tus vectores, tus respuestas.

Anclaje del conocimiento

Capa de prevención de alucinaciones. Respuestas ancladas en fuentes verificadas con citación.

Residencia vectorial

Generación y almacenamiento local de embeddings. Búsqueda semántica sin egreso de datos.

Grafos de conocimiento

Relaciones estructuradas más allá de la similitud vectorial. Resolución de entidades, cadenas de inferencia, conexiones explicables.

Memoria de sesión

Persistencia del contexto entre conversaciones. Continuidad sin enviar historial a APIs externas.

Interfaz e interacción

Cómo los usuarios interactúan con los sistemas de IA soberana.

Núcleo conversacional

Fundamento de interacción basada en texto. Interfaces de chat, procesamiento de comandos, gestión de diálogo.

Pipeline de voz

Reconocimiento de voz, síntesis y conversación — on-premise. Interacción de voz en tiempo real sin ASR/TTS en cloud.

Interacción visual

Sistemas de avatar, presencia de video, interfaces multimodales para aplicaciones de alto engagement.

Puente omnicanal

Experiencia unificada a través de texto, voz y modalidades visuales. Comportamiento de IA consistente sin importar la interfaz.

Procesamiento de documentos y datos

Extracción de inteligencia a escala empresarial.

Comprensión de documentos

Extracción completa de documentos no estructurados. OCR, análisis de layout, parsing semántico.

Pipelines de datos

ETL, limpieza, transformación. Movimiento de datos que respeta fronteras de soberanía.

Generación de datos sintéticos

Crea datos de entrenamiento estadísticamente similares sin exponer originales. Privacidad por diseño.

Motor de clasificación

Etiquetado automatizado, categorización, organización de contenido.

Cumplimiento y seguridad

Cumplimiento regulatorio integrado en la arquitectura.

Motor de reglas regulatorias

Reglas de cumplimiento codificadas — HIPAA, RGPD, LGPD, requisitos específicos del sector. Aplicación por arquitectura.

Capa de redacción

Detección y manejo automático de PII. Anonimización donde es necesario, sin comprometer la utilidad.

Capa de explicabilidad

Razonamiento legible por humanos para decisiones de IA. Responde "por qué" para cada "qué".

Escudo adversarial

Protección contra inyección de prompts, extracción de datos, manipulación de modelos.

Workflow y operaciones

Orquestando sistemas de IA complejos.

Orquestador multi-agente

Coordina múltiples agentes IA en tareas complejas. Divide trabajo, sintetiza resultados, gestiona estado.

Gestor human-in-the-loop

Inserta aprobación humana en puntos definidos. Maneja escalaciones, excepciones, decisiones de alto riesgo.

Dashboard de analytics

Métricas de uso, costos, rendimiento, patrones de usuario. Visibilidad de la operación del sistema.

Notas de implementación

La Stack de Referencia define qué capacidades se requieren, no qué productos usar. Las implementaciones deben: