Arquitectura modular para sistemas de IA soberana
El Estándar define qué debe lograr la IA soberana. La Stack de Referencia define cómo — una arquitectura modular en componentes que las implementaciones conformes a SIA deben incluir.
Estos son bloques de construcción arquitectónicos, no un catálogo de productos. Las tecnologías e implementaciones específicas variarán. Los requisitos funcionales no.
La capa fundacional. Gobernanza del tráfico, gestión de modelos, aplicación del cumplimiento.
Clasifica la sensibilidad de las consultas en tiempo real. Enruta a inferencia local o endpoints externos aprobados según reglas definidas. El guardián de todo el tráfico de IA.
API unificada sin importar el modelo subyacente. Cambia de modelo foundation sin modificar aplicaciones. La clave del agnosticismo LLM.
Logging centralizado, pistas de auditoría y aplicación de políticas. Cada inferencia registrada con contexto completo.
Almacenamiento versionado de prompts con historial de auditoría. Configuración como código para el comportamiento de la IA.
Caché, cuantización, batching. Rendimiento sin comprometer la soberanía.
Cómo la IA soberana accede y aplica el conocimiento.
Generación aumentada por recuperación en tu infraestructura. Tus documentos, tus vectores, tus respuestas.
Capa de prevención de alucinaciones. Respuestas ancladas en fuentes verificadas con citación.
Generación y almacenamiento local de embeddings. Búsqueda semántica sin egreso de datos.
Relaciones estructuradas más allá de la similitud vectorial. Resolución de entidades, cadenas de inferencia, conexiones explicables.
Persistencia del contexto entre conversaciones. Continuidad sin enviar historial a APIs externas.
Cómo los usuarios interactúan con los sistemas de IA soberana.
Fundamento de interacción basada en texto. Interfaces de chat, procesamiento de comandos, gestión de diálogo.
Reconocimiento de voz, síntesis y conversación — on-premise. Interacción de voz en tiempo real sin ASR/TTS en cloud.
Sistemas de avatar, presencia de video, interfaces multimodales para aplicaciones de alto engagement.
Experiencia unificada a través de texto, voz y modalidades visuales. Comportamiento de IA consistente sin importar la interfaz.
Extracción de inteligencia a escala empresarial.
Extracción completa de documentos no estructurados. OCR, análisis de layout, parsing semántico.
ETL, limpieza, transformación. Movimiento de datos que respeta fronteras de soberanía.
Crea datos de entrenamiento estadísticamente similares sin exponer originales. Privacidad por diseño.
Etiquetado automatizado, categorización, organización de contenido.
Cumplimiento regulatorio integrado en la arquitectura.
Reglas de cumplimiento codificadas — HIPAA, RGPD, LGPD, requisitos específicos del sector. Aplicación por arquitectura.
Detección y manejo automático de PII. Anonimización donde es necesario, sin comprometer la utilidad.
Razonamiento legible por humanos para decisiones de IA. Responde "por qué" para cada "qué".
Protección contra inyección de prompts, extracción de datos, manipulación de modelos.
Orquestando sistemas de IA complejos.
Coordina múltiples agentes IA en tareas complejas. Divide trabajo, sintetiza resultados, gestiona estado.
Inserta aprobación humana en puntos definidos. Maneja escalaciones, excepciones, decisiones de alto riesgo.
Métricas de uso, costos, rendimiento, patrones de usuario. Visibilidad de la operación del sistema.
La Stack de Referencia define qué capacidades se requieren, no qué productos usar. Las implementaciones deben:
Los programas de certificación cubren la Stack de Referencia progresivamente: