Data Sentinel : Priorización de Activos de Datos
Califique este contenido
Sin votos (todavía)

Titulo + fecha de publicación

Data sentinel : Priorización de Activos de Datos
Fecha de publicación: 27/11/2025

El proyecto Data Sentinel se presenta como una plataforma analítica crucial para el reto Agente Datos Abiertos de MinTIC en Datos al Ecosistema 2025, abordando la necesidad crítica de optimizar el uso de activos de datos mediante la automatización de la auditoría de calidad y riesgo, lo cual impacta directamente la toma de decisiones institucionales y la planificación sectorial. Este sistema resuelve la problemática de la ineficiencia en la gestión de metadatos (evitando el uso de datos de baja calidad, el riesgo regulatorio y la ineficiencia de recursos) al aplicar una arquitectura híbrida: un motor de riesgo heurístico que calcula un Score de Prioridad de Riesgo basado en reglas de negocio; algoritmos de Machine Learning de scikit-learn (K-Means e Isolation Forest) para segmentar y detectar anomalías; y un Agente RAG potenciado por el cliente google-genai (Gemini 2.5 Flash) que interpreta los hallazgos a través de una base de conocimiento pre-procesada para garantizar diagnósticos complejos de forma eficiente. La plataforma permite a las instituciones priorizar la intervención al identificar activos de alto riesgo, segmentar estratégicamente por calidad y facilitar la comprensión de las métricas complejas, contribuyendo así a asegurar que los datos utilizados en la planificación sectorial sean confiables y de alto valor.

Departamento
VALLE DEL CAUCA
Municipio
CALI
Autor
Academia
Nombre del autor
Juan Pablo Guzman Molano
Tipo de producto
Detalles Big Data
Otros Datos Usados
Describa el impacto que genera el producto y/o servicio asociado a este uso de datos.
El producto Data Sentinel genera un impacto transformador al convertir inventarios pasivos de metadatos en un sistema de inteligencia accionable, lo cual es esencial para la toma de decisiones institucionales y la planificación sectorial, garantizando que la evidencia utilizada sea de alta calidad. El sistema permite a la alta gerencia focalizar recursos limitados en los activos con mayor riesgo o valor, ya que el motor de riesgo heurístico y los modelos de Machine Learning (K-Means e Isolation Forest) automatizan la auditoría, eliminando la necesidad de procesos manuales lentos. Esto se traduce en un ahorro operacional significativo y una optimización de los pipelines de datos al segmentar los activos para una intervención rápida. Además, el agente RAG facilita la comprensión de métricas complejas, traduciendo diagnósticos técnicos en narrativa estratégica para usuarios no especializados. Finalmente, Data Sentinel fortalece la gobernanza al reducir la exposición a riesgos regulatorios y de seguridad, ya que penaliza la falta de trazabilidad y la obsolescencia, impulsando una cultura de responsabilidad y calidad de datos dentro de la organización.
Licencia
Datos Abiertos
https://www.datos.gov.co/Ciencia-Tecnolog-a-e-Innovaci-n/Asset-Inventory-Public/uzcf-b9dh/about_data
Seleccione las categorías de impacto asociadas a su producto y/o servicio
Otros
Descripción de las categorias seleccionadas
La Gobernanza de Datos y la Innovación Tecnológica. Data Sentinel genera un impacto profundo al institucionalizar un marco de calidad y riesgo. Obliga a la trazabilidad (asignación de dueño) y reduce el riesgo regulatorio al identificar activos obsoletos o en incumplimiento. Tecnológicamente, demuestra un alto impacto innovador al integrar técnicas avanzadas como el Machine Learning (clustering y detección de anomalías) y la IA Generativa (RAG con Google Gemini) para la auditoría y el diagnóstico, sentando las bases para futuros sistemas de gestión de activos de datos impulsados por IA.