minciencias
Califique este contenido
Average: 5 (3 votes)

Titulo + fecha de publicación

Observatorio de Equidad y Género en la Formación de Alto Nivel
Fecha de publicación: 28/11/2025

Este proyecto se centra en el análisis profundo de los datos para identificar y cuantificar las barreras de acceso a la formación de alto nivel, con un enfoque en la equidad de género y la inclusión de poblaciones vulnerables o regiones históricamente marginadas.

 

Análisis de Equidad, Género y Enfoque Territorial/Social.

Proporciona una herramienta de rendición de cuentas y monitoreo de políticas públicas con perspectiva de género y regional, un tema de alta relevancia para el gobierno.

 

Objetivo: Crear un observatorio de datos abiertos que cuantifique y visualice las disparidades en el acceso y éxito de las becas de formación de alto nivel, con especial énfasis en la brecha de género y la participación de grupos étnicos y regiones periféricas.

Departamento
BOGOTÁ, D.C.
Municipio
BOGOTÁ, D.C.
Autor
Entidad pública
Tipo de producto
Detalles Big Data
Otras fuentes de información
https://www.datos.gov.co/Ciencia-Tecnolog-a-e-Innovaci-n/Aspirantes-a-becas-de-formaci-n-de-alto-nivel-para/g2x2-8qmr/about_data
Resultados de aprendizaje en ética de los datos
Los resultados de aprendizaje en ética de los datos evidencian que el proyecto consolidó competencias en manejo responsable de información, calidad del dato y uso transparente de datos abiertos. El equipo fortaleció su comprensión sobre principios de privacidad, minimización y proporcionalidad en el tratamiento, incorporando prácticas de anonimización y agregación de información para prevenir sesgos de interpretación en los indicadores del dashboard. Se interiorizaron aprendizajes en gobierno del dato, estandarización de categorías (como nombres de región), documentación de supuestos analíticos y trazabilidad de transformaciones aplicadas en los registros, lo que promueve integridad y reproducibilidad. Además, se desarrolló conciencia sobre el impacto social del dato como activo institucional, la importancia del consentimiento informado en contextos de capital humano financiado, la prevención de brechas de equidad desde el diseño de análisis (género, región, destino), y el valor de publicar información verificable bajo marcos de transparencia. En conjunto, estos aprendizajes demuestran un uso ético del ciclo de datos como habilitador de decisiones públicas, alineado a buenas prácticas de project management y analítica confiable con pandas y Streamlit, fomentando un ecosistema de datos abiertos responsable.
Sesgos identificados
Sesgo de acceso territorial: desigualdad estructural en oportunidades de formación financiada para regiones con menor desarrollo científico o menor capacidad de postulación, que puede reflejarse como “baja participación” en los indicadores aunque el origen real sea barreras socio-económicas.

Sesgo por concentración geográfica de alianzas: predominio de destinos académicos frecuentes (por convenios institucionales o redes académicas históricas) como Estados Unidos o Europa, lo que reduce diversidad de movilidad y refuerza patrones de concentración.

Sesgo de autoselección: al usar sólo registros de financiados (que ya superaron filtros de una convocatoria), se invisibiliza la población que no accedió, dificultando medir inequidad en fases anteriores del proceso.

Sesgo cultural de género: patrones sociales que orientan a que ciertos campos o regiones tengan mayor participación de un género, lo que puede ser interpretado como equilibrio sin analizar las causas raíz.
Metodología
La metodología usada para crear el dashboard y obtener información relevante siguió un enfoque integrado de project management, ingeniería de datos y analítica descriptiva, estructurado en cinco fases: (1) planeación metodológica, adoptando las buenas prácticas del Project Management Institute y su marco PMBOK para definir alcance, interesados, hitos e indicadores; (2) adquisición y perfilamiento del dato, cargando los registros de personas financiadas desde archivos base (incluido el dataset de financiados contenido en el insumo Excel), asumiendo que la columna País de Estudios representa el destino académico; (3) preparación y gobierno del dato, aplicando transformaciones en pandas para limpieza, normalización, corrección de nombres de región y creación de nuevas variables derivadas, asegurando consistencia y evaluando valores faltantes; (4) análisis descriptivo y cálculo de indicadores, usando agregaciones, conteos y series temporales para comparativos por género, año, región y país destino con el apoyo visual de matplotlib y altair, generando métricas de brecha y distribución; y (5) desarrollo y despliegue del dashboard, implementando la visualización interactiva en Streamlit para exponer gráficos y tablas con diseño responsivo, asegurando disponibilidad 24/7 mediante hosting público, permitiendo la interpretación de patrones de equidad, cobertura territorial y movilidad académica institucional, con énfasis en transparencia y trazabilidad del proceso.
Resultados de aprendizaje en ética de los algoritmos
Los resultados de aprendizaje en ética de los algoritmos muestran que el desarrollo del dashboard fortaleció la comprensión y aplicación de principios de diseño, evaluación e interpretación responsable de modelos y reglas automatizadas. Se aprendió a verificar supuestos antes de usar funciones de indexación en pandas para evitar exclusión de categorías, a estandarizar y depurar variables sensibles como sexo y región antes de entrenar o aplicar reglas algorítmicas, y a evaluar si los cálculos y agregaciones introducen impactos diferenciados sobre grupos subrepresentados. El equipo interiorizó la importancia de medir equidad desde el diseño del algoritmo (comparativos por año, región y destino), de detectar sesgos de datos que inducen decisiones automatizadas no balanceadas, y de documentar trazabilidad de transformaciones para garantizar auditabilidad y reproducibilidad. Se consolidó conciencia sobre el impacto social de los algoritmos como habilitadores de decisiones públicas en el Ministerio de Ciencia, Tecnología e Innovación, promoviendo algoritmos explicables, no discriminatorios, transparentes y alineados a enfoques de gestión del proyecto, demostrando que el ciclo de analítica puede desarrollarse bajo un enfoque ético, confiable y socialmente responsable.
Otros Datos Usados
Título
dataframe1.xlsx
Describa el impacto que genera el producto y/o servicio asociado a este uso de datos.
El producto asociado al uso de datos en el dashboard genera impacto en la transparencia de la financiación del talento científico, permitiendo al Ministerio de Ciencia, Tecnología e Innovación contar con una vista pública, trazable y 24/7 que mide equidad de género, cobertura territorial y patrones de movilidad académica internacional, fortaleciendo decisiones estratégicas alineadas con datos abiertos. El servicio impulsa cultura de ética de datos, reduce errores de interpretación causados por categorías inconsistentes, visibiliza brechas regionales y de género para diseñar acciones de inclusión, apoya la rendición de cuentas ante el ecosistema académico global, y robustece el gobierno interno del dato mediante estandarización y trazabilidad, contribuyendo al monitoreo de políticas públicas y a la planeación institucional con información auditables y de acceso libre, que convierte el dato en un habilitador de valor social, científico y organizacional.
Seleccione las categorías de impacto asociadas a su producto y/o servicio
Sociales
Económicas
Otros
Descripción de las categorias seleccionadas
Impacto Social: El dashboard genera impacto en la sociedad al democratizar información sobre la financiación de talento científico, permitiendo que comunidades, regiones y grupos de interés visualicen de forma clara cómo se distribuyen las oportunidades, promoviendo equidad, inclusión territorial y visibilidad de género. Fortalece la confianza pública de los datos abiertos de Minciencias, impulsa conciencia ética en el uso del dato como habilitador social, y sirve como herramienta para organizaciones, ciudadanos y academia, fomentando participación más informada, reducción de brechas de acceso a información y empoderamiento de las regiones subrepresentadas.
Impacto Económico: El proyecto impacta la economía al ofrecer una línea base para optimizar inversión pública en formación de alto nivel, identificando patrones de concentración o brechas que, al corregirse, pueden mejorar la eficiencia del uso de recursos del Estado. Permite priorizar alianzas estratégicas internacionales, evaluar pertinencia de destinos de formación, y apoyar decisiones que aseguren mayor retorno de la inversión en becarios financiados. Asimismo, habilita oportunidades de reuso de datos para el ecosistema emprendedor y analítico, potenciando valor económico derivado de decisiones basadas en evidencia.
Impacto en Ciencia, Educación e Innovación: El dashboard fortalece la ciencia al permitir la lectura de patrones de movilidad del talento científico por destino y cohortes, lo que puede orientar nuevas colaboraciones, acuerdos y áreas de interés investigativo del Ministerio. En educación, contribuye como insumo para medir equidad territorial en acceso a formación científica avanzada, apoyar ajustes del PETI y PESI con enfoque de igualdad, y fomentar habilidades éticas del uso del dato en proyectos del sector público. En innovación, impulsa la analítica de datos como habilitador de nuevas soluciones, promueve el diseño de algoritmos no discriminatorios, y se convierte en modelo replicable de tableros explicables, auditables y socialmente responsables para fortalecer el ecosistema de innovación pública.