Titulo + fecha de publicación
Este proyecto busca construir un prototipo de consumo o visualización de un modelo de clasificación de las solicitudes de restablecimiento y reportes de amenaza y vulneración de derechos (en adelante, peticiones) que recibe el ICBF a través de sus distintos canales, que permita definir posteriormente el nivel de prioridad que deberían tener las verificaciones y constataciones en campo. Se basa en el entrenamiento de modelos usando variables numéricas, categóricas y features obtenidas a través del procesamiento de lenguaje natural (NLP) de las descripciones de las peticiones. La información que se toma en cuenta para el entrenamiento de los modelos proviene de características de los departamentos, de información descriptiva de los peticionarios y de los afectados, así como de algunas características relevantes de la completitud de la petición y de la descripción del hecho.
Para lograr dicho resultado el proyecto involucra 5 etapas: gestión de los datos, Procesamiento de Lenguaje Natural (PLN, o NLP por sus siglas en inglés) de la descripción que contiene cada solicitud, entrenamiento de modelos de Machine Learning, evaluación de los distintos modelos entrenados y predicción/clasificación de nuevas solicitudes que ingresan diariamente al ICBF.