Especialistas

Especialistas
Requisitos mínimos que debe cumplir el trabajo final
Debe ser de elaboración individual.
Debe integrar metodologías y conocimientos adquiridos en diferentes materias del primer año.
Se debe elaborar y presentar un informe que contenga, cómo mínimo: presentación del problema a resolver, presentación sintética de la solución propuesta, descripción del conjunto de datos utilizado, resultado de las pruebas y variantes realizadas que justifiquen la elección del modelo utilizado, descripción general de las tareas realizadas y problemas encontrados y; exposición detallada de la solución propuesta.
El documento a entregar debe cumplir con los requisitos normales de un “informe profesional” y debe incluir además un resumen ejecutivo, ideas para futuros desarrollos, bibliografía y referencias. Se pueden utilizar anexos para incorporar información complementaria detallada.
Evaluación del Trabajo
La evaluación la realizará un docente de la Maestría y podrá ser confirmada por un segundo docente.
Se podrán pedir pruebas de integridad y autoría, es decir, se le podrá exigir al autor la presentación de los componentes (software, datos, logs, etc.) que acrediten el informe presentado.
La evaluación incluirá la compleción de las pautas descritas precedentemente, la corrección del informe, su originalidad y la correcta aplicación de las prácticas enseñadas en durante el primer año de la Maestría.
A continuación se muestran los textos completos de algunos trabajos seleccionados a través de los años:
El presente trabajo se propone desarrollar un clasificador eficiente para detectar las 2 patologías del ojo humano antes presentadas, glaucoma y cataratas, a través de la utilización de Redes Neuronales Convolucionales. Cabe destacar que estas enfermedades no son excluyentes entre sí, por lo que se está frente a un problema multi-etiquetas, contraponiéndose estas a ojos considerados “sanos”, es decir a globos oculares que no presentan estas (ni otras) alteraciones de acuerdo al diagnóstico (etiquetas) hecho por especialistas humanos.
Ante el reciente brote del nuevo coronavirus SARS-CoV-2 existió faltante de tests RT-PCR para su detección. Se construyó y analizó un clasificador del resultado del test a partir de análisis clínicos de laboratorio de pacientes sospechosos de COVID-19 utilizando XGBoost. Los pacientes pertenecen al Hospital Israelita Albert Einstein (Brasil) y eran tanto ambulatorios como internados al momento del test. De las técnicas de modelado evaluadas, la que entregó mejores resultados (ROC-AUC = 68.7% ± 3.5%) consistió en un stacking de un árbol de decisión simple (RPart) ajustado sobre el subconjunto del 20% más importante de los atributos posteriormente ajustado con XGBoost. Se vió que las variables del hemograma resultaron entre las más importantes para llevar a cabo la clasificación por parte del modelo.
Este trabajo se enmarca dentro del llamado problema de la canasta del supermercado (market basket problem) para el descubrimiento de conjuntos de elementos inusualmente frecuentes, obteniendo resultados confiables tanto para conjuntos con frecuencias de apariciones altas o bajas. El foco es el análisis de informes de reacciones adversas a drogas para detectar combinaciones de drogas eventos adversos que puedan resultar sospechosos y determinar si hay algún tipo de asociación entre los distintos eventos adversos para algunas drogas sospechosas. Los informes son obtenidos de la base de datos del sistema de reportes de la Administración de Drogas y Alimentos de los Estados Unidos (FDA).
En el presente trabajo se analizan los datos de una red de telefonía móvil ubicada en la ciudad de Milán, Italia. El objetivo es encontrar patrones y resultados que ayuden a entender su uso para aplicar de manera efectiva, estrategias de optimización, planificación, mantenimiento preventivo, actualización, alertas tempranas y otras acciones que permitan brindar mejor servicio al usuario o bien desarrollar estrategias de actualización y crecimiento adecuadas. En particular el análisis se limita al uso del servicio de internet. Se obtuvieron mapas de calor del uso medio, como también resultados de clusterización mediante diferentes técnicas, que muestran el comportamiento del uso del servicio en cada distrito de la ciudad.
Este documento describe los métodos aplicados para la identificación de patrones de desplazamiento dentro de una ciudad, el análisis se concentra en los servicios o viajes con pasajeros realizados por un grupo de taxis dentro de la ciudad Porto en Portugal como una manera de entender cuáles son las áreas de mayor interés dentro de la ciudad y como se desplaza la población entre ellas, dependiendo del tipo de día y la hora. Se aplicó un análisis de clustering jerárquico para determinar cuáles eran las zonas geográficas desde las cuales se generaban la mayor cantidad de viajes, después algunas técnicas de visualización permitieron identificar con precisión dónde, cómo y a qué hora éstas zonas conocidas como hotspots se unen para formar hubs o áreas de alta movilidad, por último se modeló la relación entre los hubs de inicio y fin de los viajes usando un grafo bipartito con el fin de determinar patrones o hábitos de viajes. Las conclusiones apuntan a describir características de los patrones identificados y discutir posibles formas de determinar los motivos por los cuales estas zonas generan un alto interés.
En este trabajo se hace un análisis del comportamiento de la Inversión Extranjera Directa entre los años 2003 y 2012, para todos los países. Se analizan las características más descriptivas que hacen a la estructura internacional de flujos de IED partiendo de considerar a la misma como un grafo dirigido, en la que los países son los nodos y el flujo entre cada par de países se hace transformando la información original de la OECD. Posteriormente se usan distintas métricas para analizar el grafo y se presenta una serie de interpretaciones al respecto. Por último, se enriquece la información propia de IED con características generales de las economías de estos países para realizar un análisis no supervisado, encontrando así clusters que presentan características bien definidas, y que facilitan la interpretación de la estructura económica internacional.
El análisis del comercio internacional constituye una de las áreas de estudio más importantes de la investigación económica. Sin embargo, son escasas las métricas de análisis que logren captar la estructura mundial de la economía, manteniendo su complejidad. En este sentido, el análisis del comercio mundial considerado como una red compleja puede permitir un estudio pormenorizado del carácter mundial del comercio, sin detenerse necesariamente en un país en particular. El objetivo del presente trabajo es explorar las posibles formas de construcción de un grafo que caracterice al comercio internacional, y sus principales actores.
El presente trabajo tiene como objetivo reducir los niveles de ruido y disminuir el tiempo de promediado en la comparación remota de relojes atómicos, mediante el algoritmo de “Vista Común GPS” (GPS CV). Los datos se obtuvieron de dos relojes de cesio de INTI ubicados en un mismo laboratorio: se los comparó utilizando la técnica GPS CV y en forma directa a fin de validar las mediciones.
El propósito de este trabajo es analizar la relación existente entre las variables geográficas, medioambientales y físico-químicas del suelo con la biomasa microbiana contenida en el mismo e indagar acerca de la factibilidad del modelado predictivo en este sentido.
El objetivo de este trabajo es comprender cuáles son las variables más influyentes en el nivel de ozono una ciudad con altos niveles de contaminación, y si las condiciones fueron variando con el paso de los años. Además, se intenta estimar la probabilidad de que un día presente elevadas concentraciones de ozono dadas sus condiciones meteorológicas.
El presente trabajo tiene como objetivo principal aplicar técnicas de minería de datos sobre una base de datos que almacena información relacionada al uso de líneas móviles (dadas de alta en el mismo rango de periodo) y el estado de activación (baja / permanencia) luego de un tiempo determinado, de una operadora de telefonía móvil.
Entender los factores que determinan el nivel educativo de los individuos es de gran importancia para los gobiernos y sociedades. Este trabajo utiliza 14 variables socio-económicas de un estudio de 1980 realizado en Estados Unidos y que incluyó a 4.739 individuos. El objetivo es encontrar los factores que determinan cuántos años se dedicarán a educación secundaria y universitaria.
El presente práctico tiene por objetivo el agrupamiento y clasificación de Noticias de la página Web de un diario por medio de técnicas de Text Mining. La Minería de Textos se utiliza para poder extraer información a partir de datos poco estructurados o no estructurados como los documentos de textos. Para dicho análisis, los mismos se agrupan en un “corpus” el cual debe ser lo suficientemente amplio como para representar toda la variedad del lenguaje utilizado en cada una de las distintas secciones del diario. Para el procesamiento del corpus se utilizó el modelo de Bolsa de Palabras (BOW). Para esto se utilizó el paquete de R “tm” el cual provee funciones para el tratamiento de los textos.
Nomao es un motor de búsqueda de lugares, donde la gente utiliza diferentes medios de comunicación (celulares, tablets, computadoras portátiles, etc.) para guardar información de distintos destinos (restaurantes, hoteles, bares, etc.). Cada dispositivo tiene diferentes características y en ocasiones el mismo lugar es almacenado con datos distintos, similares o equivalentes (por ejemplo, “av.”, “avenida”, “Avenue”), como también datos erróneos o faltantes. El Desafío Nomao consiste en identificar si los datos pertenecientes a dos destinos geográficos se refieren al mismo lugar o no. El presente trabajo hace un análisis de distintos clasificadores, para terminar proponiendo un ensamble con una capacidad predictiva superior al 98%.