Por favor, use este identificador para citar o enlazar este ítem: http://hdl.handle.net/10259/10309
Título
Técnicas de preprocesamiento en datos anchos
Otro título
Preprocessing techniques for wide data
Autor
Fecha de publicación
2024
Fecha de lectura/defensa
2024-09-11
DOI
10.36443/10259/10309
Résumé
En el aprendizaje automático, especialmente en biología y genómica, los conjuntos de datos son llamados anchos, Los datos anchos contienen una gran cantidad de características pero pocas instancias. Esta alta dimensionalidad dificulta el aprendizaje de los modelos de aprendizaje, causando sobreajuste y sesgos. Para abordar estos problemas, las técnicas de preprocesamiento de datos son fundamentales. Esta tesis explora diversas estrategias de preprocesamiento, como la selección y reducción de características, y el remuestreo para equilibrar las clases. Además de técnicas semi-supervisadas. A través de tres artículos, se comparan diferentes estrategias de preprocesado y, en el campo de la selección de características en aprendizaje semi-supervisado y se propone una nueva taxonomía de algoritmos. Los resultados obtenidos demuestran la importancia de combinar adecuadamente las técnicas de preprocesamiento para obtener modelos más robustos y generales. Esta investigación proporciona una guía práctica para abordar los desafíos planteados por los datos anchos en el aprendizaje automático.
Palabras clave
Wide data
Feature selection
Feature reduction
Semi-supervised learning
Machine learning
Datos anchos
Selección de características
Reducción de características
Aprendizaje semisupervisado
Aprendizaje automático
Materia
Informática
Computer science
Inteligencia artificial
Artificial intelligence
Aparece en las colecciones
Documento(s) sujeto(s) a una licencia Creative Commons Attribution-NonCommercial-NoDerivatives 4.0 Internacional