RT info:eu-repo/semantics/doctoralThesis T1 Técnicas de preprocesamiento en datos anchos T2 Preprocessing techniques for wide data A1 Ramos Pérez, Ismael A2 Universidad de Burgos. Departamento de Ingeniería Informática K1 Wide data K1 Feature selection K1 Feature reduction K1 Semi-supervised learning K1 Machine learning K1 Datos anchos K1 Selección de características K1 Reducción de características K1 Aprendizaje semisupervisado K1 Aprendizaje automático K1 Informática K1 Computer science K1 Inteligencia artificial K1 Artificial intelligence K1 1203.04 Inteligencia Artificial AB En el aprendizaje automático, especialmente en biología y genómica, los conjuntos de datos son llamados anchos, Los datos anchos contienen una gran cantidad de características pero pocas instancias. Esta alta dimensionalidad dificulta el aprendizaje de los modelos de aprendizaje, causando sobreajuste y sesgos. Para abordar estos problemas, las técnicas de preprocesamiento de datos son fundamentales. Esta tesis explora diversas estrategias de preprocesamiento, como la selección y reducción de características, y el remuestreo para equilibrar las clases. Además de técnicas semi-supervisadas. A través de tres artículos, se comparan diferentes estrategias de preprocesado y, en el campo de la selección de características en aprendizaje semi-supervisado y se propone una nueva taxonomía de algoritmos. Los resultados obtenidos demuestran la importancia de combinar adecuadamente las técnicas de preprocesamiento para obtener modelos más robustos y generales. Esta investigación proporciona una guía práctica para abordar los desafíos planteados por los datos anchos en el aprendizaje automático. YR 2024 FD 2024 LK http://hdl.handle.net/10259/10309 UL http://hdl.handle.net/10259/10309 LA eng NO The research carried out for the development of this doctoral thesis has been partially funded by the Junta de Castilla y León under project BU055P20 (JCyL/FEDER, UE), by the Spanish Ministry of Science and Innovation (projects PID2020-119894GB-I00 and TED 2021129485B-C43) and by “la Caixa“ Foundation, under agreement LCF/PR/PR18/51130007. The author has been recipient of the predoctoral grant by the Universidad de Burgos. DS Repositorio Institucional de la Universidad de Burgos RD 14-mar-2025