<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="static/style.xsl"?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"><responseDate>2026-04-23T03:26:37Z</responseDate><request verb="GetRecord" identifier="oai:riubu.ubu.es:10259/10309" metadataPrefix="dim">https://riubu.ubu.es/oai/request</request><GetRecord><record><header><identifier>oai:riubu.ubu.es:10259/10309</identifier><datestamp>2025-07-01T08:20:36Z</datestamp><setSpec>com_10259_2699</setSpec><setSpec>col_10259_6582</setSpec></header><metadata><dim:dim xmlns:dim="http://www.dspace.org/xmlns/dspace/dim" xmlns:doc="http://www.lyncode.com/xoai" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.dspace.org/xmlns/dspace/dim http://www.dspace.org/schema/dim.xsd">
<dim:field mdschema="dc" element="contributor" qualifier="advisor" authority="352" confidence="600" orcid_id="0000-0001-8808-412X">Maudes Raedo, Jesús M.</dim:field>
<dim:field mdschema="dc" element="contributor" qualifier="advisor" authority="39" confidence="600" orcid_id="0000-0001-6965-0237">Arnaiz González, Álvar</dim:field>
<dim:field mdschema="dc" element="contributor" qualifier="author" authority="751" confidence="600" orcid_id="0000-0002-0330-1605">Ramos Pérez, Ismael</dim:field>
<dim:field mdschema="dc" element="contributor" qualifier="other" authority="8998b0e8-b64c-4e7f-8148-546f0f7b6c27" confidence="600" orcid_id="">Universidad de Burgos. Departamento de Ingeniería Informática</dim:field>
<dim:field mdschema="dc" element="date" qualifier="accessioned">2025-03-11T09:36:04Z</dim:field>
<dim:field mdschema="dc" element="date" qualifier="available">2025-03-11T09:36:04Z</dim:field>
<dim:field mdschema="dc" element="date" qualifier="issued">2024</dim:field>
<dim:field mdschema="dc" element="date" qualifier="submitted">2024-09-11</dim:field>
<dim:field mdschema="dc" element="identifier" qualifier="uri">http://hdl.handle.net/10259/10309</dim:field>
<dim:field mdschema="dc" element="identifier" qualifier="doi">10.36443/10259/10309</dim:field>
<dim:field mdschema="dc" element="description" qualifier="abstract" lang="es">En el aprendizaje automático, especialmente en biología y genómica, los conjuntos de datos son llamados anchos, Los datos anchos contienen una gran cantidad de características pero pocas instancias. Esta alta dimensionalidad dificulta el aprendizaje de los modelos de aprendizaje, causando sobreajuste y sesgos. Para abordar estos problemas, las técnicas de preprocesamiento de datos son fundamentales. Esta tesis explora diversas estrategias de preprocesamiento, como la selección y reducción de características, y el remuestreo para equilibrar las clases. Además de técnicas semi-supervisadas. A través de tres artículos, se comparan diferentes estrategias de preprocesado y, en el campo de la selección de características en aprendizaje semi-supervisado y se propone una nueva taxonomía de algoritmos. Los resultados obtenidos demuestran la importancia de combinar adecuadamente las técnicas de preprocesamiento para obtener modelos más robustos y generales. Esta investigación proporciona una guía práctica para abordar los desafíos planteados por los datos anchos en el aprendizaje automático.</dim:field>
<dim:field mdschema="dc" element="description" qualifier="sponsorship" lang="en">The research carried out for the development of this doctoral thesis has been partially funded by the Junta de Castilla y León under project BU055P20 (JCyL/FEDER, UE), by the Spanish Ministry of Science and Innovation (projects PID2020-119894GB-I00 and TED 2021129485B-C43) and by “la Caixa“ Foundation, under agreement LCF/PR/PR18/51130007. The author has been recipient of the predoctoral grant by the Universidad de Burgos.</dim:field>
<dim:field mdschema="dc" element="description" qualifier="degree" lang="es">Doctorado en Ingeniería y Tecnologías Industrial, Informática y Civil</dim:field>
<dim:field mdschema="dc" element="format" qualifier="mimetype">application/pdf</dim:field>
<dim:field mdschema="dc" element="language" qualifier="iso" lang="es">eng</dim:field>
<dim:field mdschema="dc" element="rights" lang="*">Attribution-NonCommercial-NoDerivatives 4.0 Internacional</dim:field>
<dim:field mdschema="dc" element="rights" qualifier="uri" lang="*">http://creativecommons.org/licenses/by-nc-nd/4.0/</dim:field>
<dim:field mdschema="dc" element="rights" qualifier="accessRights" lang="es">info:eu-repo/semantics/openAccess</dim:field>
<dim:field mdschema="dc" element="subject" lang="en">Wide data</dim:field>
<dim:field mdschema="dc" element="subject" lang="en">Feature selection</dim:field>
<dim:field mdschema="dc" element="subject" lang="en">Feature reduction</dim:field>
<dim:field mdschema="dc" element="subject" lang="en">Semi-supervised learning</dim:field>
<dim:field mdschema="dc" element="subject" lang="en">Machine learning</dim:field>
<dim:field mdschema="dc" element="subject" lang="es">Datos anchos</dim:field>
<dim:field mdschema="dc" element="subject" lang="es">Selección de características</dim:field>
<dim:field mdschema="dc" element="subject" lang="es">Reducción de características</dim:field>
<dim:field mdschema="dc" element="subject" lang="es">Aprendizaje semisupervisado</dim:field>
<dim:field mdschema="dc" element="subject" lang="es">Aprendizaje automático</dim:field>
<dim:field mdschema="dc" element="subject" qualifier="other" lang="es">Informática</dim:field>
<dim:field mdschema="dc" element="subject" qualifier="other" lang="es">Inteligencia artificial</dim:field>
<dim:field mdschema="dc" element="subject" qualifier="other" lang="en">Computer science</dim:field>
<dim:field mdschema="dc" element="subject" qualifier="other" lang="en">Artificial intelligence</dim:field>
<dim:field mdschema="dc" element="subject" qualifier="unesco">1203.04 Inteligencia Artificial</dim:field>
<dim:field mdschema="dc" element="title" lang="es">Técnicas de preprocesamiento en datos anchos</dim:field>
<dim:field mdschema="dc" element="title" qualifier="alternative" lang="en">Preprocessing techniques for wide data</dim:field>
<dim:field mdschema="dc" element="type" lang="es">info:eu-repo/semantics/doctoralThesis</dim:field>
<dim:field mdschema="dc" element="type" qualifier="hasVersion" lang="es">info:eu-repo/semantics/acceptedVersion</dim:field>
<dim:field mdschema="dc" element="relation" qualifier="projectID" lang="es">info:eu-repo/grantAgreement/Junta de Castilla y León//BU055P20//Métodos y Aplicaciones Industriales del Aprendizaje Semisupervisado/</dim:field>
<dim:field mdschema="dc" element="relation" qualifier="projectID" lang="es">info:eu-repo/grantAgreement/AEI/Plan Estatal de Investigación Científica y Técnica y de Innovación 2017-2020/PID2020-119894GB-I00/ES/APRENDIZAJE AUTOMATICO CON DATOS ESCASAMENTE ETIQUETADOS PARA LA INDUSTRIA 4.0/</dim:field>
<dim:field mdschema="dc" element="relation" qualifier="projectID" lang="es">info:eu-repo/grantAgreement/AEI/Plan Estatal de Investigación Científica, Técnica y de Innovación 2021-2023/TED2021-129485B-C43/ES/Sistemas dinámicos inteligentes centrados en el usuario para la Prevención de Riesgos Laborales/</dim:field>
<dim:field mdschema="dc" element="relation" qualifier="projectID" lang="es">info:eu-repo/grantAgreement/Fundación Bancaria Caixa d'Estalvis i Pensions de Barcelona//LCF%2FPR%2FPR18%2F51130007//Fluoración Directa de Nitrocompuestos y Sales de Heteroaril Fosfonio: Síntesis de Fluorocompuestos/FluNitroPhos/</dim:field>
</dim:dim></metadata></record></GetRecord></OAI-PMH>