<?xml version="1.0" encoding="UTF-8"?><?xml-stylesheet type="text/xsl" href="static/style.xsl"?><OAI-PMH xmlns="http://www.openarchives.org/OAI/2.0/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.openarchives.org/OAI/2.0/ http://www.openarchives.org/OAI/2.0/OAI-PMH.xsd"><responseDate>2026-04-21T06:34:35Z</responseDate><request verb="GetRecord" identifier="oai:riubu.ubu.es:10259/10853" metadataPrefix="mets">https://riubu.ubu.es/oai/request</request><GetRecord><record><header><identifier>oai:riubu.ubu.es:10259/10853</identifier><datestamp>2025-09-15T07:12:27Z</datestamp><setSpec>com_10259_2699</setSpec><setSpec>col_10259_6582</setSpec></header><metadata><mets xmlns="http://www.loc.gov/METS/" xmlns:doc="http://www.lyncode.com/xoai" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xmlns:xlink="http://www.w3.org/1999/xlink" xsi:schemaLocation="http://www.loc.gov/METS/ http://www.loc.gov/standards/mets/mets.xsd" PROFILE="DSpace METS SIP Profile 1.0" TYPE="DSpace ITEM" ID="&#xa;&#x9;&#x9;&#x9;&#x9;DSpace_ITEM_10259-10853" OBJID="&#xa;&#x9;&#x9;&#x9;&#x9;hdl:10259/10853">
<metsHdr CREATEDATE="2026-04-21T08:34:35Z">
<agent TYPE="ORGANIZATION" ROLE="CUSTODIAN">
<name>Repositorio Institucional de la Universidad de Burgos</name>
</agent>
</metsHdr>
<dmdSec ID="DMD_10259_10853">
<mdWrap MDTYPE="MODS">
<xmlData xmlns:mods="http://www.loc.gov/mods/v3" xsi:schemaLocation="http://www.loc.gov/mods/v3 http://www.loc.gov/standards/mods/v3/mods-3-1.xsd">
<mods:mods xsi:schemaLocation="http://www.loc.gov/mods/v3 http://www.loc.gov/standards/mods/v3/mods-3-1.xsd">
<mods:name>
<mods:role>
<mods:roleTerm type="text">advisor</mods:roleTerm>
</mods:role>
<mods:namePart>Rodríguez Diez, Juan José</mods:namePart>
</mods:name>
<mods:name>
<mods:role>
<mods:roleTerm type="text">advisor</mods:roleTerm>
</mods:role>
<mods:namePart>Diez Pastor, José Francisco</mods:namePart>
</mods:name>
<mods:name>
<mods:role>
<mods:roleTerm type="text">author</mods:roleTerm>
</mods:role>
<mods:namePart>Olivares Gil, Alicia</mods:namePart>
</mods:name>
<mods:name>
<mods:role>
<mods:roleTerm type="text">other</mods:roleTerm>
</mods:role>
<mods:namePart>Universidad de Burgos. Departamento de Ingeniería Informática</mods:namePart>
</mods:name>
<mods:extension>
<mods:dateAccessioned encoding="iso8601">2025-09-10T11:12:55Z</mods:dateAccessioned>
</mods:extension>
<mods:extension>
<mods:dateAvailable encoding="iso8601">2025-09-10T11:12:55Z</mods:dateAvailable>
</mods:extension>
<mods:originInfo>
<mods:dateIssued encoding="iso8601">2025</mods:dateIssued>
</mods:originInfo>
<mods:identifier type="uri">https://hdl.handle.net/10259/10853</mods:identifier>
<mods:identifier type="doi">10.36443/10259/10853</mods:identifier>
<mods:abstract>El aprendizaje automático se ha hecho presente en casi todos los campos del conocimiento y prospera en presencia de datos ricamente etiquetados. Sin embargo, en muchos contextos biomédicos y de salud, las etiquetas suelen ser escasas, costosas o incompletas. Esta tesis doctoral investiga dos familias metodológicas que buscan aliviar esta limitación: el aprendizaje semisupervisado, que aprovecha la abundancia de datos no etiquetados, y el análisis de supervivencia, que modela objetivos censurados de «tiempo hasta el evento», comunes en estudios clínicos. A través de casos reales en ingeniería de proteínas y pronóstico de insuficiencia cardíaca crónica, el trabajo explora cómo estas técnicas pueden ofrecer modelos precisos e interpretables, al tiempo que reducen los costes de etiquetado. Para establecer un marco común para una audiencia&#xd;
multidisciplinar, esta tesis primero revisa conceptos teóricos y prácticos esenciales en aprendizaje automático, bioinformática y análisis de supervivencia. El resto de esta tesis comprende varios trabajos de investigación con objetivos y motivaciones particulares, pero con un tema subyacente común:&#xd;
• La adaptación de métodos de aprendizaje semisupervisado a problemas de regresión.&#xd;
• El estudio de la efectividad de técnicas de regresión semisupervisada en el campo de la ingeniería de proteínas.&#xd;
• La aplicación de métodos de análisis de supervivencia basados en estadística y aprendizaje automático para el pronóstico de insuficiencia cardíaca crónica.&#xd;
• La evaluación de la influencia de características en la hospitalización relacionada con&#xd;
insuficiencia cardíaca utilizando métodos muy novedosos.&#xd;
• La exploración de la intersección entre el aprendizaje semisupervisado y el análisis de&#xd;
supervivencia mediante el desarrollo de nuevas técnicas.&#xd;
Estas contribuciones tienen varias implicaciones. En primer lugar, se propone un nuevo método semisupervisado de tipo wrapper llamado Tri-Training Regressor, competitivo con métodos del estado del arte. En segundo lugar, demostramos que usar técnicas de aprendizaje semisupervisado puede mejorar significativamente la precisión predictiva en el campo de la ingeniería de proteínas, al mismo tiempo que mitiga el cuello de botella de los datos etiquetados limitados. En tercer lugar, evaluamos la precisión de modelos clásicos y recientes de análisis de supervivencia para el pronóstico de insuficiencia cardíaca crónica, con un énfasis particular en la importancia de la interpretabilidad de los modelos predictivos utilizados en pronósticos de salud. Finalmente, desarrollamos un nuevo método que transforma problemas de análisis de supervivencia en problemas de clasificación binaria semisupervisada, y demostramos su eficacia al tratar con conjuntos de datos anchos.</mods:abstract>
<mods:abstract>Machine learning has become present in almost every field of knowledge,&#xd;
and thrives in the presence of richly labelled data. However, in&#xd;
many biomedical and health settings labels are often scarce, expensive&#xd;
or incomplete. This doctoral thesis investigates two methodological&#xd;
families that aim to alleviate that constraint: semi-supervised learning,&#xd;
which exploits abundant unlabelled data, and survival analysis, which&#xd;
models censored time-to-event outcomes common in clinical studies.&#xd;
Through real-world cases in protein engineering and chronic heart&#xd;
failure prognosis, the work explores how these techniques can deliver&#xd;
accurate and interpretable models while lowering labelling costs.&#xd;
To establish a shared framework for a multidisciplinary readership,&#xd;
this thesis first reviews essential theoretical and practical concepts in&#xd;
machine learning, bioinformatics and survival analysis. The rest of&#xd;
this thesis comprises several research works with particular objectives&#xd;
and motivations, but with a common underlying theme:&#xd;
▶ The adaptation of semi-supervised learning methods to regression&#xd;
problems.&#xd;
▶ The study of the effectiveness of semi-supervised regression&#xd;
techniques in the protein engineering field.&#xd;
▶ The application of statistical and machine learning-based survival&#xd;
analysis methods for chronic heart failure prognosis.&#xd;
▶ The assessment of the influence of features on heart failurerelated&#xd;
hospitalisation using very novel methods.&#xd;
▶ The exploration of the intersection between semi-supervised&#xd;
learning and survival analysis through the development of new&#xd;
techniques.&#xd;
These contributions have several implications. First, we propose a&#xd;
novel semi-supervised wrapper method called Tri-Training Regressor,&#xd;
competitive with state-of-the-art methods. Second, we demonstrate&#xd;
that using semi-supervised learning techniques can meaningfully&#xd;
enhance predictive accuracy in the protein engineering field, while&#xd;
mitigating the bottleneck of limited labelled data. Third, we evaluate&#xd;
the precision of both classical and recent survival analysis models&#xd;
for chronic heart failure prognosis, with a particular emphasis on the&#xd;
importance of the interpretability of the predictive models used in&#xd;
health prognostics. Finally we develop a new method that transforms&#xd;
survival analysis problems into semi-supervised binary classification&#xd;
problems, and demonstrate its effectiveness in dealing with wide&#xd;
datasets.</mods:abstract>
<mods:language>
<mods:languageTerm authority="rfc3066">eng</mods:languageTerm>
</mods:language>
<mods:accessCondition type="useAndReproduction">Attribution-NonCommercial-NoDerivatives 4.0 Internacional</mods:accessCondition>
<mods:subject>
<mods:topic>Aprendizaje automático</mods:topic>
</mods:subject>
<mods:subject>
<mods:topic>Aprendizaje semisupervisado</mods:topic>
</mods:subject>
<mods:subject>
<mods:topic>Análisis de supervivencia</mods:topic>
</mods:subject>
<mods:subject>
<mods:topic>Bioinformática</mods:topic>
</mods:subject>
<mods:subject>
<mods:topic>Ingeniería de proteínas</mods:topic>
</mods:subject>
<mods:titleInfo>
<mods:title>Semi-supervised Learning and Survival Analysis in Biological and Health Sciences</mods:title>
</mods:titleInfo>
<mods:genre>info:eu-repo/semantics/doctoralThesis</mods:genre>
</mods:mods>
</xmlData>
</mdWrap>
</dmdSec>
<amdSec ID="TMD_10259_10853">
<rightsMD ID="RIG_10259_10853">
<mdWrap OTHERMDTYPE="DSpaceDepositLicense" MDTYPE="OTHER" MIMETYPE="text/plain">
<binData>RWwgYXV0b3IgY29tbyDDum5pY28gdGl0dWxhciBkZSBsb3MgZGVyZWNob3MgZGUgcHJvcGllZGFkIGludGVsZWN0dWFsIGRlIGxhIG9icmEsIG8gZGlzcG9uaWVuZG8gZGUgbG9zIGRlYmlkb3MgcGVybWlzb3MgZGUgbG9zIG90cm9zIHRpdHVsYXJlcywgc2kgbG9zIGh1YmllcmEsIHkgZW4gdmlydHVkIGRlIGxvcyBkZXJlY2hvcyBxdWUgbGUgY29uZmllcmUgbGEgbGVnaXNsYWNpw7NuIHZpZ2VudGUgc29icmUgcHJvcGllZGFkIGludGVsZWN0dWFsIHkgZGVyZWNob3MgZGUgYXV0b3IsIApBVVRPUklaQSBhIGxhIFVuaXZlcnNpZGFkIGRlIEJ1cmdvcyBhIGRpZnVuZGlyLCBkZSBtYW5lcmEgZ3JhdHVpdGEsIGVsIGNvbnRlbmlkbyBkZSBsb3MgYXJjaGl2b3MgZGlnaXRhbGVzIHF1ZSBjb3JyZXNwb25kZW4gYWwgZG9jdW1lbnRvIGRlc2NyaXRvIGFudGVyaW9ybWVudGUsIGNvbiBjYXLDoWN0ZXIgbm8gZXhjbHVzaXZvIHkgZGUgbWFuZXJhIHDDumJsaWNhIGVuIGFjY2VzbyBhYmllcnRvIGEgdHJhdsOpcyBkZSBJbnRlcm5ldCwgcGFyYSBsbyBxdWUgbGEgQmlibGlvdGVjYSBwcm9jZWRlcsOhIGEgYXJjaGl2YXJsb3MgZW4gZWwgUmVwb3NpdG9yaW8gSW5zdGl0dWNpb25hbC4gQXNpbWlzbW8gYXV0b3JpemEgYSBsYSBVbml2ZXJzaWRhZCBkZSBCdXJnb3MgYSByZWFsaXphciBsYXMgdHJhbnNmb3JtYWNpb25lcyBuZWNlc2FyaWFzIGRlIGZvcm1hdG8sIG5vIGRlIGNvbnRlbmlkbywgcGFyYSBnYXJhbnRpemFyIGxhIHByZXNlcnZhY2nDs24geSBlbCBhY2Nlc28gZW4gZWwgZnV0dXJvLgoKRWwgYXV0b3IgZGlzcG9uZSwgZW4gdG9kbyBjYXNvLCBkZWwgZGVyZWNobyBhIHJldm9jYXIgZXN0YSBhdXRvcml6YWNpw7NuLgoKTGEgY2VzacOzbiBkZSBkZXJlY2hvcyBkZSBlc3RhIG9icmEgc2UgZW5jdWVudHJhIHN1amV0YSBhIGxhIGxlZ2lzbGFjacOzbiB2aWdlbnRlIHNvYnJlIHByb3BpZWRhZCBpbnRlbGVjdHVhbCB5IGRlcmVjaG9zIGRlIGF1dG9yLiBTdSBkaWZ1c2nDs24gZW4gZWwgUmVwb3NpdG9yaW8gc2Vyw6EgYmFqbyBsYSBtb2RhbGlkYWQgZGUgbGljZW5jaWEgQ3JlYXRpdmUgQ29tbW9ucyBvIGVxdWl2YWxlbnRlOiByZWNvbm9jaW1pZW50byDigJMgdXNvIG5vIGNvbWVyY2lhbCDigJMgc2luIG9icmEgZGVyaXZhZGEsIHBvciBsYSBxdWUgc2UgcGVybWl0ZSBoYWNlciBjb3BpYSwgZGlzdHJpYnVpciB5IGNvbXVuaWNhciBww7pibGljYW1lbnRlIGxhIG9icmEgc2llbXByZSBxdWUgc2UgY2l0ZSBhbCBhdXRvciwgZWwgdXNvIHF1ZSBzZSBoYWdhIGRlIGVsbGEgc2VhIG5vIGNvbWVyY2lhbCB5IG5vIHNlIGNyZWVuIG9icmFzIGRlcml2YWRhcyBhIHBhcnRpciBkZSBsYSBvcmlnaW5hbC4K</binData>
</mdWrap>
</rightsMD>
</amdSec>
<amdSec ID="FO_10259_10853_5">
<techMD ID="TECH_O_10259_10853_5">
<mdWrap MDTYPE="PREMIS">
<xmlData xmlns:premis="http://www.loc.gov/standards/premis" xsi:schemaLocation="http://www.loc.gov/standards/premis http://www.loc.gov/standards/premis/PREMIS-v1-0.xsd">
<premis:premis>
<premis:object>
<premis:objectIdentifier>
<premis:objectIdentifierType>URL</premis:objectIdentifierType>
<premis:objectIdentifierValue>https://riubu.ubu.es/bitstream/10259/10853/5/Olivares_Gil_Alicia-Tesis.pdf</premis:objectIdentifierValue>
</premis:objectIdentifier>
<premis:objectCategory>File</premis:objectCategory>
<premis:objectCharacteristics>
<premis:fixity>
<premis:messageDigestAlgorithm>MD5</premis:messageDigestAlgorithm>
<premis:messageDigest>56039d1d5c02458f5da56193c3a0f309</premis:messageDigest>
</premis:fixity>
<premis:size>16864356</premis:size>
<premis:format>
<premis:formatDesignation>
<premis:formatName>application/pdf</premis:formatName>
</premis:formatDesignation>
</premis:format>
</premis:objectCharacteristics>
<premis:originalName>Olivares_Gil_Alicia-Tesis.pdf</premis:originalName>
</premis:object>
</premis:premis>
</xmlData>
</mdWrap>
</techMD>
</amdSec>
<fileSec>
<fileGrp USE="ORIGINAL">
<file ID="BITSTREAM_ORIGINAL_10259_10853_5" MIMETYPE="application/pdf" SEQ="5" SIZE="16864356" CHECKSUM="56039d1d5c02458f5da56193c3a0f309" CHECKSUMTYPE="MD5" ADMID="FO_10259_10853_5" GROUPID="GROUP_BITSTREAM_10259_10853_5">
<FLocat xlink:type="simple" LOCTYPE="URL" xlink:href="https://riubu.ubu.es/bitstream/10259/10853/5/Olivares_Gil_Alicia-Tesis.pdf"/>
</file>
</fileGrp>
</fileSec>
<structMap TYPE="LOGICAL" LABEL="DSpace Object">
<div TYPE="DSpace Object Contents" ADMID="DMD_10259_10853">
<div TYPE="DSpace BITSTREAM">
<fptr FILEID="BITSTREAM_ORIGINAL_10259_10853_5"/>
</div>
</div>
</structMap>
</mets></metadata></record></GetRecord></OAI-PMH>