<?xml version="1.0" encoding="UTF-8"?>
<feed xmlns="http://www.w3.org/2005/Atom" xmlns:dc="http://purl.org/dc/elements/1.1/">
<title>Tesis Ingeniería Informática</title>
<link href="https://hdl.handle.net/10259/6582" rel="alternate"/>
<subtitle/>
<id>https://hdl.handle.net/10259/6582</id>
<updated>2026-04-18T21:53:39Z</updated>
<dc:date>2026-04-18T21:53:39Z</dc:date>
<entry>
<title>Semi-supervised Learning and Survival Analysis in Biological and Health Sciences</title>
<link href="https://hdl.handle.net/10259/10853" rel="alternate"/>
<author>
<name>Olivares Gil, Alicia</name>
</author>
<id>https://hdl.handle.net/10259/10853</id>
<updated>2025-09-15T07:12:27Z</updated>
<published>2025-01-01T00:00:00Z</published>
<summary type="text">Semi-supervised Learning and Survival Analysis in Biological and Health Sciences
Olivares Gil, Alicia
El aprendizaje automático se ha hecho presente en casi todos los campos del conocimiento y prospera en presencia de datos ricamente etiquetados. Sin embargo, en muchos contextos biomédicos y de salud, las etiquetas suelen ser escasas, costosas o incompletas. Esta tesis doctoral investiga dos familias metodológicas que buscan aliviar esta limitación: el aprendizaje semisupervisado, que aprovecha la abundancia de datos no etiquetados, y el análisis de supervivencia, que modela objetivos censurados de «tiempo hasta el evento», comunes en estudios clínicos. A través de casos reales en ingeniería de proteínas y pronóstico de insuficiencia cardíaca crónica, el trabajo explora cómo estas técnicas pueden ofrecer modelos precisos e interpretables, al tiempo que reducen los costes de etiquetado. Para establecer un marco común para una audiencia&#13;
multidisciplinar, esta tesis primero revisa conceptos teóricos y prácticos esenciales en aprendizaje automático, bioinformática y análisis de supervivencia. El resto de esta tesis comprende varios trabajos de investigación con objetivos y motivaciones particulares, pero con un tema subyacente común:&#13;
• La adaptación de métodos de aprendizaje semisupervisado a problemas de regresión.&#13;
• El estudio de la efectividad de técnicas de regresión semisupervisada en el campo de la ingeniería de proteínas.&#13;
• La aplicación de métodos de análisis de supervivencia basados en estadística y aprendizaje automático para el pronóstico de insuficiencia cardíaca crónica.&#13;
• La evaluación de la influencia de características en la hospitalización relacionada con&#13;
insuficiencia cardíaca utilizando métodos muy novedosos.&#13;
• La exploración de la intersección entre el aprendizaje semisupervisado y el análisis de&#13;
supervivencia mediante el desarrollo de nuevas técnicas.&#13;
Estas contribuciones tienen varias implicaciones. En primer lugar, se propone un nuevo método semisupervisado de tipo wrapper llamado Tri-Training Regressor, competitivo con métodos del estado del arte. En segundo lugar, demostramos que usar técnicas de aprendizaje semisupervisado puede mejorar significativamente la precisión predictiva en el campo de la ingeniería de proteínas, al mismo tiempo que mitiga el cuello de botella de los datos etiquetados limitados. En tercer lugar, evaluamos la precisión de modelos clásicos y recientes de análisis de supervivencia para el pronóstico de insuficiencia cardíaca crónica, con un énfasis particular en la importancia de la interpretabilidad de los modelos predictivos utilizados en pronósticos de salud. Finalmente, desarrollamos un nuevo método que transforma problemas de análisis de supervivencia en problemas de clasificación binaria semisupervisada, y demostramos su eficacia al tratar con conjuntos de datos anchos.; Machine learning has become present in almost every field of knowledge,&#13;
and thrives in the presence of richly labelled data. However, in&#13;
many biomedical and health settings labels are often scarce, expensive&#13;
or incomplete. This doctoral thesis investigates two methodological&#13;
families that aim to alleviate that constraint: semi-supervised learning,&#13;
which exploits abundant unlabelled data, and survival analysis, which&#13;
models censored time-to-event outcomes common in clinical studies.&#13;
Through real-world cases in protein engineering and chronic heart&#13;
failure prognosis, the work explores how these techniques can deliver&#13;
accurate and interpretable models while lowering labelling costs.&#13;
To establish a shared framework for a multidisciplinary readership,&#13;
this thesis first reviews essential theoretical and practical concepts in&#13;
machine learning, bioinformatics and survival analysis. The rest of&#13;
this thesis comprises several research works with particular objectives&#13;
and motivations, but with a common underlying theme:&#13;
▶ The adaptation of semi-supervised learning methods to regression&#13;
problems.&#13;
▶ The study of the effectiveness of semi-supervised regression&#13;
techniques in the protein engineering field.&#13;
▶ The application of statistical and machine learning-based survival&#13;
analysis methods for chronic heart failure prognosis.&#13;
▶ The assessment of the influence of features on heart failurerelated&#13;
hospitalisation using very novel methods.&#13;
▶ The exploration of the intersection between semi-supervised&#13;
learning and survival analysis through the development of new&#13;
techniques.&#13;
These contributions have several implications. First, we propose a&#13;
novel semi-supervised wrapper method called Tri-Training Regressor,&#13;
competitive with state-of-the-art methods. Second, we demonstrate&#13;
that using semi-supervised learning techniques can meaningfully&#13;
enhance predictive accuracy in the protein engineering field, while&#13;
mitigating the bottleneck of limited labelled data. Third, we evaluate&#13;
the precision of both classical and recent survival analysis models&#13;
for chronic heart failure prognosis, with a particular emphasis on the&#13;
importance of the interpretability of the predictive models used in&#13;
health prognostics. Finally we develop a new method that transforms&#13;
survival analysis problems into semi-supervised binary classification&#13;
problems, and demonstrate its effectiveness in dealing with wide&#13;
datasets.
</summary>
<dc:date>2025-01-01T00:00:00Z</dc:date>
</entry>
<entry>
<title>Optimization of industrial processes through semi-supervised learning</title>
<link href="https://hdl.handle.net/10259/10312" rel="alternate"/>
<author>
<name>Ramírez Sanz, José Miguel</name>
</author>
<id>https://hdl.handle.net/10259/10312</id>
<updated>2025-03-17T11:08:03Z</updated>
<published>2024-01-01T00:00:00Z</published>
<summary type="text">Optimization of industrial processes through semi-supervised learning
Ramírez Sanz, José Miguel
Enlas últimas décadas, el aprendizaje automático ha adquirido una gran popularidad, que ha ayudado a impulsar su ya creciente desarrollo. Dentro del aprendizaje automático, una nueva técnica llamada aprendizaje semisupervisado es capaz de aprovechar tanto los datos etiquetados comolos noetiquetados. Esto permite desarrollar modelos más precisos y con mejor capacidad de generalización gracias a la información que son capaces de extraer de los datos. La industria ha sido el motor del progreso humano, transformando recursos en bienes y productos de alta complejidad mediante la innovación. Mediante el desarrollo tecnológico y económico, la industria ha permitido que la sociedad avance hacia nuevos horizontes de productividad y calidad de vida. Esta tesis explora aplicaciones del aprendizaje semisupervisado en problemas industriales, con el objetivo de comprender su estado del arte, investigar nuevas metodologías, diseñar modelos y aplicarlos a casos reales en la industria. Las aportaciones más destacables de esta tesis doctoral han sido revisar el estado del arte de la aplicación de métodos de aprendizaje semisupervisado aladetección ydiagnóstico defallos industriales. Se ha investigado y propuesto una nueva taxonomía para una nueva técnica desarrollada a partir del aprendizaje semisupervisado: el aprendizaje semisupervisado seguro. Además, se ha realizado el desarrollo de una versión semisupervisada del método más conocido del grupo de investigación, el Rotation Forest. También se ha elaborado el desarrollo y la aplicación de un método interpretable de selección de características basado en árboles para el problema de selección del método de transporte. Por último, se han aplicado y comparado modelos supervisados y semisupervisados al problema de selección del método de transporte. En resumen, esta tesis doctoral proporciona una contribución significativa al campo del aprendizaje semisupervisado aplicado a la industria, proponiendo nuevas metodologías y modelos que optimizan problemas industriales, validandolos en casos de estudio reales.; In recent decades, machine learning has gained great popularity, which has helped boost its already growing development. Within machine learning, a new technique called semi-supervised learning is capable of leveraging both labeled and unlabeled data. This allows it to develop more precise models with better generalization capabilities due to the information they can extract from the data. Industry has been the engine of human progress, transforming resources into complex goods and products through innovation. Technological and economic development has enabled society to advance toward new horizons of productivity and quality of life. This doctoral thesis explores the applications of semi-supervised learning to industrial problems. The main objectives include understanding the state of the art of the applications of this technique to industrial problems, investigating new methodologies developed from this approach, designing new models of this type of learning, and applying them to real-world industrial environments. The main contributions of this doctoral thesis include reviewing the state of the art of semi-supervised learning methods applied to fault detection and diagnosis in industrial settings, highlighting the formulation of a series of best practices to improve future research in this field. Additionally, a new taxonomy has been investigated and proposed for a new technique derived from semi-supervised learning: safe semi-supervised learning. Also the development of a semi-supervised version of the most well-known method from the research group, the Rotation Forest, was also achieved. Moreover, a tree-based interpretable feature selection method was developed and applied to the problem of travel mode choice. Finally, supervised and semi-supervised models were applied and compared for the travel mode choice problem. In summary, this doctoral thesis makes a significant contribution to the field of semi-supervised learning applied to industry, proposing new methodologies and models that optimize industrial problems, validated through real-world case studies.
</summary>
<dc:date>2024-01-01T00:00:00Z</dc:date>
</entry>
<entry>
<title>Técnicas de preprocesamiento en datos anchos</title>
<link href="https://hdl.handle.net/10259/10309" rel="alternate"/>
<author>
<name>Ramos Pérez, Ismael</name>
</author>
<id>https://hdl.handle.net/10259/10309</id>
<updated>2025-07-01T08:20:36Z</updated>
<published>2024-01-01T00:00:00Z</published>
<summary type="text">Técnicas de preprocesamiento en datos anchos
Ramos Pérez, Ismael
En el aprendizaje automático, especialmente en biología y genómica, los conjuntos de datos son llamados anchos, Los datos anchos contienen una gran cantidad de características pero pocas instancias. Esta alta dimensionalidad dificulta el aprendizaje de los modelos de aprendizaje, causando sobreajuste y sesgos. Para abordar estos problemas, las técnicas de preprocesamiento de datos son fundamentales. Esta tesis explora diversas estrategias de preprocesamiento, como la selección y reducción de características, y el remuestreo para equilibrar las clases. Además de técnicas semi-supervisadas. A través de tres artículos, se comparan diferentes estrategias de preprocesado y, en el campo de la selección de características en aprendizaje semi-supervisado y se propone una nueva taxonomía de algoritmos. Los resultados obtenidos demuestran la importancia de combinar adecuadamente las técnicas de preprocesamiento para obtener modelos más robustos y generales. Esta investigación proporciona una guía práctica para abordar los desafíos planteados por los datos anchos en el aprendizaje automático.
</summary>
<dc:date>2024-01-01T00:00:00Z</dc:date>
</entry>
<entry>
<title>New techniques for semi-supervised learning with ensembles and constraints</title>
<link href="https://hdl.handle.net/10259/9704" rel="alternate"/>
<author>
<name>Garrido Labrador, José Luis</name>
</author>
<id>https://hdl.handle.net/10259/9704</id>
<updated>2024-11-16T23:00:46Z</updated>
<published>2024-01-01T00:00:00Z</published>
<summary type="text">New techniques for semi-supervised learning with ensembles and constraints
Garrido Labrador, José Luis
En los últimos años, el campo del aprendizaje semisupervisado (SSL) ha ganado una tracción significativa debido a su potencial para aprovechar tanto datos etiquetados como no etiquetados, abordando así los desafíos asociados con conjuntos de datos parcialmente etiquetados. Esta tesis doctoral explora nuevas técnicas para el SSL, centrándose específicamente en métodos con multiclasificadores y la integración de restricciones para mejorar el rendimiento de la clasificación. La investigación desarrollada tiene como objetivo avanzar en el estado del arte en SSL mediante el desarrollo de nuevos algoritmos, evaluando su efectividad a través de la experimentación y proponiendo una biblioteca de código abierto para una mayor accesibilidad y aplicabilidad. La tesis comienza con una revisión exhaustiva de los métodos actuales en el SSL, destacando la escasez en la literatura en cuanto al rendimiento comparativo de varias técnicas de SSL. Luego, se introducen enfoques innovadores con multiclasificadores que combinan múltiples modelos para mejorar la precisión y el comportamiento en escenarios muy escasamente etiquetados. Una contribución significativa de este trabajo es la aplicación de clasificación con restricciones en el marco de SSL. Al incorporar restricciones de «cannot-link» y «mustlink», los métodos propuestos pueden mejorar la fiabilidad de los resultados de la clasificación. Este enfoque se valida a través de extensos experimentos en tareas de reidentificación de animales utilizando datos de vídeo, demostrando un rendimiento superior en comparación con los clasificadores que no toman en cuenta estas restricciones. Además, la tesis aborda los desafíos prácticos de implementación, desarrollando una biblioteca de código abierto que incluye los nuevos algoritmos propuestos. Esta biblioteca tiene como objetivo facilitar la investigación y aplicación adicionales de las técnicas de SSL en varios dominios. Resumiendo, esta tesis trata de contribuir a a acrecentar de conocimiento en el SSL, proporcionando nuevas ideas, metodologías y herramientas que mejoran la efectividad y aplicabilidad de SSL en escenarios del mundo real.
</summary>
<dc:date>2024-01-01T00:00:00Z</dc:date>
</entry>
</feed>
