Learning with Limited Labeled Data

Thèse Année : 2023

Apprentissage avec peu de données étiquetées Learning with Limited Labeled Data

(1)

1 (Plateau de Moulon 3 rue Joliot Curie 91192 GIF SUR YVETTE CEDEX - France) 1042590

CentraleSupélec (3, rue Joliot Curie, Plateau de Moulon, 91192 GIF-SUR-YVETTE Cedex - France) 411575
Université Paris-Saclay (Bâtiment Bréguet, 3 Rue Joliot Curie 2e ét, 91190 Gif-sur-Yvette - France) 419361

"> MICS - Mathématiques et Informatique pour la Complexité et les Systèmes

Yassine Ouali

Fonction : Auteur
PersonId : 1261797
IdRef : 270436790

Mathématiques et Informatique pour la Complexité et les Systèmes

Résumé

Since its inception, the north star of artificial intelligence was to design systems capable of learning as efficiently (i.e. with limited training signal) and effectively (i.e. demonstrating good performances) as humans to solve challenging problems that require human-like intelligence. Deep neural networks and the collection of popular deep learning ingredients used to produce systems usable in the real world, such as optimization algorithms, novel architectures, objective functions, and large annotated datasets, have shown remarkable performances across various tasks in recent years. However, this dominant paradigm requires a large amount of fully labeled data, which is often expensive and difficult to acquire. It might also contain annotation errors and hidden biases, which limits the applicability and adoption of such systems. Yet humans demonstrate a remarkable ability to learn effectively across diverse settings, using limited supervision and leveraging prior experience to adapt to novel cases and gain new skills quickly. This discrepancy raises an obvious question, can we design systems with similar capabilities? In this thesis, we aim to develop label-efficient learning algorithms that are effective with a limited or no amount of annotated examples for various tasks over different modalities and multiple levels of abstraction. To this end, this thesis cover works that: i) develop learning methods for paradigms with varying degrees of supervision, ii) present results for different modalities, notably vision, and text, and iii) different tasks across various levels of abstraction (e.g., image level and pixel level). We hope these works can help further advance the state of the field and aid in developing systems capable of learning efficiently and adapting effectively across a wide range of environments.

Depuis ses débuts, l'objectif de l'intelligence artificielle est de concevoir des systèmes capables d'apprendre aussi efficacement que les humains pour résoudre ou aider à résoudre des problèmes difficiles qui nécessitent une certaine forme d'intelligence humaine. La discipline a connu récemment un essor spectaculaire grâce aux réseaux de neurones profonds et ses extensions qui ont montré des performances sur tout un ensemble de tâches jusqu'alors considérées complexes. Cependant, ce paradigme dominant nécessite une grande quantité de données étiquetées, qui sont souvent coûteuses et difficiles à acquérir. Ces données peuvent également contenir des biais cachés et des erreurs d'annotation, ce qui limite l'application de tels systèmes dans de nombreux domaines. Pourtant, les humains font preuve d'une remarquable capacité à apprendre efficacement dans de nouveaux et divers contextes, en tirant en grande parti de leur expérience à s'adapter à de nouveaux cas et acquérir rapidement de nouvelles compétences. Cette divergence soulève une question évidente : pouvons-nous concevoir des systèmes dotés de capacités similaires ? Dans cette thèse, notre objectif est de développer des algorithmes d'apprentissage efficaces avec une quantité limitée d'étiquettes pour résoudre de diverses tâches pour différentes modalités. A cette fin, cette thèse couvre des travaux qui : i) développent des méthodes d'apprentissage pour des paradigmes avec différents degrés de supervision, ii) présentent des résultats pour différentes modalités, notamment l'image et le texte, et iii) qui gèrent différentes tâches.

Mots clés

Deep Learning Artificial intelligence Label Eﬃcient Learning Computer vision Natural language processing

Apprentissage profond Intelligence artificielle Apprentissage eﬃcace Vision par ordinateur Traitement de langage naturel

Domaines

Intelligence artificielle [cs.AI] Vision par ordinateur et reconnaissance de formes [cs.CV] Traitement du texte et du document

Fichier principal

106973_OUALI_2023_archivage.pdf (106.09 Mo)

Origine	Version validée par le jury (STAR)

ABES STAR : Contact

https://theses.hal.science/tel-04127195

Soumis le : mardi 13 juin 2023-16:08:15

Dernière modification le : mardi 26 novembre 2024-06:59:43

Archivage à long terme le : jeudi 14 septembre 2023-19:57:31

Dates et versions

tel-04127195 , version 1 (13-06-2023)

Identifiants

HAL Id : tel-04127195 , version 1

Citer

Yassine Ouali. Learning with Limited Labeled Data. Intelligence artificielle [cs.AI]. Université Paris-Saclay, 2023. Français. ⟨NNT : 2023UPAST062⟩. ⟨tel-04127195⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

STAR CENTRALESUPELEC MICS UNIV-PARIS-SACLAY THESES-UNC GS-COMPUTER-SCIENCE

212 Consultations

15 Téléchargements