Learning with Limited Labeled Data - TEL - Thèses en ligne
Nothing Special   »   [go: up one dir, main page]

Thèse Année : 2023
Apprentissage avec peu de données étiquetées Learning with Limited Labeled Data
1 MICS - Mathématiques et Informatique pour la Complexité et les Systèmes (Plateau de Moulon 3 rue Joliot Curie 91192 GIF SUR YVETTE CEDEX - France)
  • CentraleSupélec (3, rue Joliot Curie, Plateau de Moulon, 91192 GIF-SUR-YVETTE Cedex - France)
  • Université Paris-Saclay (Bâtiment Bréguet, 3 Rue Joliot Curie 2e ét, 91190 Gif-sur-Yvette - France)
"> MICS - Mathématiques et Informatique pour la Complexité et les Systèmes

Résumé

Since its inception, the north star of artificial intelligence was to design systems capable of learning as efficiently (i.e. with limited training signal) and effectively (i.e. demonstrating good performances) as humans to solve challenging problems that require human-like intelligence. Deep neural networks and the collection of popular deep learning ingredients used to produce systems usable in the real world, such as optimization algorithms, novel architectures, objective functions, and large annotated datasets, have shown remarkable performances across various tasks in recent years. However, this dominant paradigm requires a large amount of fully labeled data, which is often expensive and difficult to acquire. It might also contain annotation errors and hidden biases, which limits the applicability and adoption of such systems. Yet humans demonstrate a remarkable ability to learn effectively across diverse settings, using limited supervision and leveraging prior experience to adapt to novel cases and gain new skills quickly. This discrepancy raises an obvious question, can we design systems with similar capabilities? In this thesis, we aim to develop label-efficient learning algorithms that are effective with a limited or no amount of annotated examples for various tasks over different modalities and multiple levels of abstraction. To this end, this thesis cover works that: i) develop learning methods for paradigms with varying degrees of supervision, ii) present results for different modalities, notably vision, and text, and iii) different tasks across various levels of abstraction (e.g., image level and pixel level). We hope these works can help further advance the state of the field and aid in developing systems capable of learning efficiently and adapting effectively across a wide range of environments.
Depuis ses débuts, l'objectif de l'intelligence artificielle est de concevoir des systèmes capables d'apprendre aussi efficacement que les humains pour résoudre ou aider à résoudre des problèmes difficiles qui nécessitent une certaine forme d'intelligence humaine. La discipline a connu récemment un essor spectaculaire grâce aux réseaux de neurones profonds et ses extensions qui ont montré des performances sur tout un ensemble de tâches jusqu'alors considérées complexes. Cependant, ce paradigme dominant nécessite une grande quantité de données étiquetées, qui sont souvent coûteuses et difficiles à acquérir. Ces données peuvent également contenir des biais cachés et des erreurs d'annotation, ce qui limite l'application de tels systèmes dans de nombreux domaines. Pourtant, les humains font preuve d'une remarquable capacité à apprendre efficacement dans de nouveaux et divers contextes, en tirant en grande parti de leur expérience à s'adapter à de nouveaux cas et acquérir rapidement de nouvelles compétences. Cette divergence soulève une question évidente : pouvons-nous concevoir des systèmes dotés de capacités similaires ? Dans cette thèse, notre objectif est de développer des algorithmes d'apprentissage efficaces avec une quantité limitée d'étiquettes pour résoudre de diverses tâches pour différentes modalités. A cette fin, cette thèse couvre des travaux qui : i) développent des méthodes d'apprentissage pour des paradigmes avec différents degrés de supervision, ii) présentent des résultats pour différentes modalités, notamment l'image et le texte, et iii) qui gèrent différentes tâches.
Fichier principal
Vignette du fichier
106973_OUALI_2023_archivage.pdf (106.09 Mo) Télécharger le fichier
Origine Version validée par le jury (STAR)

Dates et versions

tel-04127195 , version 1 (13-06-2023)
Identifiants
  • HAL Id : tel-04127195 , version 1

Citer

Yassine Ouali. Learning with Limited Labeled Data. Intelligence artificielle [cs.AI]. Université Paris-Saclay, 2023. Français. ⟨NNT : 2023UPAST062⟩. ⟨tel-04127195⟩
212 Consultations
15 Téléchargements

Partager

More