Soutenance de thèse – Julien Dudas
Julien Dudas soutiendra le 30 octobre sa thèse intitulée « Apprentissage automatique quantique avec des modes bosoniques » préparée sous la direction de Julie Grollier et encadrée au laboratoire Albert Fert par Danijela Marković.
Apprentissage automatique quantique avec des modes bosoniques
Résumé
Les systèmes quantiques ont le potentiel d’améliorer les techniques informatiques classiques de pointe, grâce à des propriétés telles que la superposition et l’intrication.
Leur combinaison avec des cadres d’intelligence artificielle pourrait améliorer de nombreux domaines du traitement des données quantiques, tels que la reconnaissance automatique des états quantiques et le contrôle des dispositifs quantiques. Malgré des résultats prometteurs obtenus avec les réseaux de neurones quantiques, des défis majeurs subsistent : (i) la mise en œuvre d’architectures comportant un grand nombre de neurones et de paramètres entraînables sur le matériel quantique actuel, et (ii) l’entraînement fiable de ces modèles, où des problèmes tels que les ‘barren plateau’ dans les fonction de coût peuvent supprimer les gradients et entraver l’apprentissage.
En effet, la résolution de tâches complexes nécessite un grand nombre de neurones densément connectés par de nombreux paramètres entraînables, ce qui est difficile à réaliser sur du matériel quantique.
Dans cette thèse, nous envisageons la mise en œuvre de réseaux de neurones quantiques avec des modes bosoniques couplés. Nous obtenons un grand nombre de neurones en considérant les probabilités d’état de Fock comme caractéristiques de sortie, et des paramètres entraînables en couplant paramétriquement les modes, grâce à différents processus de mélange à trois ondes tels que la conversion cohérente de photons et le squeezing entre deux modes.
Afin d’entraîner le système quantique, nous explorons deux approches : (i) le calcul par réservoir, qui contourne l’entraînement des paramètres physiques, et (ii) l’entraînement direct des couplages paramétriques par descente de gradient. La dynamique intrinsèque des modes bosoniques étant linéaire, la non-linéarité ne provient que des mesures d’états de Fock. Nous constatons que cette non-linéarité induite par la mesure est remarquablement expressive : en utilisant seulement deux oscillateurs quantiques, nous pouvons extraire un ensemble suffisant de caractéristiques non linéaires pour apprendre des tâches qui nécessitent généralement environ 20 neurones dans un réseau classique, notamment la classification de signaux sinus/carré et la prédiction de séries temporelles Mackey-Glass.
Cependant, le calcul quantique par réservoir se heurte à deux limites principales : comme tous les poids entraînables résident uniquement dans le post-traitement classique des résultats de mesure, obtenir de bonnes performances nécessite de mesurer un grand nombre de caractéristiques, et son expressivité est limitée par son architecture monocouche. Pour remédier à cela, nous entraînons directement les paramètres de mélange à trois ondes; pour une simulation efficace, nous limitons la dynamique interne aux modes gaussiens et utilisons la rétro-propagation pour l’optimisation. Nous montrons que cette approche apprend efficacement : bien que le nombre de paramètres entraînables évolue linéairement avec le nombre de modes, le nombre de caractéristiques mesurées requis baisse par rapport au calcul par réservoir, l’expressivité augmente et, avec le même nombre de modes, nous résolvons des tâches plus difficiles que la base de référence du réservoir.
Cette thèse a démontré que les réseaux de neurones quantiques bosoniques constituent une voie prometteuse vers un apprentissage efficace sur le plan matériel et a fourni des outils théoriques permettant de comprendre comment ils apprennent, et améliorer leurs performances. À l’avenir, l’addition dans l’Hamiltonien de non-linéarités d’ordre supérieur telles que les processus Kerr permettrait de pousser le système au-delà du régime gaussien, libérant ainsi des ressources non gaussiennes et un espace de caractéristiques effectif plus vaste. Dans une perspective plus large, il sera important d’étudier leur susceptibilité aux barren plateaus et d’identifier les conditions dans lesquelles le dimensionnement du gradient reste favorable.


Laisser un commentaire