Thèse "Codage neuronal avancé pour les signaux audio mono et stéréo" F/H

Orange

Lannion, Frankreich

IT/Technologie, Französisch, Englisch

55 Besuche			0 Bewerbungen

Anmelden

Beschreibung:

Publication date : May 21, 2026, 9:24AM
Votre rôleest d'effectuer un travail de thèse surle sujet : «Codage neuronal avancé pour les signaux audio mono et stéréo »
Contexte global et problématique du sujet
La compression audio (ou codage audio) est un domaine à la croisée du traitement du signal audio, du codage de source, et de la psychoacoustique, marqué par le développement de nombreux codecs (codeurs-décodeurs), dont certains sont très connus du grand public comme MP3 ou AAC pour la transmission ou le stockage de musique.
Depuis une dizaine d'années, le domaine du codage audio est révolutionné par les technologies de l'apprentissage profond (deep learning). Les réseaux de neurones artificiels permettent d'atteindre des débits de compression très faibles de l'ordre de 1 kbit/s.
Ainsi, une nouvelle génération de méthodes de compression de signaux multimédia a émergé avec le deep learning. Les architectures de type autoencodeur s'appuyant sur un apprentissage antagoniste (GAN pour Generative Adversarial Network) donnent de très bons résultats, avec des codecs comme SoundStream, EnCodec, ou Descript Audio Codec (DAC). D'autres approches, telles que les modèles de diffusion, sont aussi étudiées.
Les codecs audio neuronaux actuels sont pour l'essentiel en mono. Comparés aux codecs «traditionnels», ils sont en général bien plus complexes (en termes de ressources de calcul), requièrent un stockage très significatif (par exemple de l'ordre de 10 à 80M de paramètres).

Dans ce contexte, l'objectif de la thèse est de concevoir et développer des méthodes de codage audio innovantes basées sur le deep learning, pour les signaux mono et stéréo.
La thèse visera en particulier à lever les verrous scientifiques suivants:
* Réduire la complexité des modèles de représentation en codage audio neuronal
Obtenir un espace latent interprétable (donnant une séparation de type fréquentielle ou une séparation de contenus)
* Obtenir une représentation audio par réseaux de neurones (artificiels) qui soit capable de couvrir à la fois le mono et le stéréo
* Il s'agira par exemple d'étudier les approches récentes comme les transformers ou les modèles de diffusion, et de tester et explorer de nouvelles architectures de réseaux de neurones.
Références indicatives :
* Minje Kim and Jan Skoglund, "Neural Speech and Audio Coding," arXiv:2408.06954v1, 2024
* Thomas Muller, Stephane Ragot, Laetitia Gros, Pierrick Philippe, Pascal Scalart, Speech quality evaluation of neural audio codecs, Interspeech, 2024
* N. Zeghidour et al., "SoundStream: An End-to-End Neural Audio Codec," IEEE/ACM Trans. TASLP, 2021, arXiv:2107.03312
* R. Kumar et al., "High-Fidelity Audio Compression with Improved RVQGAN," in Advances in Neural Information Processing Systems, vol. 36, 2023.
* J.D Parker et al., Scaling Transformers for Low-Bitrate High-Quality Speech Coding, arXiv:2411.19842, Nov. 2024

Compétences (scientifiques et techniques) et qualités personnelles exigées par le poste:
* Bases solides en mathématiques (probabilités, algèbre…) et traitement numérique du signal
* Appétence pour le traitement de parole/audio
* Connaissances approfondies en Python - la connaissance du langage C et de MATLAB serait un plus
* Expérience en apprentissage automatique, notamment réseaux de neurones profonds (deep learning), bonne pratique sur le framework PyTorch et d'outils associés (tensorboard, torchaudio…)
* Rigueur et créativité
* Bonne maîtrise de l'anglais
Formation demandée:Master Recherche et/ou école d'ingénieur (avec un stage dans un laboratoire de recherche), avec un focus sur l'IA et le deep learning
L'objectif de la thèse est de concevoir de nouvelles méthodes de compression audio en appliquant les connaissances en apprentissage profond (deep learning).
Vous travaillerez sur des technologies d'IA générative et de codage neuronal qui sont à la pointe des méthodes utilisées en traitement du signal audio. Cette thèse vous permettra de développer une expertise sur les méthodologies d'apprentissage, dont les applications dépassent largement le domaine de l'audio.
Vous aurez accès à différents matériels pour la réalisation des travaux de recherche, dont des systèmes de captation et restitution sonore pour la création de base de données, des ressources de calcul centralisées (un cluster avec une centaine de GPU) pour les travaux sur les réseaux de neurones.
Les travaux de thèse se feront dans un mode coopératif avec les chercheurs et ingénieurs de l'équipe et en contribuant à la normalisation de codecs audio et à la rédaction d'articles scientifiques et de demandes de brevet
La thèse pourra s'appuyer sur l'expérience d'Orange en évaluation de qualité audio (tests subjectifs, outils automatiques de mesure de qualité, …), avec en particulier un laboratoire de test reconnu au niveau international.
L'ambition de la Division Innovation est de porter plus loin l'innovation d'Orange et de renforcer son leadership technologique, en mobilisant nos capacités de recherche pour nourrir une innovation responsable au service de l'humain, éclairer les choix stratégiques du Groupe à long terme et influencer l'écosystème digital mondial.
Nous formons les expertes et les experts des technologies d'aujourd'hui et de demain, et veillons à une amélioration continue de la performance de nos services et de notre efficacité.
La division Innovation rassemble, dans le monde, 6000 salariés dédiés à la recherche et l'innovation dont plus de 700 chercheurs. Porteurs d'une vision globale avec une grande diversité de profils (chercheurs, ingénieurs, designers, développeurs, data scientists, sociologues, graphistes, marketeurs, experts en cybersécurité…), les femmes et les hommes de la Division Innovation sont à l'écoute et au service des pays, des régions et des business units pour faire d'Orange un opérateur multiservices de confiance.
Au sein de Innovation, vous serez intégré(e) dans une équipe à la pointe de la recherche et de l'expertise sur le traitement du signal audio. La thèse porte sur la compression audio par réseau de neurones, qui est un champ de recherche très actif, avec de nombreuses pistes restant à explorer. Les résultats pourront être directement exploitables car la compression audio neuronale est déjà intégrée dans certains services.
At Orange, only your skills matter.
Regardless of your age, gender, background, origin, religion, sexual orientation, disability, neurodiversity, or appearance, we actively encourage diversity within our teams, as it is a collective strength and a driver of innovation.
Orange is a disability-inclusive employer: please feel free to let us know about any specific needs you may have

Ausführliche Beschreibung lesen

Quelle:	Website des Unternehmens
Datum:	22 Mai 2026 (geprüft am 22 Jul 2026)
Stellenangebote:	Job
Bereich:	Fernmeldewesen
Sprachkenntnisse:	Französisch, Englisch

Anmelden

Thèse "Codage neuronal avancé pour les signaux audio mono et stéréo" F/H

Über iAgora

Firma

Arbeit

Studien