Publish an internship
en
View Offer
Work > Internships > IT/Technology > France > View Offer 

Stage Recherche - Séparation de sources audio multicanale pour la compression de données F/H

Orange
France  France
Internship, IT/Technology, French, English
39
Visits
0
Applicants
Register

Job Description:

votre rôle

Orange a contribué au standard 3GPP IVAS (Immersive Voice and Audio Services) [1] qui inaugure la capacité d'un codec conversationnel à adresser des services immersifs. Ce codec est basé sur des techniques de traitement du signal classique, sans réseau de neurones.
Ces dernières années, les approches neuronales appliquées au codage audio mono-canal ont fait des progrès énormes en termes de rapport qualité-débit (SoundStream de Google, récemment supplanté par la solution d'Audio Descript [2]).
Il reste à développer des modèles efficaces de codage audio neuronal incluant la dimension spatiale, nécessitant plusieurs canaux.
Les codecs multicanaux classiques se basent souvent sur une étape de séparation de sources avant d'appliquer un codec-coeur mono à chaque source. On explore une approche qui pousse possiblement plus loin la séparation [3] pour tirer profit des performances des nouveaux codecs mono en se permettant d'en multiplier les instances. On étudie aussi la question de coder séparément la réverbération. Pour cette tâche non triviale, il peut être bénéfique d'inclure la déréverbération dans la tâche de séparation de sources [4]. Des performances de cette étape dépendent la qualité du codage des flux mono intermédiaires, ainsi que de possibles artefacts à l'étape finale de reformation du flux multicanal.
Le stage a vocation à explorer le lien entre performance de séparation de sources et qualité de codage avec comme objectifs :
* évaluer la criticité de la séparation de sources et de la déréverbération du point de vue des artéfacts de codage qui en résultent,
* évaluer les performances des méthodes de l'état-de-l'art de séparation de sources sur cette tâche.
Le travail de stage (6 mois) se déroulera selon le calendrier suivant :
* Appropriation du sujet et étude bibliographique (1 mois),
* Réalisation de tests, évaluation objective et subjective des besoins de séparation de source et déréverbération pour le codage (1,5 mois),
* Mise en œuvre et évaluation (2,5 mois)
* Rédaction (1 mois)
Références
[1] DRAFT TS 26.253 (Codec for Immersive Voice and Audio Services; Detailed Algorithmic Description incl. RTP payload format and SDP parameter definitions)

[2] Rithesh Kumar, Prem Seetharaman, Alejandro Luebs, Ishaan Kumar, and Kundan Kumar. High-Fidelity Audio Compression with Improved RVQGAN, October 2023. arXiv:2306.06546.

[3] Hëb-Umbach, R., Nakatani, T., Delcroix, M., Boeddeker, C., & Ochiai, T. (2025). Microphone Array Signal Processing and Deep Learning for Speech Enhancement: Combining model-based and data-driven approaches to parameter estimation and filtering. IEEE Signal Processing Magazine, 41(6), 12-23.

[4] Nakatani, T., Boeddeker, C., Kinoshita, K., Ikeshita, R., Delcroix, M., & Haeb-Umbach, R. (2020). Jointly optimal denoising, dereverberation, and source separation. IEEE/ACM Transactions on Audio, Speech, and Language Processing, 28, 2267-2282.

votre profil

Formation souhaitée
* Vous êtes actuellement en Master 2 ou école d'ingénieur à dominante recherche et vous préparez une formation dans le domaine du traitement du signal, de l'apprentissage automatique et/ou de l'audio
Pré-requis techniques
* Maîtrise du traitement du signal audio
* Bonnes connaissances en théorie des probabilités et statistiques
* Connaissances en méthodes d'apprentissage automatique, si possible en réseaux de neurones
* Maîtrise de Python. Idéalement expérience avec PyTorch.
Aptitudes personnelles
* Forte appétence pour le traitement du signal et l'audio
* Maîtrise de l'anglais

le plus de l'offre

Vous travaillerez au sein d'une équipe orientée recherche sur le traitement de la parole et du son, composée de chercheurs permanents, post-docs et doctorant-es. Vous serez amené à échanger avec les différents membres de l'équipe, experts sur les domaines du traitement audio, le développement informatique et l'intelligence artificielle liés à l'audio.
Le stage s'insère dans un contexte historique d'amélioration de qualité audio dans les applications conversationnelles. En particularité, la qualité audio sur téléphone mobile s'est améliorée en 2009 avec les premiers déploiements mondiaux par Orange de la « voix HD » (pour Haute Définition) mobile. Orange a également contribué au développement de la « voix HD+ » (équivalente à la qualité hifi) qui est déjà présente dans différents pays depuis 2016. Le stage vient étudier la nouvelle génération de technologies qui est amenée à remplacer les méthodes actuellement déployées.
Vous contribuerez, au sein d'une équipe motivée, à la recherche de domaines en plein essor. Vous travaillerez ainsi sur des technologies qui seront de plus en plus utilisées dans le futur. Vous pourrez être amenés à déposer un ou plusieurs brevets, et à participer à la publication d'articles.

entité

Le département Audio et Telco Services a pour ambition d'offrir à nos clients la
meilleure expérience digitale, en anticipant, développant et intégrant de bout en bout
les services de communication temps réel multicanaux. Le département porte
également une expertise sur les devices mobiles et une expertise audio/voix, de la
recherche au delivery.
3 équipes constituent le département :
* Equipe Rich Instant Messaging qui porte le Skill center Google RCS et les
activités de messaging
* Equipe Mobile Service and Sollicitation qui assure le développement des services mobiles et des plateformes associées
* Equipe Immersive Communications and Audio Expertise

contrat

Stage
Durée : 6 mois
Date souhaitée de prise de poste : 02 févr. 2026
*

* Niveau d'études préparé pendant le stage
* Indemnité brute selon école

* Bac+5
de 1621 EUR à 2162 EUR / mois

Source: Company website
Posted on: 11 Nov 2025  (verified 08 Dec 2025)
Type of offer: Internship
Industry: Telecommunications
Job duration: 6 months
Compensation: 2162 EUR
Languages: French, English
Register
124.213 jobs and internships
in 158 countries
Register
Recruiters
Top Jobs
Countries