Publier un stage
fr
Détails de l'offre
Emploi > Stages > Environnement > France > Détails de l'offre 

STAGE - Évaluation de l'utilisation des LLMs pour l'extraction de données scientifiques à partir de documents hétérogènes

Total
France  France
Stage, Environnement, Français, Anglais
5
Visites
0
Candidats

Description du poste:

Contexte et environnement

Au sein de la branche OneTech de TotalEnergies, vous rejoindrez le Centre de Recherche de Solaize, situé à 15 minutes au sud de Lyon.
Le site regroupe plus de 300 chercheurs dans un environnement verdoyant 🌳.
Il constitue l'un des principaux centres de R&D de TotalEnergies, dédié notamment :
* Au développement de solutions ainsi que de moyens de mesure et de contrôle des émissions de gaz à effet de serre
* À la formulation de produits à faible empreinte environnementale et décarbonés pour les mobilités thermique, électrique et pour l'industrie (carburants non fossiles d'origine renouvelable, lubrifiants, fluides caloporteurs, bitumes, etc.)

Les activités implantées sur le site évoluent constamment pour répondre aux objectifs et aux ambitions de la compagnie TotalEnergies en matière de neutralité carbone et d'accessibilité à des énergies abordables et propres pour le plus grand nombre.

Activités

TotalEnergies s'inscrit dans une ambition climat forte, visant la neutralité carbone à horizon 2050. Cette transformation s'accompagne d'une digitalisation accrue de la R&D, avec la mise en place d'approches prédictives pour accélérer le développement de nouvelles molécules et matériaux répondant aux besoins des mobilités durables. Dans ce cadre, l'exploitation efficace des données scientifiques issues de sources variées (articles, documents techniques, fichiers semi-structurés) est un levier essentiel pour innover plus rapidement et de manière responsable.
Les modèles de langage (LLMs) offrent des perspectives inédites pour automatiser cette extraction et faciliter l'accès à l'information.

Objectifs du stage :
* Évaluer différentes solutions LLM (Copilot, ChatGPT, MistralAI) en mode interactif (chat) et via API.
* Définir et tester des modes opératoires pour l'extraction de données scientifiques à partir, d'articles scientifiques, de documents techniques, de fichiers Excel semi-standardisés.
* Familiariser l'équipe avec l'écosystème LLM interne (LLM Hub TotalEnergies, outils associés).
* Proposer des recommandations pour l'intégration des LLMs dans les workflows existants.

🛠️ Moyens et outils utilisés :
* Accès aux solutions LLM internes et externes (LLM Hub, Copilot, etc.).
* Collaboration avec l'équipe R&D spécialisée en science des données

Profil du candidat

Formation Bac+5 : Ecole ingénieur / Master
🌐 Niveau d'anglais : B2
🗓️ Date de début souhaitée : Premier trimestre 2026
🗓️ Période de stage : 6 mois

Des compétences en informatique et data science sont recherchées, notamment en intelligence artificielle et apprentissage automatique, traitement automatique des langues (NLP), ainsi qu'une maîtrise des langages et outils courants (Python - pandas, NumPy, PyTorch/TensorFlow - APIs et intégration de modèles LLM).

Informations supplémentaires

TotalEnergies valorise la diversité, promeut le développement individuel et offre des opportunités d'emploi égales à tous les candidats

Origine: Site web de l'entreprise
Publié: 05 Dec 2025
Type de poste: Stage
Secteur: Pétrole / Gaz
Durée d'emploi: 6 mois
Langues: Français, Anglais
126.432 emplois et stages
dans 159 pays
S'inscrire
Entreprises
Offres
Pays