Passer au contenu principal

Data Scientist F/H

 
La Banque des Territoires réunit tous les outils de la Caisse des Dépôts au service du développement des territoires.
Elle regroupe les directions opérationnelles (bancaire, investisseur, prêteur) et s’appuie sur un réseau de 35 implantations, avec des directions fonctionnelles (finances, communication, stratégie digitale et ressources humaines). Elle associe également deux filiales, CDC Habitat et la SCET, qui contribuent à l’accompagnement des acteurs territoriaux en ingénierie et conseil.
Au sein de la Banque des Territoires, la direction des prêts conçoit et apporte des financements de long terme adaptés aux besoins d’investissement de nos clients historiques comme le secteur du logement social (organismes de logement social, secteur associatif et médico-social), ou en lien avec sa mission d’intérêt général pour les acteurs du secteur public local : collectivités locales et leurs satellites, sociétés d’économie mixte, entreprises privées partenaires et co-investisseurs. Elle accompagne durablement leur évolution et leurs projets.

Missions et activités principales

Au sein de la Direction des prêts de la Banque des Territoires, en tant que Data Scientist vous serez à titre principal amené à réaliser divers études / analyses et à mettre en œuvre divers outils de machine learning. Vous pourrez être amené, ponctuellement et lorsque cela sera nécessaire, à participer à l'activité de production de données du service.

Les missions à réaliser seront variées :

Mise en œuvre d'algorithmes de text mining et de traitement du langage sur les différents documents à disposition de la direction des prêts (pièces justificatives des clients, etc.) :

  • Extraction automatique d'informations
  • Classification de documents
  • Amélioration de la qualité des données

Pour cela, la connaissance de différentes approches statistiques, dont l'utilisation de réseaux de neurones, est nécessaire. La mise en œuvre de ces techniques permettra, par exemple, de constituer automatiquement des bases de données pour fiabiliser les données de la DP et les enrichir d'informations supplémentaires. Vous participerez activement au développement de services destinés aux clients de la Direction, sur la base de ce type de technologies.

Travaux à réaliser sur les modèles larges de langage et sur l’ensemble de l’architecture liée à ces solutions :

  • Mise en œuvre du RAG, des solutions de type agent
  • Prétraitement des documents
  • Test et utilisation de différents LLM

Participation à l’industrialisation et à la bonne mise en œuvre de l’ensemble des outils de data sciences utilisées à DPHD80. Code sur Bitbucket, documentation des outils, mise en œuvre de packages, utilisation de Docker

Analyse / collecte de données :

  • Exploitation de bases de données en open data afin d’enrichir la connaissance client (base SQL, fichiers Parquet)
  • Récupération d’informations par web scraping

Profil attendu

Le recrutement à la Caisse des Dépôts est fondé sur les compétences, sans distinction d'origine, d'âge, ni de genre. Tous nos postes sont ouverts aux personnes en situation de handicap.

Vous avez :

  • Une formation scientifique supérieure (BAC+5)
  • Une solide expérience en modélisation / mathématiques appliquées et machine learning
  • Une utilisation avérée de LLM et des librairies liées (déploiement de petits LLM en local)
  • Une expérience avérée en estimation de modèle de Deep learning et en fine tuning de ces modèles (Bert).
  • Bonne maîtrise des dernières évolutions dans le domaine de l'IA et du deep learning.
  • un savoir-faire en mise en œuvre des outils d'IA dans le domaine du traitement du texte, de l'image et de données plus classiques.
  • Excellente connaissance de la programmation en particulier python et les librairies tensorflow, scikitlearn, pandas, numpy
  • Capacité à construire des solutions opérationnelles et industrialisables pertinentes


 Qualités personnelles attendues :
 Vous disposez des capacités personnelles suivantes :
  Qualités d'analyse, de synthèse et de rédaction
  Bonnes qualités relationnelles
  Curiosité, rigueur, autonomie, capacité à faire des propositions innovantes.

Conditions de travail

Poste basé à Paris 72 avenue Pierre Mendes France
Temps de travail : Temps complet