Stagiaire Data Science LLM

JAKALA recrute !

À propos

SoyHuCe - Le centre d’excellence opérationnel en Data / IA et Web de JAKALA

Nos équipes combinent les expertises nécessaires à la création de solution data clé-en-main : collecte, traitement, analyse, algorithmie, exploitation, intégration et UX/UI.

Elles répondent ainsi à des cas d’usage variés, dans de multiples secteurs : retail, énergie, loisirs, industrie, assurance, secteur publique, santé….

En pratique elles sont principalement basées à Paris et Caen et s’organisent en 3 tribus :

  • Le Data Lab : expertise en Algorithmie, Data Science & IA avec capacité d’industrialisation ; en lead sur les projets R&D

  • La Digital Factory : intégration des innovations dans des solutions web / app et mise à l’échelle auprès des utilisateurs

  • Le Customer Success : accompagnement fonctionnel et gestion de projets

En interne, toutes les initiatives sont valorisées : les idées, les avancées techniques et la montée en compétences, le tout dans une ambiance challengeante et bienveillante.

Opportunités de carrière stimulantes

Rejoindre JAKALA en France, c’est bénéficier du meilleur des deux mondes : l’agilité et l’impact d’une scale-up, tout en s’appuyant sur la solidité d’un leader européen. Vous aurez l’opportunité de travailler sur des projets ambitieux et innovants, aux côtés d’experts reconnus, avec l’appui de partenariats technologiques de premier plan.

Les valeurs qui guident les #Jakalers

Embrace Data – Make it count – Grow Together – Deliver our best – Be Purpose Driven

Descriptif du poste

En tant que Stagiaire Data Scientist, tu évolues au sein d’une équipe d’une vingtaine de développeurs, ingénieurs en science des données, algorithmiciens, intégrateurs et graphistes, et tu es amené à travailler sur les IA génératives.

Sujet de stage : Chat with documents

Création d’un modèle d’IA générative pour interagir avec une base de données (base de données relationnelles puis fichiers pdf) en utilisant des requêtes en langage naturel.

Actuellement, notre modèle fonctionne sur une table de base de données, nous souhaitons donc aller plus loin en : 

  • interagissant avec plusieurs tables d’une même base de données

  • entraînant un modèle LLM basé sur la technique RAG dans le but d’interagir avec une base documentaire (fichiers pdfs).

Le travail s'effectue en Python, tu es en charge de préparer les données, entraîner le modèle et déployer une application pour l’inférence du modèle.

Notre stack (en constante évolution) :

  • Langage : Python

  • Modèles LLM : OpenAI, Mistral, Ollama

  • Stockage de données: PostgreSQL

  • Plateforme Cloud : AWS, GCP ou Azure

  • Conteneurisation : Docker

Profil recherché

Etudiant en 5ème année d'école d’ingénieur en Data Science ou équivalent universitaire.

Tu as une grande appétence pour les sujets exploratoires, les défis techniques et le monde des algorithmes.

Tu es rigoureux·euse, ouvert·e, très curieux·euse et adores explorer et éprouver des nouvelles technologies.

Tu es passionné·e par ta formation, et aimes partager tes connaissances. 

Tu es sensible aux problématiques liées à l’agilité, et souhaites pouvoir allier des connaissances dans le domaine de la data à de nouvelles pratiques de développement.

Les avantages

  • Entreprise en plein développement , véritable tremplin et accélérateur de progression

  • Projets et missions sur des champs techniques très variés 

  • Mise en situation de responsabilité rapidement 

  • Bureau en plein centre de Paris et de Caen

  • Télétravail possible jusqu’à 3 jours par semaine 

  • Mutuelle d’entreprise 

  • 50% de frais de participation pour les transports

  • Ticket restaurant d’une valeur de 10,83€ (60% prise en charge par l’employeur)

Contrat

  • Stage conventionné de 6 mois

  • Poste ouvert aux personnes en situation de handicap

Process de recrutement

  • Une pré-qualification avec notre Talent Acquisition

  • Un entretien avec un Référent Technique Métier

  • Un challenge technique au travers d’un cas d'usage personnalisé 

  • Un dernier entretien avec notre CEO

Informations complémentaires

  • Type de contrat : Stage (6 à 6 mois)
  • Lieu : Paris, Caen
  • Niveau d'études : Bac +5 / Master
  • Télétravail partiel possible