Data Engineer Senior

JAKALA recrute !

À propos

SoyHuCe - Le centre d’excellence opérationnel en Data / IA et Web de JAKALA

Les équipes SoyHuCe combinent les expertises nécessaires à la création de solution data clé-en-main : collecte, traitement, analyse, algorithmie, exploitation, intégration et UX/UI.

Elles répondent ainsi à des cas d’usage variés, dans de multiples secteurs : retail, énergie, loisirs, industrie, assurance, secteur publique, santé….

En pratique elles sont principalement basées à Paris et Caen et s’organisent en 3 tribus :

  • Le Data Lab : expertise en Algorithmie, Data Science & IA avec capacité d’industrialisation ; en lead sur les projets R&D

  • La Digital Factory : intégration des innovations dans des solutions web / app et mise à l’échelle auprès des utilisateurs

  • Le Customer Success : accompagnement fonctionnel et gestion de projets

En interne, toutes les initiatives sont valorisées : les idées, les avancées techniques et la montée en compétences, le tout dans une ambiance challengeante et bienveillante.

Opportunités de carrière stimulantes

Rejoindre JAKALA en France, c’est bénéficier du meilleur des deux mondes : l’agilité et l’impact d’une scale-up, tout en s’appuyant sur la solidité d’un leader européen. Vous aurez l’opportunité de travailler sur des projets ambitieux et innovants, aux côtés d’experts reconnus, avec l’appui de partenariats technologiques de premier plan.

Les valeurs qui guident les #Jakalers

Embrace Data – Make it count – Grow Together – Deliver our best – Be Purpose Driven

Descriptif du poste

Au sein de notre Data Lab, tu travailles conjointement avec les Data Scientists, Data Engineers, MLE/MLOps engineer déjà en poste et tu seras impliqué.e dans la prise de décisions liée aux solutions Data et à leur évolution.

A cet effet, tu es en charge de :

  • Contribuer au développement de notre offre Data et à l’industrialisation de plateformes data pour nos clients

  • Comprendre, analyser et proposer des solutions techniques répondant aux besoins des Plateformes digitales et des projets internes

  • Définir l’architecture logiciel ETL / ELT en collaboration avec tes pairs

  • Travailler la donnée sous toutes ses formes (stockage, élaboration de modèles, structuration, nettoyage)

  • Rédiger de la documentation technique (diagrammes UML, documentation d’API, …)

  • Partager ton savoir-faire avec les différents membres de l’équipe

  • Concevoir et développer des connecteurs entre les sources de données (internes et/ou externes) et la plateforme

  • Concevoir et développer des pipelines de traitements de données (batch et/ou temps réel) dans un environnement Big Data,

  • Assurer une veille technologique et savoir mener à bien un projet de R&D.

Tu assures en autonomie les missions suivantes en interne ou auprès de nos clients grands comptes :

  • Cartographier des données et des flux de données

  • Implémenter des algorithmes d’analyse de données pour l’industrialisation

  • Collecter, consolider et modéliser de gros volumes de données (Big Data, Data Warehouses, Data Lakes)

  • Développer et automatiser des flux de données et leurs visualisations en dashboards, reporting

  • S’assurer de la scalabilité, sécurité, stabilité et disponibilité des données de la plateforme

  • Analyser les données web pour répondre aux questions métiers et participer à la construction de l’architecture Big Data

  • Mettre en place du séquencement et de la supervision des flux précitées en gérant les cas limites

Compétences attendues :

Bon niveau en développement :

  • De script ETL : Python (Pandas, API Rest, FaaS), Java (ex Kafka Connect, SOAP), Spark (PySpark, Databricks, Delta Lake)

  • De script ELT : DBT (ex. Snowflake, PostgreSQL)

  • Connaissance conception et administration d’entrepôt de données : Snowflake, Big Query, PostgreSQL

  • LakeHouse: Delta Lake

  • Connaissance message broker : RabbitMQ, Kafka

  • Compétences cloud : Kubernetes, Conteneurisation, Fournisseur cloud (AWS, GCP ou Azure), Infrastructure As Code (Terraform)

  • Expérience d’architecture et de dimensionnement d’une architecture cloud via des services managés

  • Cartographie des données

Profil recherché

Diplômé·e d’études supérieures dans le système d’information, computer sciences, big data (école d’ingénieurs, école spécialisée ou équivalent universitaire), tu justifies d’au moins 5 ans d'expérience en Data engineering.

Tu as une expertise reconnue dans la mise en place de pipelines complets de valorisation de données massives, de la collecte à la mise à disposition d’applications en passant par le traitement.

La maîtrise de l’anglais est appréciée.

Certification·s indispensable·s : GCP Professionnal Data Engineer OU Azure Data Engineer Associate OU AWS Solution Architect.

Tu es passionné·e par ton métier et tu aimes le partager.

Les avantages

  • Entreprise en plein développement

  • Environnement innovant, véritable tremplin et accélérateur de progression

  • Projets et missions sur des champs techniques très variés

  • Mise en situation de responsabilité rapidement

  • Bureau en plein centre de Paris et centre de Caen

  • Télétravail possible jusqu’à 3 jours par semaine

  • Une mutuelle d’entreprise

  • 50% de frais de participation pour les transports

  • Ticket restaurant d’une valeur unitaire de 10,83€

Contrat

  • Poste à pourvoir en CDI

  • Rémunération selon profil et expérience

  • Poste ouvert aux personnes en situation de handicap

Process de recrutement

  • Une pré-qualification avec notre Talent Acquisition

  • Un entretien avec un Référent Technique Métier

  • Un challenge technique au travers d’un cas usage personnalisé SoyHuCe

  • Un dernier entretien avec notre CEO

Informations complémentaires

  • Type de contrat : CDI
  • Lieu : Paris, Caen
  • Niveau d'études : Bac +5 / Master
  • Expérience : > 5 ans
  • Télétravail partiel possible