Stagiaire Data Ingénieur·e

Stagiaire Data Ingénieur·e

SOYHUCE est à la recherche d’un·e Stagiaire Data Ingénieur·e afin de rejoindre une entreprise cliente et participer à la consolidation et aux évolutions des applicatifs.

 

À propos

 

Tech Lab spécialisé en algorithmes et en IA, SoyHuCe met à votre disposition son expertise avec :

  • Un laboratoire d’algorithmie : Transformer vos données en informations précieuses pour répondre à vos problématiques métiers les plus complexes.
  • Une data factory : Développer des solutions basées sur l’excellence technologique et vous accompagner à chaque étape : stocker, accéder, analyser, sécuriser et valoriser
  • Une usine Digitale : Définir avec vous vos projets et vos objectifs digitaux pour atteindre des solutions sur-mesure

 

SOYHUCE accompagne les entreprises, industries et collectivités dans leurs problématiques liées aux enjeux du numérique et leur transformation digitale.

 

Descriptif du stage

 

En tant que Stagiaire Data Ingénieur chez SOYHUCE, vous évoluerez au sein d’une équipe d’une vingtaine de Développeurs, Ingénieurs en Science des données, Algorithmiciens, Intégrateurs et Graphistes.

 

Sujets du stage :

 

Sujet 1 : Création d’un framework PySpark

 

Le stagiaire aura pour mission de concevoir et implémenter un framework permettant de simplifier et d’industrialiser la création de job ETL Spark. Ce framework devra être écrit en Python et se baser sur la bibliothèque PySpark. Enfin ce framework devra faire partie d’une architecture data cloud AWS (Amazon),GCP (Google) et Azure (Microsoft) permettant l’hébergement des jobs et le stockage des données sur S3 (AWS) et GCS (GCP).

 

Stacks techniques :

  • AWS, GCP, Azure
  • Spark
  • Python
  • Docker

 

Sujet 2 : Développement ETL orientée DataLake

 

Le stagiaire aura pour mission de développer des pipelines PySpark / Databricks grâce aux compétences acquises lors de la phase de conception du framework PySpark.

 

Stacks techniques :

  • Azure
  • Databricks, Delta Lake
  • Spark
  • Python
  • Docker

 

D’autres sujets d’intérêt pourront être ajoutés en fonction des attentes et des capacités du stagiaire.

 

Profil recherché 

 

Stagiaire en 5ème année d’école d’Ingénieur en Data ou équivalent universitaire, vous justifiez d’une bonne connaissance en développement logiciel :

  • Bon niveau en Python 
  • API REST
  • scripts et logiciel
  • data visualisation 
  • pré étude via Notebooks Jupyter
  • Bon niveau en Java
  • Bonne connaissance de l’environnement container Docker (Kubernetes est un plus)
  • Bonne connaissance de SQL et d’un système de SGBDr (PostgreSQL, MySQL)
  • Connaissance des environnements cloud (VM, Containers)
  • Connaissance de Git et travail en équipe

 

Vous avez une grande appétence pour les sujets exploratoires, les défis techniques et le monde de l’exploitation de la donnée.

 

Vous êtes rigoureux·euse, ouvert·e, très curieux·euse et adorez explorer et éprouver des nouvelles technologies.

 

Vous êtes passionné·e par votre formation, et aimez partager vos connaissances. 

 

Vous êtes sensible aux problématiques liées à l’agilité, et souhaitez pouvoir allier des connaissances dans le domaine de la data à de nouvelles pratiques de développement. 

 

Les plus

  • Entreprise jeune en plein développement, acteur majeur du digital en Normandie ;
  • Environnement de start-up innovant au savoir-faire reconnu à haute technicité ; 
  • Variété des projets et des missions, sur des champs techniques très variés ; 
  • Mise en situation de responsabilité rapidement ;
  • Implication forte dans la croissance de l’entreprise ; 
  • Prise directe aux sujets opérationnels & business ;
  • Facilités sur demande.

 

Process de recrutement 

  • Un pré-qualification avec notre Talent Acquisition Senior
  • Un entretien avec un Référent Technique Métier
  • Un challenge technique 
  • Un entretien avec notre CEO 


Les avantages

  • Missions à forte valeur ajoutée (uses cases stratégiques, complexité des sujets) et variées ;
  • Environnement de travail agile et innovant ;
  • Tickets restaurants Swile (valeur quotidienne unitaire 9,2 €) ;
  • Travail en lien avec de nombreux métiers coeurs du numérique : UX Designer, développeurs Front/back/fullstack, DevOps, Data Ingénieurs, Data Scientists ;
  • Possibilité de télétravail ;
  • 50% de frais de participation pour les transports.

 

Icône Job Data

Stagiaire Data Ingénieur·e

  • Icône Poste
    Stage
  • Icône Lieux
    Caen
  • Icône Date