Ce site utilise des cookies afin que nous puissions vous fournir la meilleure expérience utilisateur possible. Les informations sur les cookies sont stockées dans votre navigateur et remplissent des fonctions telles que vous reconnaître lorsque vous revenez sur notre site Web et aider notre équipe à comprendre les sections du site que vous trouvez les plus intéressantes et utiles.
Stagiaire Data Ingénieur·e
Stagiaire Data Ingénieur·e
SOYHUCE est à la recherche d’un·e Stagiaire Data Ingénieur·e afin de rejoindre une entreprise cliente et participer à la consolidation et aux évolutions des applicatifs.
À propos
Tech Lab spécialisé en algorithmes et en IA, SoyHuCe met à votre disposition son expertise avec :
- Un laboratoire d’algorithmie : Transformer vos données en informations précieuses pour répondre à vos problématiques métiers les plus complexes.
- Une data factory : Développer des solutions basées sur l’excellence technologique et vous accompagner à chaque étape : stocker, accéder, analyser, sécuriser et valoriser
- Une usine Digitale : Définir avec vous vos projets et vos objectifs digitaux pour atteindre des solutions sur-mesure
SOYHUCE accompagne les entreprises, industries et collectivités dans leurs problématiques liées aux enjeux du numérique et leur transformation digitale.
Descriptif du stage
En tant que Stagiaire Data Ingénieur chez SOYHUCE, vous évoluerez au sein d’une équipe d’une vingtaine de Développeurs, Ingénieurs en Science des données, Algorithmiciens, Intégrateurs et Graphistes.
Sujets du stage :
Sujet 1 : Création d’un framework PySpark
Le stagiaire aura pour mission de concevoir et implémenter un framework permettant de simplifier et d’industrialiser la création de job ETL Spark. Ce framework devra être écrit en Python et se baser sur la bibliothèque PySpark. Enfin ce framework devra faire partie d’une architecture data cloud AWS (Amazon),GCP (Google) et Azure (Microsoft) permettant l’hébergement des jobs et le stockage des données sur S3 (AWS) et GCS (GCP).
Stacks techniques :
- AWS, GCP, Azure
- Spark
- Python
- Docker
Sujet 2 : Développement ETL orientée DataLake
Le stagiaire aura pour mission de développer des pipelines PySpark / Databricks grâce aux compétences acquises lors de la phase de conception du framework PySpark.
Stacks techniques :
- Azure
- Databricks, Delta Lake
- Spark
- Python
- Docker
D’autres sujets d’intérêt pourront être ajoutés en fonction des attentes et des capacités du stagiaire.
Profil recherché
Stagiaire en 5ème année d’école d’Ingénieur en Data ou équivalent universitaire, vous justifiez d’une bonne connaissance en développement logiciel :
- Bon niveau en Python
- API REST
- scripts et logiciel
- data visualisation
- pré étude via Notebooks Jupyter
- Bon niveau en Java
- Bonne connaissance de l’environnement container Docker (Kubernetes est un plus)
- Bonne connaissance de SQL et d’un système de SGBDr (PostgreSQL, MySQL)
- Connaissance des environnements cloud (VM, Containers)
- Connaissance de Git et travail en équipe
Vous avez une grande appétence pour les sujets exploratoires, les défis techniques et le monde de l’exploitation de la donnée.
Vous êtes rigoureux·euse, ouvert·e, très curieux·euse et adorez explorer et éprouver des nouvelles technologies.
Vous êtes passionné·e par votre formation, et aimez partager vos connaissances.
Vous êtes sensible aux problématiques liées à l’agilité, et souhaitez pouvoir allier des connaissances dans le domaine de la data à de nouvelles pratiques de développement.
Les plus
- Entreprise jeune en plein développement, acteur majeur du digital en Normandie ;
- Environnement de start-up innovant au savoir-faire reconnu à haute technicité ;
- Variété des projets et des missions, sur des champs techniques très variés ;
- Mise en situation de responsabilité rapidement ;
- Implication forte dans la croissance de l’entreprise ;
- Prise directe aux sujets opérationnels & business ;
- Facilités sur demande.
Process de recrutement
- Un pré-qualification avec notre Talent Acquisition Senior
- Un entretien avec un Référent Technique Métier
- Un challenge technique
- Un entretien avec notre CEO
Les avantages
- Missions à forte valeur ajoutée (uses cases stratégiques, complexité des sujets) et variées ;
- Environnement de travail agile et innovant ;
- Tickets restaurants Swile (valeur quotidienne unitaire 9,2 €) ;
- Travail en lien avec de nombreux métiers coeurs du numérique : UX Designer, développeurs Front/back/fullstack, DevOps, Data Ingénieurs, Data Scientists ;
- Possibilité de télétravail ;
- 50% de frais de participation pour les transports.
Stagiaire Data Ingénieur·e
- Stage
- Caen