Cette offre n’est plus disponible.

Stage data ingénieur·e

Stage(4 à 6 mois)
Caen
Salaire : Non spécifié
Début : 31 janvier 2022
Télétravail fréquent
Éducation : Bac +5 / Master

JAKALA
JAKALA

Cette offre vous tente ?

Questions et réponses sur l'offre

Le poste

Descriptif du poste

SoyHuCe est à la recherche d’un·e stagiaire data ingénieur afin de rejoindre une entreprise cliente et participer à la consolidation et aux évolutions des applicatifs.

Descriptif du stage

En tant que stagiaire Data Engineer chez SOYHUCE, vous évoluerez au sein d’une équipe d’une vingtaine de développeurs, ingénieurs en science des données, algorithmiciens, intégrateurs et graphistes.

Sujets du stage :

Sujet 1 : Architecture logicielle orientée ETL

Au sein de l’équipe de data ingénierie de SOYHUCE votre rôle sera :
D’étudier et de cartographier des données d’exploitation internes ou clients
De participer à la conception d’une architecture data permettant d’extraire, de transformer, de stocker et de restituer la donnée pour data visualization ou data science (composant logiciel, architecture cloud, coût et ROI)
De vous former en concevant et en réalisant des briques logicielles pour l’implémentation d’une architecture data
D’effectuer une veille technique et réaliser une preuve de concept, à travers les outils Big Data nouvellement intégrés, sur des sujets de traitement de données
De réaliser une documentation technique d’une solution data et présenter à l’équipe data SOYHUCE ses résultats
De participer à la mise en production d’une architecture data sur un environnement cloud (AWS)

Sujet 2 : Architecture Lambda Big Data

Accompagnement sur la mise en place d’une architecture Lambda (Gestion temps réel et batch) sur une plateforme Cloud.

Stacks techniques :

  • VM (AWS EC2, OVH VPS)
  • Kafka
  • Kafka Connect (Java)
  • Akka Streams (Java, Scala)
  • Python
  • Warp 10
  • Docker

D’autres sujets d’intérêt pourront être ajoutés en fonction des attentes et des capacités du stagiaire.

Notre stack Data Ingenierie:

  • Langages de programmation
  • Python 3
  • Java 11+
  • Shell & Makefile
  • Stockage des données:
  • PostgreSQL
  • AWS S3 (Stockage des données objets)
  • CouchDB (Base de données NoSQL Orientée Document)
  • Warp10 (Base de données séries temporelles)
  • Ecosystème Data:
  • Kubernetes
  • Messages Broker (RabbitMQ, Kafka)
  • Environnement Cloud
  • AWS (EC2, EKS, ECS, …)
  • GCP

Profil recherché

Compétences attendues:

  • Bonne connaissance dans le développement logiciel
  • Bon niveau en Python
  • API REST,
  • scripts et logiciel,
  • data visualisation,
  • pré étude via Notebooks Jupyter
  • Bon niveau en Java
  • Bonne connaissance de l’environnement container Docker (Kubernetes est un plus)
  • Bonne connaissance de SQL et d’un système de SGBDr (PostgreSQL, MySQL)
  • Connaissance d’un message Broker (Kafka, RabbitMQ) serait un plus
  • Connaissance des environnements cloud (VM, Containers)
  • Connaissance de Git et travail en équipe

Vous avez une grande appétence pour les sujets exploratoires, les défis techniques et le monde de l’exploitation de la donnée.

Vous êtes rigoureux·euse, ouvert·e, très curieux·euse et adorez explorer et éprouver des nouvelles technologies.

Vous êtes passionné·e par votre formation, et aimez partager vos connaissances.

Vous êtes sensible aux problématiques liées à l’agilité, et souhaitez pouvoir allier des connaissances dans le domaine de la data à de nouvelles pratiques de développement.

Envie d’en savoir plus ?