TL;DR; Mission principale du stage
Pour améliorer notre produit, tu devras identifier et tester la meilleure approche permettant de modéliser efficacement les bases de données relationnelles.
Une fois identifiée et validée, cette approche sera alors ensuite intégrée au produit (avec l’ensemble de l’équipe).
Contexte
Nous avons la chance de travailler sur un sujet très innovant et d’être souvent confrontés aux limites de l’état de l’art. Une grande curiosité et appétence pour la technologie est donc nécessaire.
Nous sommes une équipe motivée par l’envie d’apprendre et de se confronter à des problématiques techniques complexes pour lesquelles il n’y a pas de solutions existantes.
Compte tenu du contexte technique nous nous appuyons beaucoup sur Python.
Plus de détails sur l’entreprise et la technologie existante sur https://octopize.io et https://docs.octopize.io
Tes responsabilités
Le produit modélise déjà les bases de données relationnelles. L’objectif du stage est de compléter l’approche existante. Le point d’amélioration attendu est vis-à-vis des tables “ordonnées”, c’est-à-dire de tables où les lignes sont liés entre elles et que l’ordre est important. Notre enjeu est de permettre de conserver l’ordre de celles-ci tout en garantissant la confidentialité.
Il sera donc attendu du candidat de chercher, identifier puis tester des approches permettant de modéliser ces liens.
Pour ce faire tu devras donc réaliser:
Recherche / Etude bibliographique : Faire de la bibliographie sur les méthodes existantes pouvant s’appliquer sur des données ordonnées (Construction de graphes orientés, process mining, propagation des features, machine learning, …)
Tests / POC : Suite à l’étude, une sélection des solutions sera à implémenter afin de valider la faisabilité technique de ces solutions.
Industrialisation : Si la solution construite répond au besoin et a prouvé une bonne performance, tu pourras participer a son implémentation dans le produit Avatar avec les équipes techniques.
Cette offre s’adresse à des profils junior et nos attentes seront donc ajustées en conséquence. Veuillez noter que le niveau en Python est un pré-requis.
Tu disposes de solides connaissances en statistiques et projection de données (PCA, FPCA, MCA, AFMD, UMAP, TSNE).
Tu as déjà construit des modèles ML prédictifs.
Tu as de l’expérience en développement Python : tu as notamment déjà travaillé avec des librairies telles que `polars`, `dask`, `pandas`, `sklearn`, etc.
Tu sais travailler en ligne de commande, avec Git et dans un environnement de type Linux.
Tu fais preuve d’esprit d’équipe et tu t’efforces de promouvoir un environnement d’entraide et d’apprentissage continu.
Tu as déjà rédigé des rapports nécessitant clarté dans l’expression et rigueur dans l’approche scientifique.
Tu apportes beaucoup d’attention à ta communication.
Tu es capable d’avoir une communication technique en Anglais à l’écrit et à l’oral.
Si tu disposes de ces compétences, ce sera considéré comme un plus :
Data visualisation
Programmation fonctionnelle
Développement back-end
Passion pour la cybersécurité
Nous accueillons volontiers les profils autodidacte et en reconversion.
Visio pour te présenter Octopize, décrire nos enjeux, le rôle proposé, répondre à tes questions, et décider ensemble de continuer le process (30 min)
Aperçu de tes contributions open source ou exercice technique pour mieux cerner tes compétences
Visio technique (1h) pour itérer sur tes contributions ou ton exercice et te faire un retour un interactif
Entretiens sur site (Rencontre informelle avec l’équipe, Pair programming, rencontre avec le CEO)
Nous pouvons bien sûr nous adapter en fonction des profils. N’hésite pas à nous faire part de ton retour sur ce point.
Rencontrez Morgan, Data Scientist
Rencontrez Gaël, Data Engineer
Ces entreprises recrutent aussi au poste de “Données/Business Intelligence”.