Kitware is hiring a

Stage en vision par ordinateur - Développement d’une plateforme d'annotations de Machine Learning open source sur données 3D massives

Lyon, France
Internship
Candidatures ouvertes pour un stage débutant en février 2024

ParaView est un logiciel libre dédié à la visualisation scientifique permettant d’explorer des données issues de différents domaines (simulation, expériences, mesures…) et de leur donner un sens graphique. L’une de ses forces réside dans sa capacité à charger et traiter des données très volumineuses. LidarView est la déclinaison de ParaView spécialisée dans la visualisation de données LiDAR, rajoutant notamment une interface pour d’autres capteurs ( notamment caméra).

L’annotation de données est une étape nécessaire pour tout entraînement supervisé machine learning. Mais l'utilité des plateformes d’annotations est aujourd’hui plus étendue car elles permettent notamment d'améliorer les performances des réseaux entraînés ou d'être utilisés à des fins de validation d’algorithmes.
Parce que l’annotation est une étape qui demande du temps, il est nécessaire d’assister l’utilisateur par le biais d’outils algorithmiques spécifiques. L’interface se doit d'être intuitive et simple, et pouvoir gérer à l'échelle de grande données (type point cloud massif ou imagerie satellitaire).

Le.a candidat.e sera directement intégré.e à notre équipe d’ingénieurs et participera activement au développement d’une application permettant :

  • D’annoter des zones d'intérêt sur données 3D (voire multi-modales) basé sur l’application LidarView, et les enregistrer dans un format exploitable (KITTI, COCO…) pour des applications de détection et segmentation sémantiques. Il contribuera alors à créer la première application open source permettant de générer des annotations sur des données massives 
  • D'accélérer et superviser les annotations de l’utilisateur, notamment par le biais d’algorithmes automatiques qui pourront être basés sur des modèles par apprentissage non-supervisé (Segment Anything) ou classiques (contours actifs), voire des méthodes de tracking
  • De déclencher l'entraînement de réseaux de deep learning sur des données 3D. Le modèle de l’application open source MONAI Label pourra être pris en exemple pour la gestion des pipelines
  • D'améliorer les performances de modèles ainsi entraînés par des stratégies d’apprentissage actifs

  • Les développements réalisés en ce sens pourront être étendus sur Paraview. Dans un second temps, ces développements pourront être rendus disponibles via une interface web par le biais du framework trame

Les principales étapes du stage seront :

  • Etat de l’art de l’annotation 2D/3D pour des applications d’apprentissage machine, ainsi que des plateformes existantes ( CVAT, FiftyOne , MONAI Label…)
  • Compréhension de l’environnement dans lequel le projet s'inscrit et définition des attendus de l’application
  • Mise en place de l’interface utilisateur de l’application
  • Accélération du temps d’annotation manuel par supervision algorithmique
  • Mise en place d’une pipeline d'entraînement / d’inférence sur des données 3D 

  • Les développements seront principalement réalisés en C++ et permettront de contribuer à une application cross-plateforme s'exécutant sous Windows, Linux ou MacOS.

Compétences requises

  • Bonnes connaissances en C++
  • A l’aise dans la communication en anglais à l’écrit et à l’oral

Compétences appréciées mais non obligatoires

  • Notions de CMake, VTK, paraview plugin
  • Connaissances en python
  • Connaissances en traitements de nuages de points 
  • Connaissances en Machine Learning / Intelligence Artificielle

  • Niveau école d'ingénieur 4ème année minimum ou Master 2

Ce stage d’un minimum de 5 mois se déroulera dans les bureaux de Kitware à Villeurbanne. (France).

Description de la société
Kitware est une entreprise à taille humaine qui  se mobilise pour avoir un grand impact sur le monde. 
Ses collaborateurs s'investissent au quotidien pour faire progresser la science et la technologie afin de favoriser l'innovation mondiale et résoudre les défis mondiaux. Cela est possible en développant des plateformes logicielles open source innovantes et en faisant en sorte de les intégrer autant que possible dans des solutions logicielles open source et en contribuant directement à l'open science dans un esprit collaboratif.

Nous fournissons des services commerciaux à des sociétés allant des startups aux sociétés du CAC 40. Kitware utilise un modèle commercial de services autour de ses solutions open source pour développer des communautés collaboratives étendues et fournir des solutions techniques flexibles et de grande qualité. Si vous avez utilisé CMake, ITK ou VTK, Paraview ou LidarView, vous connaissez notre travail et son impact sur les communautés que nous aidons à créer.

This job is no longer available

Enter your email address below to get notified whenever we find a similar job post.

Unsubscribe at any time.