Ingénieur système et sécurité H/F pour la plateforme d’IA Codalab

Type de poste : CDD

Publié le

Le Laboratoire Interdisciplinaire des Sciences du Numérique recrute un ingénieur en Bap E (informatique) H/F expert en infrastructure pour la plateforme de production de Codalab.

Missions

Nous vous offrons de rejoindre l’équipe dynamique qui gère et développe les plateformes de compétitions scientifiques (défis ou “challenges”) Codalab [instance publique de Codalab hébergée à Paris-Saclay] et Codabench [instance publique de Codabench hébergée à Paris-Saclay]. Les défis hébergés sur Codalab sont surtout des compétitions de Machine Learning et de Deep Learning, mais la plateforme est apte à héberger n’importe quels types de défi de programmation. Les codes soumis par les participants sont exécutés et évalués automatiquement sur la plateforme. Codalab a plus de 50000 utilisateurs, plus de 2000 compétitions (dont 800 nouvelles au cours des 6 derniers mois), et environ 600 soumissions par jour. Pour faire face à l’accélération de l’utilisation de Codalab, à l’enrichissement de son écosystème et au développement de nouvelles fonctionnalités de maintenance de l’infrastructure, nous recrutons un ingénieur système sécurité pour accompagner la croissance de Codalab et la maintenir en condition opérationnelle. Vous aurez l’occasion de proposer des solutions innovantes pour le passage à l’échelle du service, de rejoindre une petite équipe d’administration et de développement et de participer à l’organisation de compétitions académiques et industrielles dans le cadre de la chaire HUMANIA auquel le poste est rattaché. Ce sera pour vous une occasion de collaborer avec des chercheurs en Intelligence Artificielle et de vous frotter au Deep Learning et aux techniques d’automatisation du Machine Learning, et participer à un projet open-source à rayonnement international [project open-source dont Paris-Saclay est community lead]. Les technologies mises en œuvre évoluent en permanence pour rester au meilleur niveau et accompagner les outils de deep-learning du marché et les jeux de données.

Activités

  • Planifier, installer, automatiser, superviser et améliorer les processus de production sur le périmètre du projet.
  • Suivre l’utilisation des ressources par l’application en collaboration avec l’équipe des développeurs.
  • Sécuriser la production par des sauvegardes et la définition de procédures de Plan de Reprise d’Activité.
  • Gérer les évolutions et la maintenance des matériels, des logiciels et du système.
  • Gérer l’interconnexion de l’entité avec les réseaux extérieurs et la sécurité des accès des autres intervenants administrateurs de la plateforme.
  • Référencer et documenter les composants liés à l’infrastructure, aux logiciels et leurs liens avec la couche applicative en alimentant le wiki du projet.
  • Définir les configuration matérielles des extensions et suivre les achats.
  • Piloter l’administration de la plateforme et de l’ensemble de l’infrastructure: 4 serveurs de calcul, 20 GPU, un cluster de stockage et un parc de dizaines de machines virtuelles dans un cloud universitaire.
  • Assurer la veille technologique sur les différents aspects de l’infrastructure système et de communication (matériels, logiciels, architecture, protocole, mode de transferts).

Compétences

  • Architecture et l’environnement technique du système d’information: docker, serveurs web, API, micro-services, services de stockage objet (technologie Minio).
  • Bonnes connaissances en sécurité des sytèmes et des réseaux.
  • Familiarité avec les GPUs et les environnements de cloud computing.
  • Méthodes DevOps de mise en production en environnement virtualisé (proxmox, openstack).
  • Normes d’exploitation des systèmes Linux (Debian/Ubuntu).
  • Performance et métrologie (Prometheus, Grafana).
  • Diagnostic et résolution de problèmes.
  • Outils, normes et procédures de la qualité: système de gestion de version git.
  • Langage de programmation: python et bash scripting.
  • Anglais technique: langue du projet et de la communauté (documentation et réunions).

Savoir-être

  • Sens des responsabilités, du service, de la rigueur.
  • Aptitude au travail en équipe.

Contexte

Les serveurs sur lesquels s’appuie Codalab sont hébergés au LISN et au sein du mésocentre de l’université Paris-Saclay. Le LISN est un laboratoire de 400 personnes environ issu de la fusion du LRI et du LIMSILaboratoire d'Informatique pour la Mécanique et les Sciences de l'Ingénieur, créé en 1972 et dont les équipes ont rejoint celles du LRI en 2021 pour fonder le LISN.. Ses cinq départements couvrent un large spectre de thématiques scientifiques en sciences du numérique: sciences des données, interaction avec l’humain, algorithmes apprentissage et calcul, sciences et technologies des langues et enfin mécanique des fluides et énergétique.

La gouvernance de Codalab inclut des chercheurs de renommée internationale en France et à l’étranger.

Employeur: Université Paris-Saclay, CDD 12 mois

Rémunération selon diplômes et expérience: 2400 € à 3600 € bruts mensuels

Date limite de candidature: 31/10/2023

Candidature: faire parvenir CV et lettre de motivation à: anne-catherine.letournel@lisn.upsaclay.fr