Parcourir les annonces Parcourir les étudiants Publier une annonce Ajouter un CV

STAGE – KILOWATTSOL – Reconstruction et visualisation d’un arbre de modification de documents non structurés

Rémunération
N/C
Lieu

14 rue Rhin et Danube F-69009 Lyon

Date de début
N/C
Date de fin
N/C

Kilowattsol, spin off du laboratoire LGCB - CNRS, a été créée en 2007, et fait suite à 10 ans de recherches scientifiques sur l’énergie solaire. La société est un des premiers conseillers techniques européens indépendants dans le domaine de l’énergie solaire et du stockage, à l'expérience mondiale. Plus de 2000 projets photovoltaïques (PV, CPV et stockage) ont été évalués depuis 2007 sur 5 continents, représentant plus de 10 GWc cumulés. Elle intervient comme expert indépendant dans la négociation de grands projets. KiloWattsol conseille les plus grandes banques et fonds d’investissement européens pour le financement de projets ainsi que les banques de développement internationales. Le rôle de kiloWattsol est d’encadrer les risques liés au climat et à l’architecture des projets solaires partout dans le monde. Son format de Due Diligence Technique est accrédité par les leaders du financement structuré européens.

Contenu du stage

Contexte

Dans le cadre de son activité, kiloWattsol est amené à traiter un volume important de documents fournis par ses clients sous forme de data room , i.e. un ensemble de documents aux formats divers, parfois non classés et contenant de l’information redondante.

L’une des redondances possibles est la présence de différentes versions du même document. Dès lors, le seul document pertinent est la dernière version. Il s’agit donc de trouver une méthode permettant d’identifier les différentes versions d’un document, et de recréer, a posteriori , la traçabilité du document.

L’objectif du stagiaire

À partir d'un ensemble de documents non structurés ( i.e. en "langage naturel") en texte brut, il s'agit de (i) reconnaître les fichiers étant différentes versions d'un même document, (ii) à partir de ces différentes versions reconstruire un historique de versions et (iii), offrir une visualisation de cet historique de version.

Les trois étapes de ce travail font appel à des savoir-faire différents et sont à conjuguer avec l'expertise métier déjà présente chez kiloWattsol pour faire un outil spécifique.

L'étape (i) demande des connaissances en traitement du langage naturel et analyse de données, (ii) requiert la connaissance d'algorithmes de graphe, et (iii) demande des notions de data visualisation et un travail de pair avec les utilisateurs du futur outil. Les trois étapes nécessitent toutefois une solide connaissance en algorithmie et en développement Python.

Au vu de la variété des tâches, nous cherchons donc un ·e étudiant ·e polyvalent ·e, apte à prendre en main des sujets variés, et à s'approprier différents sujets rapidement.

Déroulement du stage

Il s'agira donc de (i) faire un état de l'art sur les métriques pertinentes à la tâche, (ii) mettre en place des modèles prototypes répondant à cette tâche et (iii) mettre en place une procédure d'évaluation de ces modèles.

Profil recherché

Qualités académiques

  • Développement Python + numpy + matplotlib
  • Prototypage rapide
  • Lecture de papiers académiques
  • Une connaissance des méthodes de NLP et de la librairie Torch est un plus

Qualités personnelles

  • Rigueur
  • Polyvalence, aisance à s’approprier les sujets

Envoyez CV+LM par mail à l’adresse candidature@kilowattsol.com

Site internet : www.kilowattsol.com

Vous devrez avoir ces compétences :


Editer