La Harvard Business Review a le sens de la formule. La revue a décrit, en 2012 déjà, la figure de data scientist comme le «job le plus sexy du XXIe siècle». Description du métier: décortiquer, analyser et tirer des leçons des immenses quantités de données générées par la numérisation des entreprises. Selon le Swiss Job Index de Michael Page, en juin 2018, le gestionnaire des données occupe le deuxième rang des profils les plus recherchés en Suisse romande, derrière les spécialistes en transport et logistique. Cette demande a augmenté de 54,3% en un an.
«Il existe actuellement une demande très forte des entreprises, qui est en augmentation exponentielle depuis deux ou trois ans. Toute entreprise se réveille aujourd’hui en ayant besoin de personnel qualifié pour gérer ses données, remarque Olivier Verscheure, directeur exécutif du Swiss Data Science Centre (SDSC), un projet commun à l’EPFL et à l’EPFZ (lire encadré). L’expert estime que l’élément clé pour réussir la digitalisation d’une entreprise consiste à assurer une bonne communication entre les spécialistes des données et les équipes commerciales, pour éviter que ces dernières aient l’impression qu’elles seront à terme remplacées par des robots.
Raconter les données
«Le rôle des data scientists est d’extraire les données avant de les questionner, les interpréter et les visualiser, explique Luca Baldassarre, responsable en data science chez Gamaya, une start-up active dans l’agritech et basée à l’EPFL Innovation Park. Ensuite, ils doivent les modéliser avec une variété de modèles statistiques et de machine learning, avec un regard critique pour éviter des découvertes erronées. Finalement, ils doivent être capables de résumer leurs découvertes en récits convaincants et les déployer dans les infrastructures digitales existantes ou nouvelles.» Un travail complexe qui demande un mélange unique de talents: de fortes compétences en analytique et en statistique avec une solide pratique de génie logiciel.
Le data scientist doit avoir un large spectre de compétences pour traiter les données
Chez Plair, petite entreprise établie à Plan-les-Ouates (GE) et spécialisée dans la surveillance de la qualité de l’air, un data scientist doit avoir «un large spectre de compétences lui permettant de bien comprendre le type et la particularité de données qu’il traite, explique Svetlana Kiseleva, directrice du marketing et du développement des affaires. Il doit aussi savoir manipuler et mettre en place des algorithmes sophistiqués de machine learning et deep learning, le but étant de trouver une correspondance entre les valeurs mesurées et le type de microparticules présentes dans l’air.»
Pour Olivier Verscheure, les atouts et compétences d’un bon data scientist vont encore plus loin: «C’est un métier qui demande énormément de compétences pas seulement techniques – à la fois en maths et en systèmes – mais aussi humaines, de compréhension du business, des fonctions que chaque personne occupe dans une entreprise.» La digitalisation de l’économie représente un enjeu central pour de nombreuses sociétés, souvent accompagné d’appréhensions et de doutes. La personne qui joue un rôle clé dans ce virage se doit d’être également un fin communicateur.
Forte demande des étudiants
A l’EPFL, un nouveau cursus en data science a ouvert tout récemment, en automne 2017. Un cours de master de machine learning accueille 450 étudiants, ce qui est «énorme», selon Olivier Verscheure. A la Haute Ecole d’ingénierie et de gestion du canton de Vaud (HEIG-VD), la demande d’étudiants pour les disciplines de ce type a également connu une belle envolée. «J’enseigne un cours à option au niveau bachelor depuis 2005 sur la mise en application des techniques d’intelligence artificielle, expose Andres Perez-Uribe, responsable du groupe d’Intelligent Data Analysis. Chaque année, je devais faire de la pub afin de convaincre suffisamment d’étudiants pour que le cours soit donné. Depuis trois ans, l’intérêt est beaucoup plus marqué, l’effectif est passé de 30 à 52 étudiants cette année.»
La data science s’utilise dans de nombreux domaines scientifiques: chimie, physique, médecine personnalisée, sciences de l’environnement – les deux dernières sont très représentées au sein des écoles polytechniques – mais aussi dans le secteur de la consommation. Les enseignes de grande distribution utilisent des data scientists pour analyser les données liées aux habitudes de consommation des clients afin de proposer des offres les plus adaptées à leurs besoins. Tout comme les opérateurs de téléphonie mobile, qui conçoivent leurs nouvelles offres d’abonnement après avoir analysé les données à leur disposition. Ou encore les réseaux de transports publics, les banques, pour les aider dans leurs décisions, améliorer l’offre et réaliser des économies.
Dénicher la perle rare
Chez Plair, deux employés sur six sont actifs dans la data science. «Ils occupent un rôle particulier de transformateurs de données collectées par nos appareils à un format requis par nos clients, expose Svetlana Kiseleva. La plus grande plus-value d’un data scientist est l’opportunité d’élargir notre base clientèle. Sans analyse postérieure, les données de nos appareils ont uniquement de la valeur pour les experts qui possèdent des compétences poussées en physique des aérosols. Avec ces analyses, beaucoup plus de clients sont attirés et séduits par les avantages de nos produits.»
Comment ces entreprises s’y prennent-elles pour dénicher la perle rare? Chez Gamaya, établie sur le parc technologique de l’EPFL, la proximité avec les diplômés est un atout. «Nous exploitons notre réseau professionnel, qui inclut l’EPFL ainsi que d’autres universités européennes. Nous participons aux meet up, conférences de data science et de machine learning. Enfin, nous sommes présents sur LinkedIn», détaille Luca Baldasarre, responsable de la division Data science auprès de l’entreprise d’agritech. Notre mission est de rendre l’agriculture plus productive et durable, ce qui aide à attirer de nombreux data scientists qui cherchent à avoir un impact positif sur la société dans laquelle ils vivent.»
Svetlana Kiseleva, chez Plair, observe que beaucoup de candidats prétendent avoir des compétences de data scientist, parfois seulement parce qu’ils ont suivi quelques cours sur internet. «A chaque fois que nous avons un tel poste ouvert, nous recevons plus d’une centaine de dossiers de candidature. Les trier n’est pas une tâche facile.» Dans l’entreprise genevoise, le premier critère est le fait de pouvoir démontrer avoir une expérience et des compétences relatives à ces activités. L’équipe RH évalue aussi le niveau de qualification et de surqualification.
La Suisse en bonne position
Les recruteurs admettent aussi chercher le bon candidat à l’étranger. Chez Gamaya, on prospecte du côté de la France, de la Belgique, de l’Allemagne, entre autres. «En Suisse romande, il existe de nombreux scientifiques tournés vers la science des données, qui viennent par exemple de l’EPFL, du CERN ou d’autres instituts de recherche. Cependant, ils manquent souvent de fortes compétences en génie logiciel et d’expérience professionnelle, explique Luca Baldasarre. Je n’ai pas l’impression qu’il y ait de grandes différences entre les pays européens. Le défi est de trouver le bon mélange de compétences.»
Le taux de chômage dans ce secteur est extrêmement bas.
«La Suisse s’est réveillée au bon moment, en créant différentes filières de formation dans les hautes écoles techniques, avance Olivier Verscheure, directeur du Swiss Data Science Center. Les écoles de commerce et de business s’y mettent aussi, avec beaucoup de programmes différents.» Mais cela ne suffit pas. Si la Suisse se place globalement en bonne position dans le domaine, bénéficiant d’un aspect multidisciplinaire important, d’experts métier, se dotant de grosses machines et de logiciels de pointe, elle a aussi ses limites. La Suisse est en effet très prudente en matière de protection des données (lire encadré).
Pour les diplômés suisses qui finissent un cursus dans des disciplines qui se rattachent à la science des données cependant, pas besoin de s’expatrier. «Il me semble que la plupart de nos étudiants trouvent un travail en Suisse. Le taux de chômage dans ce secteur est extrêmement bas», témoigne Andres Perez-Uribe, professeur à la HEIG-VD. Reste que le fait de réussir à dégager une réelle plus-value pour l’activité de son entreprise en exploitant les données récoltées est une science complexe.
Pour Luca Baldasarre de l’entreprise Gamaya, «engager des hordes de data scientists n’est pas suffisant. La direction doit aussi bien connaître la pensée analytique et soutenir les efforts de la science des données dans toute l’entreprise. Sans une culture des données correcte, la perspicacité des data scientists risque de ne pas générer les résultats attendus.»
L’avancée de la science des données dépend aussi de l’environnement juridique
Le Swiss Data Science Center (SDSC) a été inauguré en février 2017. Structure conjointe à l’EPFL et à l’EPFZ, elle a pour vocation d’encourager le développement de la science des données en Suisse au niveau académique, en incitant les différents laboratoires du domaine des EPF à proposer des projets faisant appel à la science des données. Le SDSC apporte alors des ressources en personnel et en financement. Pour le moment, 18 projets de recherche sont en cours, en médecine personnalisée, sciences de l’environnement, cosmologie, économie, etc.
Dans l’industrie, le SDSC a amorcé une collaboration avec le groupe PSA (Peugeot-Citroën) et le groupe Bühler, basé à Uzwil (SG). Plusieurs autres groupes industriels sont en attente de signature. Par ailleurs, le SDSC développe une plateforme, RENKU, pour rendre la data science utilisable par des gens qui ne sont pas experts dans le domaine. Le but de la plateforme: améliorer le partage de données scientifiques d’un projet à l’autre, une pratique encore trop peu répandue à l’heure actuelle.
A noter que l’avancée de la science des données dépend aussi de l’environnement juridique. «La Suisse reste frileuse dans le partage de données personnelles, ce qui freine un peu le processus, dit Olivier Verscheure, directeur du Swiss Data Science Center. Il y a des pays où les données sont plus faciles d’accès qu’en Suisse: aux Etats-Unis, en Chine et en Inde notamment. La Chine a annoncé vouloir devenir leader en intelligence artificielle d’ici à 2030.» L’ouverture du Center for Digital Trust de l’EPFL il y a un an démontre l’importance que la Suisse accorde à la vie privée. Les études en matière d’humains connectés, de sciences de la vie, de médecine personnalisée sont un peu freinées à cause de cet environnement juridique très protecteur.
A lire aussi : L'avenir doré des étudiants en informatique