Assistance by Daniel Rigby from the Noun ProjectÀ l’ère digitale, les collaborateurs de chaque entreprise produisent quotidiennement de grandes quantités d’informations textuelles : emails, documents, présentations, posts sur le réseau social de l’entreprise, etc. Ils utilisent également de nombreux outils numériques, qui contiennent de l’information hautement qualitative : application de CRM, outils de gestion de projets, de ticketing, etc…

Bien malheureusement, nous ne capitalisons pas suffisamment sur cette grande quantité d’informations : présente en trop grosse quantité, hétérogène & non catégorisée, l’information est laissée à l’abandon. Quand bien même elles seraient analysées, ces données diverses ne sont pas recoupées avec les données issues des systèmes d’informations traditionnels, trop souvent cantonnés à leurs silos verticaux et incapables de tirer partie de la masse d’informations générée chaque jour par les collaborateurs de l’entreprise.

Dans cet article, nous faisons un rapide tour d’horizon des diverses techniques cachées derrière l’expression Big Data, cette technologie protéiforme censée aisément exploiter une quantité massive d’informations hétérogène. En démystifiant les termes, nous espérons montrer comment les Ressources Humaines peuvent tirer partie du numérique pour dénicher les talents cachés de leurs collaborateurs.

Donner du sens au texte

Présentés face à la collection complète des ouvrages d’Émile Zola, nous aurions quelques difficultés à identifier en moins d’une seconde les grands thèmes et questions de société abordés par l’auteur durant sa carrière d’écrivain. C’est pourtant l’objectif de l’analyse sémantique, qui cherche à donner du sens à un texte en extrayant les concepts importants tout en ignorant les mots ne portant pas de sens tels que « le », « la » ou « de ». Une analyse sémantique construit ce que l’on appelle un réseau sémantique, qui relie les différents concepts entre eux. Il est alors possible de constituer une carte virtuelle permettant de savoir quelles informations sont reliées, dans quels document elles sont mentionnées, comment les paragraphes s’articulent entre eux, afin d’extraire les concepts principaux d’un document.

Google Knowledge Graph

Ces principes sont au cœur du knowledge graph de Google, qui extrait des informations de milliards de pages webs & relie les concepts entre eux.

Vous pouvez également avoir entendu parlé de thésaurus ou d’ontologies. Ils relient également les concepts entre eux en indiquant les synonymes, les antonymes, les concepts reliés… mais ils sont bien souvent construits par des personnes qualifiées, et non une machine. Une ontologie doit alors être préparée à l’avance si l’on veut pouvoir l’utiliser, alors qu’une analyse sémantique a pour objectif d’extraire dynamiquement les concepts d’un texte, peu importe sa provenance ou les thèmes abordés. En revanche, il est pertinent d’effectuer une analyse sémantique d’un texte en utilisant une ontologie pré-établie si l’on connait par avance le thème abordé dans le texte : les résultats n’en seront que plus précis.

Les applications dans le domaine des ressources humaines ont trait à la détection de compétences insoupçonnées : détection des sujets principaux abordés par les collaborateurs sur le réseau social d’entreprise ou encore détection des principaux experts sur un sujet particulier en analysant le contenu des documents Word ou Powerpoint qu’ils produisent au jour le jour.

Explorer une masse de données

Si certaines données sont textuelles, d’autres sont de nature plus diffuse.

Par exemple, l’utilisation d’un outil de CRM produit du texte, tel le compte-rendu d’un rendez-vous téléphonique, mais également d’autres données : types de clients adressés par le collaborateur, fréquence d’utilisation de l’outil, méthode de prédilection de prise de contact avec un prospect, etc.

Visualisées de manière unitaire, il sera difficile de leur donner du sens. En revanche, une approche basée sur le data mining permettra d’en extraire des caractéristiques et des structures intéressantes, qui produiront à des connaissances métier.

Data Mining

Le cœur du data mining est la découverte de structures cachées dans les données à travers de nombreuses techniques mathématiques. Par exemple, la classification a pour objectif de créer des classes de données, c’est-à-dire d’identifier des groupes de données similaires. On pourra choisir d’appliquer une classification supervisée, non supervisée ou plus communément semi-supervisée. Appliquée à la reconnaissance d’image, cela permet par exemple de détecter toutes les images d’une même personne ou d’un même bâtiment ; appliquée aux ressources humaines, cela permet de regrouper les collaborateurs exprimant les mêmes savoirs et savoir-faire, permettant ainsi de mettre à jour une fiche de poste pour un « chef de projets marketing » en fonction des comportements réels des collaborateurs occupant actuellement le poste… ou alors de proposer des offres de mobilité interne aux personnes qui expriment chaque jour les compétences en adéquation avec ce poste.  Une fois cette classification effectuée, il sera également possible de détecter les profils inclassables, les perles rares, les profils atypiques au comportement singulier. Pour une vue d’ensemble, nous recommandons la lecture de la Literature Survey de Xiaojin Zhu ainsi que l’article Machine Learning in Automated Text Categorization de Fabrizio Sebastiani, qui traite plus généralement de machine learning appliqué la classification de textes.

Plus complexes encore, les méthodes prédictives tentent de prédire un comportement futur en se basant sur la masse de données déjà collectée. Ces méthodes sont notamment utilisées par les publicitaires pour décider quelle publicité afficher. Les ressources humaines peuvent y trouver un grand intérêt, en proposant de manière proactive des formations aux collaborateurs en s’appuyant sur une analyse globale des formations proposées au sein de l’entreprise mais également sur une compréhension fine du collaborateur, de son mode de travail & de ses attentes. De même, des propositions de mobilité interne adéquates et personnalisées peuvent voir le jour, en projetant le profil du collaborateur sur des trajectoires professionnelles potentielles.

Représentation d’un réseau social

Enfin, la théorie des réseaux et les méthodes d’analyse des réseaux sociaux permettent d’extraire de nombreuses informations utiles au collaborateur, au manager et à l’organisation. Par exemple, les traces d’utilisation d’emails permettent de créer un réseau social, au sens mathématique du terme : deux collaborateurs seront reliés par une connexion dans ce réseau s’ils ont communiqué par email durant une fenêtre temporelle précise. Pour plus d’informations, nous conseillons la lecture de The structure and function of complex networks par M.E.J. Newman, qui constitute une excellente vue d’ensemble des thèmes de recherche liés à la science des réseaux. La création d’un tel réseau permet alors de détecter les personnes clés de l’organisation : celles qui sont le plus à même de transmettre une information importante rapidement dans l’entreprise. Il est également possible de détecter les goulots d’étranglement qui ralentissent la transmission de l’information, détecter des synergies entre équipes jusqu’alors insoupçonnées, détecter des groupes d’intérêts ou des groupes d’experts qui pourront recevoir le soutien de l’entreprise, etc.

Chez 365Talents, nous tirons partie de la technologie Big Data afin de détecter au quotidien les talents « cachés » des collaborateurs en combinant ces différentes techniques mais surtout en laissant chaque collaborateur maître de ses données individuelles : Il s’agit pour nous d’une condition sine qua non à une application pertinente et éthique de la technologie Big Data aux Ressources Humaines. N’hésitez pas à nous contacter pour en savoir plus !