Normalis.Consulting

Contexte

Charles Cohen a débuté la programmation informatique à l’âge de 10 ans. Onze ans plus tard, il lance sa première application mobile, baptisée Bodyguard. Derrière une idée en apparence simple se cache une mission complexe : celle de protéger les internautes en temps réel contre le cyberharcèlement.

Mais pourquoi a-t-il choisi de relever ce défi ? Simplement car aucune application de ce type n’était alors disponible. Quant à la modération des différentes plateformes, elle ne se révélait pas suffisamment efficace.

« Je n’ai jamais été victime de cyberharcèlement à proprement parler, mais j’ai grandi avec les réseaux sociaux. J’ai pu observer les dégâts engendrés par la haine en ligne. Cette dernière entraîne une restriction de la liberté d’expression et c’est ce dont j’ai souffert durant mon adolescence. Voilà pourquoi je n’ai jamais osé créer sur Internet ou m’exposer publiquement, de peur de me faire harceler. »
Charles Cohen
CEO de Bodyguard

Le Défi

Être capable d’analyser le contexte dans lequel est formulé un commentaire, ainsi que de déterminer la ou les personnes à qui il s’adresse.

Il fallait que la technologie Bodyguard puisse saisir et interpréter les états d’espritUne couche d’intelligence artificielle était donc indispensable pour réduire les faux positifs (des contenus détectés comme haineux alors qu’ils ne le sont pas) et augmenter la précision.

« Cette technologie devait être capable de comprendre l’ironie, le sarcasme ou encore l’humour. Le modèle prédictifréalisé avec la plateforme de machine learning OVHcloud AutoMLm’a beaucoup aidé dans ce sens. »
Charles Cohen
CEO de Bodyguard

Le modèle prédictif devait également permettre à la technologie d’apprécier la relation qui unit deux individus. Par exemple, l’auteur d’un commentaire est-il « abonné » à la personne à laquelle il répond ? Ceci a nécessité de la recherche, ainsi que le croisement de plus de 80 métadonnées. Parmi celles-ci, figurent le temps de réaction après publication, le pourcentage de majuscules ou encore la photo de profil.

Pour ce projet innovant, il a aussi fallu trouver l’algorithme adéquat parmi ceux proposés par scikit-learn. Cette bibliothèque open source offre des algorithmes écrits majoritairement en Python, destinés au machine learning.

Enfin, dans le cahier des charges, il était question de précision. Le modèle prédictif à réaliser ne devait pas dépasser un taux d’erreur de 10 %.