Automatisation des commentaires de dégustation fournis par les consommateurs
L’avis des consommateurs intéresse de plus en plus les entreprises agroalimentaires (moins cher et plus représentatif qu’un panel expert). Toutefois, l’analyse automatique de commentaires reste encore peu explorée et se fait aujourd’hui manuellement. Ce projet pluridisciplinaire vise à trouver un processus d’automatisation intégrant des difficultés telles que le traitement de phrases comme «vin très acide mais peu amer» ou «vin présentant une belle acidité et une amertume rafraichissante». Le traitement automatique des négations et la reconnaissance de la polarité des termes en fonction de leur environnement apparaissent comme les principaux défis à relever pour proposer un outil utile dans le domaine du marketing et de l’analyse sensorielle.
Plusieurs étapes ont été mises en place durant le temps du projet.
- Un grand nombre de commentaires de dégustation issus de professionnels et de consommateurs ont été recueillis via la plate-forme Mondovino (Coop) et diverses bases de données.
- Deux ontologies du vin regroupant plus de 2’225 termes distincts en français et 425 termes distincts en anglais ont été créées afin de hiérarchiser et standardiser les termes et concepts du vin.
- Les méthodes de langage naturel ont été appliquées et développées au moyen de plusieurs algorithmes d’apprentissage profond (deep machine learning) pour analyser l’information contenu dans les commentaires recueillis.
- L’approche développée a été entrainée et testée sur plus de 1000 commentaires de dégustation recueillis lors de tests consommateurs et labélisés par nos soins.
L’optimisation des algorithmes de machine learning appliqués au traitement de langage naturel (NLP) a montré une nette amélioration quant à l’extraction des concepts contenus dans les commentaires de dégustation, résultats supportés par des métriques classiques de machine learning. De même, la création d’une ontologie du vin conséquente et son implémentation continue permet à la fois d’améliorer l’extraction automatique mais également de diminuer la variabilité d’un traitement manuel.
Si aujourd’hui l’ontologie du vin est conséquente en français, celle en anglais mériterait d’être complétée faute de matériel disponible à la fin de ce projet. Bien que spécifique au secteur du vin, son processus de construction et l’utilisation seront transposables à tout autre domaine touchant l’avis de consommateurs (p.ex. tourisme, agro-alimentaire). La valorisation de ce projet va se poursuivre dans les prochains mois avec la publication d’articles. Une plateforme de démonstration a été mise à disposition en ligne pour valoriser les résultats.
Valorisation
REBENAQUE P., GHORBEL H., ALBERTETTI F., VAN GYSEL L., DANTHE E., DENEULIN P., Does automated analysis of open comments from consumers allow us to get relevant results to understand their preference? PANGBORN 2019: 13th Pangborn Sensory Science Symposium, 28 juillet – 1er août 2019, Edimbourg, Ecosse (PDF)
2016 – 2018
Partenaires: Haute Ecole Arc
Financement de la partie effectuée par Changins: HES-SO