Biais des algorithmes de recommandations musicales: les fans de métal moins bien servis.
Les algorithmes de recommandations musicales sont devenus incontournables dans les services de streaming comme Spotify, Deezer ou Last.fm et assistent les utilisateurs dans la navigation au sein des catalogues de musiques qui leur sont offerts. Si les utilisateurs les plus conventionnels de musique populaire sont traditionnellement bien servis par ces algorithmes, les utilisateurs intéressés par les musiques plus confidentielles dites «underground» reçoivent de leur côté des recommandations nettement moins pertinentes et qualitatives.
Une étude autrichienne du laboratoire Know-Center GmbH de l’Université Technologique de Graz s’est intéressée aux caractéristiques des musiques underground et de leurs auditeurs, et a analysé comment ces caractéristiques influençaient la qualité des recommandations effectuées par les algorithmes.
L’équipe a créé un jeu de données basé sur un historique d’environ 4000 utilisateurs de Last.fm, la moitié écoutant des musiques populaires et mainstreams, l’autre moitié amateurs de musiques underground. Ce jeu de données a été enrichi avec des méta-datas décrivant les morceaux écoutés et leurs auditeurs.
Les auteurs ont alors utilisé un modèle computationnel pour prédire comment les utilisateurs pourraient apprécier les recommandations effectuées par quatre algorithmes différents de recommandations bien connus et hébergés sur des plateformes. Le premier résultat obtenu confirme que les utilisateurs appréciant les musiques populaires étaient effectivement mieux servis que les utilisateurs de musique underground.
Les auteurs ont alors utilisé un algorithme de clustering dont l’analyse a montré l’existence de quatre groupes distincts au sein du groupe d’amateurs de musiques underground, avec des différences non seulement basées sur leur style de musique favorite, mais aussi sur leurs caractéristiques socioprofessionnelles et démographiques.
Le premier groupe était ainsi composé d’amateurs de musiques acoustiques et folk, le second des amateurs de musiques « hautes énergies » comme le métal, le troisième d’amateurs de musiques d’ambiance sans chants, et enfin le dernier groupe composé d’amateurs de musiques électros.
Au sein du groupe underground, le sous-groupe d’utilisateurs « haute énergie » semblait recevoir les recommandations musicales les moins pertinentes de la part des quatre algorithmes, et ceux qui écoutaient principalement de la musique d’ambiance semblaient recevoir les recommandations les plus précises.
Le biais algorithmique constaté est donc vraissemblablement un biais lié à la culture, la structure et l’organisation du sous-groupe d'utilisateurs considéré, plus qu'un biais du à un manque de données, ou au fait que les musiques écoutées soient underground et moins populaires (puisque trois autres groupes underground ont des résultats beaucoup plus satisfaisants que le dernier, avec le même protocole et les mêmes algorithmes..)
Les auteurs suggèrent que leurs résultats pourraient aider à la création d'algorithmes de recommandation musicale basés sur la culture et la sociologie des groupes (et, par exemple, sur les travaux de Hofstede) afin de fournir des recommandations plus précises aux auditeurs de musiques underground.