L’écoute automatique et le panacousticon
 

2022  ·  Impression  ·   Machine Learning

L’émergence d’appareils intelligents dotés d’un microphone dont l’utilisation devient toujours plus ordinaire demande un examen actualisé. Une surveillance auditive s’organise au sein même de nos espaces acoustiques depuis des infrastructures numériques dont le fonctionnement, obscur, impénétrable, nous est délibérément dissimulé. 

Les usages de ces technologies paraissent assez bénins à première vue, mais j’ai voulu explorer plus en détail ce qu’entraînait cette mise sous écoute permanente des machines, qualifiée de panacoustique par le philosophe français Peter Szendy. 

Le domaine rendant cette écoute machinique possible est décrit sous le terme anglophone de Machine Listening, qui pourrait être traduit par “écoute automatique”. Le Machine Listening décrit un champ interdisciplinaire et en fort développement de la science et de l’ingénierie qui utilise le traitement du signal audio et l’apprentissage automatique, pour tirer du sens des sons et des paroles. C’est ce qui nous permet à la fois d’être “compris” par Siri et Alexa, ou de reconnaître un morceau de musique avec Shazam. Pour ma part je me suis intéressée plus particulièrement, non pas à la reconnaissance vocale, mais à ces technologies qui permettent d’écouter nos environnements sonores et d’en tirer du sens. Ces technologies se déploient commercialement sous forme de logiciels intégrables dans des caméras de surveillance, des assistants vocaux, des smartphones.
J’ai tenté de rendre visible les rouages qui se cachent dans ces nouveaux outils de reconnaissance sonore, tout en essayant d’interpeller le spectateur sur ses usages, en me confrontant moi-même à cette écoute algorithmique permanente. 

Ces dispositifs arrivent dans notre quotidien, sur le marché des smartphones, des assistants vocaux ou de la maison connectée. Ils arrivent dans nos villes en toute discrétion, prenant place tant dans nos espaces privés que publics. Les gouvernements récoltent des données à des fins de sécurité et de contrôle ; les entreprises privées à des fins marketing, d’individualisation des offres, d’amélioration de leur gestion. Mais les entreprises privées commencent à s'intéresser à la sécurité et au contrôle, venant brouiller les infrastructures d’État et d’entreprise. Il faut selon moi dévoiler ces dispositifs, les démystifier afin de pouvoir les replacer dans le débat public.





Ce projet a été exposé au Centre de Création Contemporaine (CCOD) de Tours lors de l’exposition U.S.B #6 nous vivons à la lisière, du 24 mars au 21 mai 2023,

À l’ESAD Orléans pour l’exposition U.S.B #3 ∙ Void draw () {Carte blanche aux diplômé∙es 2022}, du 17 nov. au 01 déc. 2022.

Photo : Paul de Lanzac
Photo : Paul de Lanzac
Pour mes recherches sur les logiciels de reconnaissance sonore, je ne voulais pas simplement utiliser des services clé en main, mais essayer de comprendre le fonctionnement interne de ces technologies, qui sont de plus en plus complexes et auxquelles on a très difficilement accès, en pratiquant une forme de rétro-ingénierie. J’ai donc utilisé un programme de reconnaissance sonore en open-source, dont le code a été publié sur GitHub. Le programme en question s’intitule : Large-Scale Pretrained Audio Neural Networks for Audio Pattern Recognition

Étant plutôt novice dans le domaine de la programmation, j’ai eu la chance d’être accompagnée par Simon, médiateur numérique à la Labomedia, association située à Orléans qui étudie précisément les champs de l’art numérique et des technologies. Tous les jeudis pendant un peu plus d’un mois, je me suis rendue dans leurs bureaux afin de faire fonctionner le code. Ce logiciel permet d’analyser un fichier audio en listant tous les sons reconnus par ordre d’apparition et par taux de reconnaissance. 

Comme première expérimentation, je me suis enregistrée toute une journée, de 9h à 19h, à l’aide d’un microphone dissimulé dans la poche de ma veste. J’ai ensuite soumis cet enregistrement au programme de reconnaissance sonore. 

Le programme a reconnu une variété impressionnante de sons. Certains d’entre-eux traduisent le rythme de ma journée : presque toutes les heures et demi-heures, le son de la cloche de la cathédrale d’Orléans est reconnu sous l’étiquette “Church bell”; “Bell” et “Jingle bell”. Le bruit de mes clés transcrit l’entrée ou la sortie de mon domicile. Les bruits de portes expriment que j’entre ou sors d’une pièce. La catégorie “Speech” suggère la fréquence de mes interactions sociales. 

J’ai décidé de traduire le résultat de ces enregistrements dans une impression monumentale sur laquelle figure seulement 3h d’analyse sonore. Des loupes sont à disposition afin de lire ces tout petits caractères et, peut-être, imaginer quels sons ont peuplés ma journée. 


Photo : Paul de Lanzac
Exposition U.S.B #3 ∙ Void draw () {Carte blanche aux diplômé∙es 2022}, Galerie de l’ÉSAD Orléans,  17 nov. - 01 déc. 2022  

Photo : Communication ESAD Orléans