L’intelligence artificielle redonne vie à la voix du chanteur Karel Gott

Mort le 1er octobre 2019, le chanteur Karel Gott reste une star en Tchéquie. Tant et si bien qu’à l’occasion de son centenaire, la Radio tchèque a imaginé le projet de recréer sa voix grâce à l’Intelligence Artificielle, en collaboration avec l’Université de Bohême de l’Ouest à Plzeň et la société SpeechTech.

« L’idée d’origine était qu’à l’occasion du 100e anniversaire de la Radio tchèque, nous ne voulions pas nous tourner uniquement vers le passé, mais créer un projet tourné vers l’avenir. L’intelligence artificielle s’est donc tout naturellement imposée. Et ce qui fait la particularité de la radio, c’est la voix, c’est ainsi que le projet a vu le jour, » résume le directeur des programmes de la Radio tchèque, Ondřej Nováček.

GOTT NAVŽDY

L'autobiographie de Karel Gott | Photo: ČRo

Dans les dernières années de sa vie, le chanteur Karel Gott a rédigé son autobiographie. Il a disparu avant d’avoir pu la voir publiée, et ses fans n’ont pu la découvrir en librairie que plus d’un an et demi après son décès. Aujourd’hui ceux-ci peuvent désormais réécouter leur idole grâce à l’intelligence artificielle : pas sous forme de chant, comme pour la recréation de la voix de John Lennon dans le tout dernier disque des Beatles annoncé récemment, mais sous forme parlée, pour découvrir des extraits sonores de cette autobiographie. Producteur artistique à la Radio tchèque, Lukáš Sapík détaille :

Lukáš Sapík | Photo: ČRo

« Lorsque nous avons décidé de réaliser ce projet, nous cherchions du matériel que nous pourrions traiter de cette manière. C’est ainsi qu’est née l’idée d’utiliser l’autobiographie d’une personne très connue qui avait un lien étroit avec la Radio et qui, en même temps, n’était plus de ce monde, de sorte qu’il ne pouvait pas lire lui-même l’autobiographie avec sa vraie voix. »

Karel Gott | Photo: Martin Kutil,  ČRo

En effet, Karel Gott a collaboré avec la Radio tchécoslovaque, puis tchèque, pratiquement depuis le début de sa carrière. Ses premiers enregistrements radiophoniques remontent au début des années 1960. Il est même devenu présentateur radio au tournant du millénaire. De 2011 à 2015, il a même animé sa propre émission, sur la station Dvojka, et à la rédaction française, on se souvient même avoir reçu un jour le coup de fil de la production demandant « pour M. Karel Gott » quelle était la prononciation correcte de quelques mots français qu’il devait dire au micro.

C’est peu dire qu’il existe dans les archives de la Radio tchèque une quantité d’enregistrements de la voix du chanteur, utilisables pour recréer sa voix via l’IA. Et pourtant…

« Il faut beaucoup, beaucoup de son. Nous avons 250 émissions avec Karel Gott. Il parle pendant 15 à 20 minutes dans chaque épisode. Nous n’avions pas réfléchi à la quantité d’enregistrement dont nous disposions. Lorsque nous avons tout transmis à la société qui a réalisé le modèle vocal, elle nous a dit qu’il lui en fallait encore bien plus, qu’elle n’en avait pas assez. »

Karel Gott | Source: ČRo

Au final, ce ne sont que 20 heures sur 200 heures d’enregistrement à disposition qui ont été utilisées et confiées au programme d’IA pour la recréation de la voix de Karel Gott : impossible en effet d’utiliser par exemple des sons où de la musique est mixée. Pour l’Université de Bohême de l’Ouest, ce projet était un défi, comme l’explique Jindřich Matoušek, qui dirige l’équipe de synthèse vocale au département de cybernétique :

Jindřich Matoušek | Photo: Université de Bohême de l’Ouest

« Lorsqu’on nous a fait cette proposition, nous l’avons trouvée très intéressante. Cela fait 25 ans que je fais de la synthèse vocale par ordinateur, depuis mon doctorat. Je suis très heureux de voir que cette technologie ne cesse de s’améliorer. »

Le résultat est une parole générée par ordinateur à partir d’un texte. Ce sont les technologies les plus récentes qui parviennent à les créer à l’aide de réseaux neuronaux profonds. Dans le jargon, les RPN sont une technique d’apprentissage automatique qui permet à un ordinateur, en l’entraînant, d’effectuer des tâches qui seraient très difficiles à réaliser à l’aide de techniques de programmation classiques. Jindřich Matoušek :

« Le réseau doit deviner comment créer un signal acoustique sur la base de la transcription phonétique. Pour ce faire, il a besoin de nombreux exemples de ce qui se passe dans le monde réel, de la manière dont Karel Gott a prononcé certaines paroles. Lorsque nous présentons ces enregistrements au modèle de manière répétée, il l’apprend. »

Igor Bareš | Photo: Jiří Šeda,  ČRo

La majeure partie des textes de l’autobiographie de Karel Gott est lue par un acteur tchèque Igor Bareš, mais de nombreux passages sont prononcés par la voix restaurée du chanteur. Cette recréation s’est faite avec l’accord de la veuve de Karel Gott, et pour ce projet, la Radio a établi un ensemble de règles sur la manière de traiter et d’aborder la synthèse vocale, notamment le fait de toujours signaler que la voix a été créée par l’IA.

Actuellement, 24 chapitres de l’autobiographie ont été rendu publics jeudi dernier, à la veille de l’anniversaire de Karel Gott. Les auditeurs pourront entendre au total une sélection de 49 chapitres. L’autobiographie complète sera publiée sous forme de livre audio à l’automne.