Voice AI est effrayant maintenant. Les acteurs de jeux vidéo détestent ça.

Publié le 26 juin 2021 par Mycamer

Le modder de jeu nikich340 a récemment publié un Le sorceleur 3 Mod PC appelé Une nuit à se souvenir. Le mod décolle après les événements de la Du sang et du vin extension, avec le protagoniste Geralt de Rivia reprenant la chasse à Orianna.

Les fans du jeu étaient ravis d’avoir un nouvel ajout, quoique non officiel, à Le sorceleur 3 jouer. Les acteurs de la voix et certains autres observateurs, cependant, étaient moins que ravis. Tu vois, Une nuit à se souvenir propose non seulement un nouveau contenu, mais également de nouvelles lignes vocales. Plus précisément, le moddeur a utilisé une IA formée sur le discours de l’acteur vocal Doug Cockle pour générer de toutes nouvelles lignes vocales pour Geralt, le personnage qu’il incarne.

</p> <div class="jeg_video_container jeg_video_content"><iframe loading="lazy" title="[Witcher 3] New Quest MOD - A Night to Remember (trailer)" width="500" height="281" src="https://www.youtube.com/embed/nBrQgG1O-3g?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen="allowfullscreen"></iframe></div> <p>

“Si c’est vrai, c’est juste déchirant” tweeté Jay Britton, un doubleur avec des crédits dans Divinité : Péché originel 2 et Éclaireur. « Oui, l’IA pourrait peut-être remplacer les choses, mais devrait-elle ? On décide littéralement. Remplacer les acteurs par l’IA n’est pas seulement un champ de mines légal, mais un choix totalement sans âme. »

le Sorceleur 3 La controverse sur les mods est survenue dans la foulée du développeur de jeux vidéo Obsidian qui a publié une vidéo sur son travail avec Sonantic, qui consiste à utiliser des voix d’IA comme espaces réservés avant d’ajouter des acteurs vocaux dans le jeu. La vidéo explique qu’Obsidian utilise les voix AI de Sonantic parce que le développeur trouve utile de réécouter son dialogue pour savoir ce qui fonctionne et ce qui ne fonctionne pas.

</p> <div class="jeg_video_container jeg_video_content"><iframe loading="lazy" title="Why Obsidian uses AI voices for game development | Sonantic" width="500" height="281" src="https://www.youtube.com/embed/YajBa5PO1Hk?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen="allowfullscreen"></iframe></div> <p>

Naturellement, ce genre d’avancées rend les acteurs de la voix des jeux vidéo nerveux. “Il y a l’inquiétude instinctive de” Cela va prendre nos emplois “et je pense que, dans certains cas, cela arrivera”, Natalie Winter, actrice de doublage dans des jeux tels que Assassin’s Creed : Valhalla, me dit via DM. Avec une technologie en constante amélioration et un Internet abordable, il y a eu un boom du doublage qui peut être fait à la maison et, comme Winter me le dit, la concurrence est assez féroce. “Il est triste de penser que si les voix de l’IA deviennent suffisamment bonnes pour être largement utilisées”, dit-elle, “alors ces opportunités diminueront à nouveau.”

Le moddeur pseudonyme derrière le Une nuit à se souvenir Le projet a utilisé un logiciel appelé CyberVoice pour créer de nouvelles lignes de dialogue et de voix pour Geralt. CyberVoice est le produit du Mind Simulation Lab basé en Russie, qui est également à l’origine de CyberMind, qui utilise l’IA pour former des personnalités numériques pour les personnages non jouables (PNJ) avec lesquels les joueurs interagissent. CyberMind fournit les informations utilisées – par exemple, la connaissance de Geralt des nombreux monstres qu’il rencontre dans Le sorceleur série – et CyberVoice donne une voix à cette compréhension.

Le PDG de Mind Simulation Lab, Leonid Derikyants, m’explique par e-mail pourquoi une telle technologie est nécessaire dans les jeux. « Nous créons des versions numériques de [actors’] voix pour que les PNJ en direct puissent répondre aux questions des joueurs, en dehors des missions de l’histoire, avec la même voix », dit-il. «Et puisqu’ils forment leurs réponses de manière indépendante et se souviennent de nouveaux faits, il est impossible de tout exprimer à l’avance. Ce serait étrange si, dans ce cas, ils parlaient d’une voix différente. C’est pourquoi nous avons besoin de la technologie de pointe de la parodie vocale.

Bien que Mind Simulation Lab ait travaillé avec des comédiens vocaux, la voix de Geralt a été créée grâce à l’utilisation de pistes audio gratuites maillées avec une autre voix. Comme l’explique Derikyants, Mind Simulation Lab effectue un « travail d’ingénierie du son » qui aide à modifier manuellement la voix afin qu’elle soit similaire à l’original. Ensuite, l’entreprise forme sa synthèse vocale sur l’audio. Derikyants dit “parodier”, mais cela ressemble plus à du perroquet – la qualité est si bonne.

Cela soulève toute une série de problèmes. Qu’est-ce qui empêche quiconque – que ce soit un développeur solo ou un studio de jeu triple A – d’utiliser la voix de quelqu’un pour exprimer quelque chose, disons, raciste ou homophobe sans son consentement ?

« Si nos acteurs sont pas confortable avec quelque chose, alors c’est un Ne pas aller. Nous prenons l’abus très sérieusement. “

Bien que la PDG de Sonantic, Zeena Qureshi, ne soit pas d’accord avec l’utilisation de l’IA vocale pour Une nuit à se souvenir DLC, elle dit que, au moins avec son entreprise, les discours offensants ne devraient pas être un problème. Qureshi dit que lorsque Sonantic modélise les voix de leurs acteurs, la société s’assure que les acteurs sont d’accord avec le contenu pour lequel leur voix sera utilisée tout au long du processus.

Qureshi souligne le «système de divulgation» de l’entreprise, qui permet à Sonantic de diffuser du contenu devant les acteurs avant qu’ils n’acceptent quoi que ce soit. « Si nos acteurs ne sont pas à l’aise avec quelque chose, alors c’est interdit », dit-elle. « Nous prenons les abus très au sérieux. »

J’ai contacté un porte-parole du syndicat d’acteurs SAG-AFTRA sur la façon dont l’IA vocale pourrait potentiellement affecter un acteur en ce qui concerne le crédit. Si un abus se produisait effectivement et que l’acteur quittait le projet, cela affecterait-il sérieusement les droits de crédit ? Leur réponse, par e-mail : Cela dépendrait en fin de compte de l’acteur, car actuellement « les sociétés de jeux vidéo n’ont pas le droit de continuer à utiliser la voix de l’artiste pour créer quelque chose de nouveau sans son autorisation.

“Si l’artiste choisit de permettre cela, nous négocierons pour une compensation équitable”, poursuit le représentant, ajoutant que le syndicat veut “s’assurer qu’il existe des protections en place qui permettent de voir comment la voix de l’IA est utilisée, pendant combien de temps, que les données sont protégées et que [the actors] sont alignés sur les projets et les entreprises qu’ils choisissent.

Mind Simulation Lab dit également qu’il accorde également une attention particulière à l’éthique de l’IA. Selon Derikyants, la voix parodique de Geralt n’est pas disponible pour un usage public. Cependant, le moddeur de Une nuit à se souvenir, nikich340, me dit qu’ils avaient demandé des lignes vocales spécifiques au laboratoire, que Mind Simulation Lab a ensuite fournies – une tournure des événements qui semblerait contrecarrer l’argument de Derikyants.

“Malheureusement, plus personne ne peut interdire la synthèse n’importe quelle voix.

L’audio de la parodie Cockle, selon Mind Simulation Lab, ne sera pas accessible à des fins commerciales à moins que l’acteur ne rejoigne la plate-forme CyberVoice. Si Cockle (qui a refusé de commenter cet article) a contesté l’utilisation de l’audio, Derikyants m’a informé qu’en réalité, il n’y avait rien à faire, étant donné que l’audio n’est pas sa vraie voix “mais simplement similaire. ” Derikyants concède qu’il s’agit d’un problème : “Malheureusement, plus personne ne peut désormais interdire de synthétiser une voix.”

Thomas Mitchells, comédien et réalisateur de voix travaillant actuellement sur La porte de Baldur 3, se méfie de la nouvelle technologie. « Des entreprises comme Sonantic offrent une « protection », mais avec le temps, les gens volonté pouvoir mettre la main sur ce type de kit », explique Mitchells. Il a raison : là sont une variété de systèmes de clonage vocal partagés sur GitHub à ce moment précis.

Alors que Mitchells dit qu’il soutient les studios indépendants utilisant l’IA vocale pour les one-liners ou les appels (“Bon travail!”), Il y a quelque chose de très différent à propos de l’utilisation de l’IA vocale pour les personnages dans un monde immersif. “Aucune IA n’est parfaite”, dit-il. « Vous n’obtenez pas la spontanéité, vous n’obtenez pas l’expérience personnelle d’une personne, vous n’obtenez pas cette essence d’humanité dans les lignes. Vous obtenez un sous-produit de quelqu’un qui peaufine un tas de boutons et de cadrans dans un plug-in pour rendre le son de livraison aussi plausible que possible.

Mitchells cite l’histoire de Sir Christopher Lee et sa correction au réalisateur Peter Jackson sur le tournage de le Seigneur des Anneaux sur le bruit qu’une personne fait lorsqu’elle est poignardée dans le dos. Dans cette situation, Lee vivre pendant la Seconde Guerre mondiale a apporté quelque chose au personnage qu’aucune IA ne pouvait.

« Si votre voix IA ne respirer, il ne portera jamais le émotif poids qu’un humain performance pouvez.”

Winter, quant à lui, souligne l’importance de l’acte de respirer dans le doublage. « La respiration est tellement essentielle pour nous exprimer, en particulier par la voix », dit-elle. “Si votre voix d’IA ne respire pas, elle ne portera jamais le poids émotionnel que peut avoir la performance d’un humain.”

En fin de compte, pour Mitchells et d’autres acteurs de la voix, c’est la diminution de leur métier qui semble impardonnable. « Les acteurs adorent jouer », dit-il. « C’est pourquoi ils sacrifient autant pour le faire en tant que travail. C’est épanouissant sur le plan créatif et lorsqu’un personnage se retrouve avec une base de fans derrière lui, c’est l’expérience la plus enrichissante.

“Maintenant, imaginez devenir un personnage aimé de beaucoup, mais vous n’avez rien fait pour contribuer à ce rôle”, ajoute Mitchells. « Zéro créativité de la part de l’acteur. Zéro accomplissement. Zéro art. “



Le modder de jeu nikich340 a récemment publié un Le sorceleur 3 Mod PC appelé Une nuit à se souvenir. Le mod décolle après les événements de la Du sang et du vin extension, avec le protagoniste Geralt de Rivia reprenant la chasse à Orianna.

Les fans du jeu étaient ravis d’avoir un nouvel ajout, quoique non officiel, à Le sorceleur 3 jouer. Les acteurs de la voix et certains autres observateurs, cependant, étaient moins que ravis. Tu vois, Une nuit à se souvenir propose non seulement un nouveau contenu, mais également de nouvelles lignes vocales. Plus précisément, le moddeur a utilisé une IA formée sur le discours de l’acteur vocal Doug Cockle pour générer de toutes nouvelles lignes vocales pour Geralt, le personnage qu’il incarne.

</p> <div class="jeg_video_container jeg_video_content"><iframe loading="lazy" title="[Witcher 3] New Quest MOD - A Night to Remember (trailer)" width="500" height="281" src="https://www.youtube.com/embed/nBrQgG1O-3g?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen="allowfullscreen"></iframe></div> <p>

“Si c’est vrai, c’est juste déchirant” tweeté Jay Britton, un doubleur avec des crédits dans Divinité : Péché originel 2 et Éclaireur. « Oui, l’IA pourrait peut-être remplacer les choses, mais devrait-elle ? On décide littéralement. Remplacer les acteurs par l’IA n’est pas seulement un champ de mines légal, mais un choix totalement sans âme. »

le Sorceleur 3 La controverse sur les mods est survenue dans la foulée du développeur de jeux vidéo Obsidian qui a publié une vidéo sur son travail avec Sonantic, qui consiste à utiliser des voix d’IA comme espaces réservés avant d’ajouter des acteurs vocaux dans le jeu. La vidéo explique qu’Obsidian utilise les voix AI de Sonantic parce que le développeur trouve utile de réécouter son dialogue pour savoir ce qui fonctionne et ce qui ne fonctionne pas.

</p> <div class="jeg_video_container jeg_video_content"><iframe loading="lazy" title="Why Obsidian uses AI voices for game development | Sonantic" width="500" height="281" src="https://www.youtube.com/embed/YajBa5PO1Hk?feature=oembed" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen="allowfullscreen"></iframe></div> <p>

Naturellement, ce genre d’avancées rend les acteurs de la voix des jeux vidéo nerveux. “Il y a l’inquiétude instinctive de” Cela va prendre nos emplois “et je pense que, dans certains cas, cela arrivera”, Natalie Winter, actrice de doublage dans des jeux tels que Assassin’s Creed : Valhalla, me dit via DM. Avec une technologie en constante amélioration et un Internet abordable, il y a eu un boom du doublage qui peut être fait à la maison et, comme Winter me le dit, la concurrence est assez féroce. “Il est triste de penser que si les voix de l’IA deviennent suffisamment bonnes pour être largement utilisées”, dit-elle, “alors ces opportunités diminueront à nouveau.”

Le moddeur pseudonyme derrière le Une nuit à se souvenir Le projet a utilisé un logiciel appelé CyberVoice pour créer de nouvelles lignes de dialogue et de voix pour Geralt. CyberVoice est le produit du Mind Simulation Lab basé en Russie, qui est également à l’origine de CyberMind, qui utilise l’IA pour former des personnalités numériques pour les personnages non jouables (PNJ) avec lesquels les joueurs interagissent. CyberMind fournit les informations utilisées – par exemple, la connaissance de Geralt des nombreux monstres qu’il rencontre dans Le sorceleur série – et CyberVoice donne une voix à cette compréhension.

Le PDG de Mind Simulation Lab, Leonid Derikyants, m’explique par e-mail pourquoi une telle technologie est nécessaire dans les jeux. « Nous créons des versions numériques de [actors’] voix pour que les PNJ en direct puissent répondre aux questions des joueurs, en dehors des missions de l’histoire, avec la même voix », dit-il. «Et puisqu’ils forment leurs réponses de manière indépendante et se souviennent de nouveaux faits, il est impossible de tout exprimer à l’avance. Ce serait étrange si, dans ce cas, ils parlaient d’une voix différente. C’est pourquoi nous avons besoin de la technologie de pointe de la parodie vocale.

Bien que Mind Simulation Lab ait travaillé avec des comédiens vocaux, la voix de Geralt a été créée grâce à l’utilisation de pistes audio gratuites maillées avec une autre voix. Comme l’explique Derikyants, Mind Simulation Lab effectue un « travail d’ingénierie du son » qui aide à modifier manuellement la voix afin qu’elle soit similaire à l’original. Ensuite, l’entreprise forme sa synthèse vocale sur l’audio. Derikyants dit “parodier”, mais cela ressemble plus à du perroquet – la qualité est si bonne.

Cela soulève toute une série de problèmes. Qu’est-ce qui empêche quiconque – que ce soit un développeur solo ou un studio de jeu triple A – d’utiliser la voix de quelqu’un pour exprimer quelque chose, disons, raciste ou homophobe sans son consentement ?

« Si nos acteurs sont pas confortable avec quelque chose, alors c’est un Ne pas aller. Nous prenons l’abus très sérieusement. “

Bien que la PDG de Sonantic, Zeena Qureshi, ne soit pas d’accord avec l’utilisation de l’IA vocale pour Une nuit à se souvenir DLC, elle dit que, au moins avec son entreprise, les discours offensants ne devraient pas être un problème. Qureshi dit que lorsque Sonantic modélise les voix de leurs acteurs, la société s’assure que les acteurs sont d’accord avec le contenu pour lequel leur voix sera utilisée tout au long du processus.

Qureshi souligne le «système de divulgation» de l’entreprise, qui permet à Sonantic de diffuser du contenu devant les acteurs avant qu’ils n’acceptent quoi que ce soit. « Si nos acteurs ne sont pas à l’aise avec quelque chose, alors c’est interdit », dit-elle. « Nous prenons les abus très au sérieux. »

J’ai contacté un porte-parole du syndicat d’acteurs SAG-AFTRA sur la façon dont l’IA vocale pourrait potentiellement affecter un acteur en ce qui concerne le crédit. Si un abus se produisait effectivement et que l’acteur quittait le projet, cela affecterait-il sérieusement les droits de crédit ? Leur réponse, par e-mail : Cela dépendrait en fin de compte de l’acteur, car actuellement « les sociétés de jeux vidéo n’ont pas le droit de continuer à utiliser la voix de l’artiste pour créer quelque chose de nouveau sans son autorisation.

“Si l’artiste choisit de permettre cela, nous négocierons pour une compensation équitable”, poursuit le représentant, ajoutant que le syndicat veut “s’assurer qu’il existe des protections en place qui permettent de voir comment la voix de l’IA est utilisée, pendant combien de temps, que les données sont protégées et que [the actors] sont alignés sur les projets et les entreprises qu’ils choisissent.

Mind Simulation Lab dit également qu’il accorde également une attention particulière à l’éthique de l’IA. Selon Derikyants, la voix parodique de Geralt n’est pas disponible pour un usage public. Cependant, le moddeur de Une nuit à se souvenir, nikich340, me dit qu’ils avaient demandé des lignes vocales spécifiques au laboratoire, que Mind Simulation Lab a ensuite fournies – une tournure des événements qui semblerait contrecarrer l’argument de Derikyants.

“Malheureusement, plus personne ne peut interdire la synthèse n’importe quelle voix.

L’audio de la parodie Cockle, selon Mind Simulation Lab, ne sera pas accessible à des fins commerciales à moins que l’acteur ne rejoigne la plate-forme CyberVoice. Si Cockle (qui a refusé de commenter cet article) a contesté l’utilisation de l’audio, Derikyants m’a informé qu’en réalité, il n’y avait rien à faire, étant donné que l’audio n’est pas sa vraie voix “mais simplement similaire. ” Derikyants concède qu’il s’agit d’un problème : “Malheureusement, plus personne ne peut désormais interdire de synthétiser une voix.”

Thomas Mitchells, comédien et réalisateur de voix travaillant actuellement sur La porte de Baldur 3, se méfie de la nouvelle technologie. « Des entreprises comme Sonantic offrent une « protection », mais avec le temps, les gens volonté pouvoir mettre la main sur ce type de kit », explique Mitchells. Il a raison : là sont une variété de systèmes de clonage vocal partagés sur GitHub à ce moment précis.

Alors que Mitchells dit qu’il soutient les studios indépendants utilisant l’IA vocale pour les one-liners ou les appels (“Bon travail!”), Il y a quelque chose de très différent à propos de l’utilisation de l’IA vocale pour les personnages dans un monde immersif. “Aucune IA n’est parfaite”, dit-il. « Vous n’obtenez pas la spontanéité, vous n’obtenez pas l’expérience personnelle d’une personne, vous n’obtenez pas cette essence d’humanité dans les lignes. Vous obtenez un sous-produit de quelqu’un qui peaufine un tas de boutons et de cadrans dans un plug-in pour rendre le son de livraison aussi plausible que possible.

Mitchells cite l’histoire de Sir Christopher Lee et sa correction au réalisateur Peter Jackson sur le tournage de le Seigneur des Anneaux sur le bruit qu’une personne fait lorsqu’elle est poignardée dans le dos. Dans cette situation, Lee vivre pendant la Seconde Guerre mondiale a apporté quelque chose au personnage qu’aucune IA ne pouvait.

« Si votre voix IA ne respirer, il ne portera jamais le émotif poids qu’un humain performance pouvez.”

Winter, quant à lui, souligne l’importance de l’acte de respirer dans le doublage. « La respiration est tellement essentielle pour nous exprimer, en particulier par la voix », dit-elle. “Si votre voix d’IA ne respire pas, elle ne portera jamais le poids émotionnel que peut avoir la performance d’un humain.”

En fin de compte, pour Mitchells et d’autres acteurs de la voix, c’est la diminution de leur métier qui semble impardonnable. « Les acteurs adorent jouer », dit-il. « C’est pourquoi ils sacrifient autant pour le faire en tant que travail. C’est épanouissant sur le plan créatif et lorsqu’un personnage se retrouve avec une base de fans derrière lui, c’est l’expérience la plus enrichissante.

“Maintenant, imaginez devenir un personnage aimé de beaucoup, mais vous n’avez rien fait pour contribuer à ce rôle”, ajoute Mitchells. « Zéro créativité de la part de l’acteur. Zéro accomplissement. Zéro art. “

— to www.inputmag.com