Production audio
Retour au Labo
Pour une meilleure localisation - Partie 2 : Optimiser le processus de localisation audio
Olivier Deslandes, vice-président senior de l'audio et de la technologie vocale de SIDE (société de PTW), a fait un exposé très intéressant lors de la dernière GameSoundCon, la conférence dédiée à la musique et à la conception audio des jeux vidéo.
En plus de présenter les principales étapes de la localisation audio, Olivier avait pour objectif de mettre en lumière les pièges courants que les studios rencontrent au cours de ce processus, et de fournir des solutions viables à des problèmes bien connus.
Avant de s'associer à un prestataire de localisation, et plus particulièrement de localisation audio, les studios de jeux vidéo doivent savoir à quoi s'attendre en termes de coût, de processus pour les différents types de doublage, de directives de casting et de formatage des scripts, pour ne citer que quelques aspects. Une bonne préparation dans ces domaines permet d'optimiser le processus de localisation audio et d'améliorer le partenariat de travail pour toutes les parties concernées.
Entrons dans les détails.
La localisation de l'audio représente une part énorme du budget total de localisation d'un jeu, soit entre 50 et 70 %. Elle nécessite des talents vocaux, des réalisateur·rice·s, des ingénieur·e·s du son, des directeur·rice·s de production, ainsi que des installations et des équipements sophistiqués.
Même s'il est coûteux, l'investissement en vaut la peine, car un mauvais jeu vocal et un enregistrement de mauvaise qualité donneront un produit de qualité inférieure. Le budget doit être consacré à des acteur·rice·s de doublage professionnel·le·s, à une direction vocale experte en jeux vidéo et à une équipe de production expérimentée. Une équipe dédiée à la gestion de la production est la mieux placée pour engager les talents et pour s’occuper de la programmation et de la gestion des actifs, en particulier si vous faites appel à plusieurs prestataires.
Les facteurs qui ont une incidence sur le coût sont le nombre de mots ou de répliques, la contrainte de temps et les vitesses d'enregistrement associées (qui sont influencées par l'état de la synchronisation, mais nous y reviendrons plus tard), et la qualité du talent vocal. Il faut être aussi préparé que possible avant le début de l'enregistrement, car tout retard ou changement survenant pendant la production se répercutera sur le calendrier et le budget.
Afin de vous fournir un devis détaillé, votre prestataire aura besoin des informations suivantes :
En fonction de la longueur du script et du nombre de répliques accessoires ou non narratives, le type de réplique du doublage peut avoir une incidence sur le coût.
Le statut de la synchronisation est l'élément déterminant : le doublage doit-il être synchronisé avec l'audio original du jeu ou avec les visuels ? Les types de doublage non synchronisé sont les sons brefs (grognements de douleur ou d'effort), les répliques et les dialogues ambiants des PNJ. D'un autre côté, les événements scriptés et les cinématiques ont besoin d'un doublage synchronisé.
L'écart de coût dépend également de la durée de chaque réplique dans les différentes langues. Les différences structurelles entre les langues expliquent les différences de débit. Par exemple, le russe a tendance à être plus long que l'anglais, et la synchronisation pour les langues tonales comme le chinois peut constituer un défi.
C'est pour cette raison qu'il est important de définir toutes vos contraintes d'enregistrement. Si les mécanismes de votre jeu permettent à votre doublage localisé d'être libre, cela signifie qu'il n'y a pas de contraintes et que le dialogue peut être aussi long que nécessaire. Ensuite, il y a le doublage avec contrainte de temps (CT) et le doublage avec contrainte de temps stricte (CTS) : La CT permet des fichiers plus longs ou plus courts que ceux des enregistrements sources selon une marge déterminée (généralement de 10%), mais pour la CTS, l'audio localisé doit correspondre exactement à la longueur de l'enregistrement source.
Enfin, la synchronisation du son est identique à la CTS, sauf que tous les silences doivent également refléter ceux de la source ; et la synchronisation labiale signifie que le son correspond parfaitement au mouvement des lèvres dans les images, par exemple, lorsque des plans rapprochés du visage sont présentés dans des cinématiques.
Une documentation adaptée peut également permettre de gagner beaucoup de temps et d'éviter les erreurs de communication. L'un des obstacles les plus complexes est celui des directives de casting, le document qui contient toutes les informations pour la localisation des personnages. À première vue, cela ne semble pas être un gros problème : il suffit de remplacer les talents originaux par des talents locaux. Cependant, certaines subtilités font que cet aspect du casting est plus délicat.
Par exemple, un accent peut donner un aspect comique à un personnage, mais il se peut que cet accent ne soit pas adapté à la langue vers laquelle vous localisez, et l'humour pourra alors ne plus fonctionner.
Il en va de même pour les répliques en langue étrangère qui donnent une saveur locale au dialogue, comme dans les jeux de guerre qui se déroulent dans un pays en particulier. Lors de la localisation dans la langue de ce pays, qui est dans le dialogue une langue étrangère, la réplique ne fonctionne plus correctement. Il s’agit là d’échanges que vous devez avoir avec le prestataire de votre choix.
L'âge d'un personnage peut également présenter des difficultés lors du casting. Les voix espagnoles castillanes peuvent sembler plus âgées aux joueurs non natifs, tandis que les voix féminines japonaises ont tendance à paraître plus jeunes aux joueurs non japonais. Même l'utilisation d'enfants en tant qu'acteurs vocaux peut poser un problème, car les lois sur le travail des enfants varient d'un pays à l'autre, ce qui entraîne des risques en termes de programmation et de productivité. Au lieu de cela, une solution fréquente est de faire appel à un·e acteur·rice adulte qui peut imiter la voix d'un enfant.
Le formatage du script est un élément clé pour que l'enregistrement se déroule sans accroc, car il contient le statut des répliques individuelles, qui peuvent connaître des modifications pendant les sessions.
Généralement, une feuille de calcul Excel avec des macros est le format de choix, car il permet de gérer facilement des éléments tels que les changements dans le script, les prises alternatives, les horodatages et le suivi des versions. Parmi les aspects importants du script, citons les identifiants de répliques uniques pour l'ordre chronologique, le contexte de l'histoire et les notes du réalisateur ou de la réalisatrice, afin que l'on sache toujours clairement à quel moment le dialogue se déroule, les noms des personnages, qui doivent toujours être orthographiés et prononcés de manière cohérente, le type de réplique (synchronisée ou non), les répliques d'apport, qui sont des liens permettant de lire la réplique précédente pour fournir le contexte aux talents lors de l'enregistrement, et les noms de fichiers uniques.
Enfin, il est essentiel de produire un script tel qu'enregistré, qui suit exactement ce que les acteur·rice·s ont enregistré le jour même. Comme nous l'avons mentionné précédemment, il y a souvent des écarts par rapport au script original. Un script tel qu'enregistré contiendra donc tous les changements et les commentaires supplémentaires dont l'AQ et la post-production auront besoin pour le sous-titrage et les prises alternatives.