Vozes humanas e sintéticas na audiodescrição

A audiodescrição é uma técnica bastante utilizada para tornar a programação audiovisual mais inclusiva para pessoas com deficiências visuais, porém a maneira como as cenas são descritas também merece atenção especial.

Reshape - Transcrição de Áudio e Legendas de Vídeos
Publicado por Reshape Em 12 de Maio de 2023
Tempo de leitura
⏲ 6 min.
Vozes humanas e sintéticas na audiodescrição

A audiodescrição já é uma técnica bastante utilizada para tornar a programação audiovisual mais inclusiva para pessoas com deficiências visuais. No entanto, a forma como as cenas são descritas também merece atenção especial. No caso de filmes, séries e documentários, ela é feita, em geral, por uma pessoa que não faz parte do elenco original. É comum considerar que essa voz deva ser “neutra” e “imparcial”, mas será essa a melhor abordagem?

Vozes humanas podem agregar elementos importantes de interpretação e expressão emocional às descrições. Afinal, a avaliação das cenas não é apenas uma questão de objetividade, mas também de subjetividade. Por isso, muitos defensores desse recurso afirmam que é desejável que o audiodescritor possa adicionar sua própria emoção à narrativa.

Mas até que ponto a interpretação do narrador pode interferir na compreensão do telespectador? É essencial que a pessoa assistindo ainda possa tirar as próprias conclusões e opiniões sobre o que está vendo. Logo, é preciso encontrar um equilíbrio entre emoção e imparcialidade, o que pode ser muito complexo em um caso como esse.

Um exemplo disso pode ser visto nas narrações de séries ou filmes pelo ator e dublador americano Morgan Freeman. Quando ouvimos sua a narração uma cena, é como se ele trouxesse ainda mais profundidade e emoção às imagens que estamos vendo. Mesmo que a descrição inclua apenas dados objetivos, como figurinos, localizações e ações, a voz dele traz uma camada extra de interpretação emocional, sem influenciar a percepção do espectador.

Outros intérpretes para audiodescrição podem ser os próprios atores ou diretores do programa. Imagine, por exemplo, que um episódio de uma série tenha uma cena especialmente dramática para o personagem principal. Em vez de um audiodescritor neutro descrevendo suas ações, é possível utilizar a própria voz do ator para narrar a cena, trazendo ainda mais intensidade para a experiência de consumo.

É muito importante lembrar que a utilização desse recurso não deve ser feita de forma arbitrária ou aleatória. O profissional precisa ter muito cuidado ao selecionar as vozes que irão incluir em seu repertório, de forma a garantir que elas estejam verdadeiramente agregando à experiência do público. Outro fator crucial é que a escolha esteja alinhada com o tom e estilo da obra em questão e não destoe demais da atmosfera da história.

Porém, é bom ter em mente que nem sempre as vozes humanas são a melhor opção. Por exemplo, em situações em que a obra pode ser consumida por pessoas de diversas origens e línguas, é desejável que ela seja feita apenas com uma voz sintética padrão para o idioma da obra. Isso facilita a acessibilidade para pessoas de classificações e contextos diferentes.

As opções de vozes humanas para a audiodescrição precisam cuidadosamente ser selecionadas e monitoradas. Mas quando bem utilizadas, elas podem trazer um valor significativo para a experiência das pessoas com deficiência visual e permitir que elas tenham experiências mais ricas e intensas de obras audiovisuais.

Vozes sintéticas na audiodescrição

Na televisão, a audiodescrição é uma ferramenta que permite que as pessoas com deficiências possam desfrutar de programas, filmes e séries de forma igualitária, mas o uso de vozes sintéticas para essa finalidade é um tópico que ainda levanta muitas dúvidas e discussões.

Elas são geradas por meio de programas de computador, no entanto, a utilização delas ainda é um tema controverso, pois muitas pessoas consideram que isso pode passar uma ideia monótona ou pouco expressiva, o que pode acabar prejudicando a experiência.

Por outro lado, elas podem ser uma opção interessante, principalmente no caso de produções com grandes quantidades de informações a serem transmitidas. Nesses casos, as vozes humanas podem acabar se tornando cansativas para o narrador e, consequentemente, para o telespectador. Nesse sentido, a forma artificial pode ser uma alternativa viável, desde que seja bem escolhida e configurada.

Elas podem trazer uma maior padronização ao processo. Como essas vozes são geradas automaticamente, não há falhas humanas que podem ocorrer na pronúncia de alguns termos ou nomes próprios. Dessa forma, é possível garantir que as informações serão transmitidas de forma correta, precisa e mais rápida, pois não são necessárias regravações para corrigir erros, o que é fundamental para uma experiência de qualidade.

Algumas pessoas podem preferir vozes mais graves, outras mais agudas, algumas mais rápidas ou lentas. Com esse recurso, é possível escolher a que melhor se adapta a cada programação e público, fornecendo uma experiência melhor e personalizada, especialmente considerando as necessidades específicas daqueles que têm deficiência visual.

É essencial destacar que essa pode ser uma possibilidade interessante para a democratização da informação e da cultura. Com a utilização da tecnologia, é possível fornecer acessibilidade para um número maior de pessoas de forma mais rápida e econômica. Assim, ao avaliar essa opção, é fundamental ponderar a questão da inclusão e da democratização do acesso à informação. 

O debate em torno das vozes sintéticas na audiodescrição é extremamente importante para garantir a inclusão e acessibilidade das pessoas com deficiência visual. Embora ainda haja algumas questões a serem consideradas, é possível ver que a utilização dessas vozes pode trazer vantagens importantes para a ferramenta e para o telespectador em geral. O indispensável é buscar um equilíbrio entre as necessidades do público e as possibilidades tecnológicas, sempre com a premissa da inclusão e da acessibilidade em mente.

Benefícios de mesclar ambas

A audiodescrição tem se tornado cada vez mais popular para tornar o entretenimento acessível para pessoas com deficiências visuais. A ideia é oferecer uma descrição detalhada do que está acontecendo na tela, para que o espectador possa acompanhar a história. Mesclar vozes humanas e sintéticas para esse fim pode trazer uma série de benefícios para a qualidade dessa experiência. Agora, vamos explorar algumas razões pelas quais essa estratégia pode ser eficaz.

1) Maior clareza

As vozes humanas podem transmitir emoção e nuances, enquanto as vozes sintéticas são mais eficazes para fornecer informações precisas e objetivas. Usar uma voz humana para os momentos mais emocionais e uma voz sintética para detalhes técnicos possibilita uma experiência equilibrada e completa.

2) Maior velocidade e eficiência

As vozes sintéticas têm a capacidade de falar rapidamente e de maneira constante, evitando pausas desconfortáveis. Combinadas com vozes humanas, isso permite a transmissão do máximo de informações em um curto espaço de tempo, porém ainda sem sobrecarregar e confundir o telespectador.

3) Personalização

As vozes sintéticas permitem aos produtores usar uma variedade de timbres ou até mesmo criar uma voz personalizada para determinado conteúdo. Já a humana traz a possibilidade de seleção de um intérprete conhecido pelo público para melhorar o envolvimento emocional com o material. Alternar entre as duas opções permite que a audiodescrição atenda melhor às necessidades de todos os tipos de espectadores e materiais.

4) Melhora da qualidade geral do produto

Quando gravados separadamente, os apresentadores podem ter um problema de ritmo ou velocidade com a narração, o que pode torná-lo confuso ou difícil de seguir. Ao usar vozes sintéticas para fornecer informações técnicas detalhadas e vozes humanas para fornecer informações emocionais, é possível criar uma experiência mais envolvente e acessível.

5) Facilidade de produção

A gravação de uma única voz para uma audiodescrição pode ser exigente, precisando de muitas horas e retoques de pós-produção para ficar pronta para publicação. Com a mesclagem, esses processos podem ser reduzidos ou cortados drasticamente, permitindo uma criação mais eficiente e com qualidade, permitindo uma rotina menos exigente e exaustiva aos narradores.

Essa técnica pode trazer muitos benefícios além dos acima citados, incluindo clareza, eficiência, personalização, qualidade e facilidade de produção. Um futuro com mais empresas e produtores de conteúdo adotando essa estratégia é promissor, e com certeza irá tornar nosso mundo mais acessível e inclusivo para todos.

Conclusão

A audiodescrição tem se tornado mais popular com o passar do tempo, e as opções de vozes humanas e sintéticas sempre foram muito claras. Porém, a forma híbrida como foi apresentada nesse texto tem sido uma novidade intrigante, e, claro, com promessas muito positivas.

Dica: Quer estar sempre ligado em todas as novidades dessa área? A Reshape está sempre atualizando seu conteúdo para entregar a você todo o conhecimento que precisa nessa área! Para não perder nenhum de nossos textos, basta acessar www.reshape.com.br/blog, lá você encontra uma diversidade enorme de materiais. Veja um pouco do que temos por lá:

Conteúdos Relacionados

Serviços linguísticos e a relação com a localização de vídeo

Serviços linguísticos e a relação com a localização de vídeo

Com o aumento do consumo de conteúdos online, a localização de vídeo se tornou uma ferramenta cada vez mais importante na indúst…
Como materiais audiovisuais influenciam na decisão de compra dos consumidores

Como materiais audiovisuais influenciam na decisão de compra dos consumidores

O vídeo marketing é uma poderosa ferramenta de comunicação com o seu público, pois permite alcançar um grande número de pessoas …