A Inteligência Artificial (IA) tem-se consolidado como uma aliada estratégica na localização de conteúdo multimídia. Ferramentas avançadas oferecem soluções integradas que potencializam a eficiência e a precisão na adaptação de materiais audiovisuais para diferentes mercados e públicos. Neste artigo abordamos as principais tecnologias usadas, descrevemos alguns casos de uso e fazemos uma breve reflexão sobre desafios a serem considerados na escolha de uma solução.
Tecnologias
No processo de localização de conteúdos audiovisuais para outros idiomas, quatro tecnologias têm apresentado avanços significativos nos últimos dois anos.
Transcrição
Também chamada de degravação, é o processo de converter um áudio em texto, seja de um vídeo, podcast, reunião, entrevista ou chamada. A qualidade da transcrição depende de vários fatores, como idioma, sotaque, dicção dos interlocutores e qualidade do áudio. Com os avanços recentes, diversas empresas, como AssemblyAI, Deepgram e Speechmatics, se especializaram nessa área, cobrindo dezenas de línguas e superando em qualidade os motores de transcrição da Amazon, Google ou Microsoft.
Tradução
A tradução automática evoluiu consideravelmente desde o lançamento do Google Translate, há quase 20 anos. Nos últimos anos, empresas como a DeepL desenvolveram modelos que, em muitos casos, apresentam resultados próximos aos de tradutores humanos.
Legendagem
A legendagem exige conhecimento de regras específicas para garantir uma leitura fluida sem comprometer a experiência de visualização. A sincronização correta das legendas com o vídeo e sua segmentação conforme padrões do público-alvo são fatores essenciais que requerem conhecimento e prática.
Dublagem
A dublagem é uma alternativa para adaptar conteúdos audiovisuais a outros idiomas. Tradicionalmente realizada por humanos e mesmo por atores, a tecnologia agora permite a dublagem com vozes sintetizadas, cada vez mais naturais. Ferramentas como as da ElevenLabs já oferecem clonagem de vozes com alta-fidelidade.
Casos de uso
Os benefícios dessas tecnologias são evidentes para empresas de produção e distribuição de conteúdo, como emissoras de TV, plataformas de streaming, empresas de tradução e legendagem e, de uma forma geral, a mídia. No entanto, a maioria das organizações pode se beneficiar dessas soluções.
Comecemos pelos vídeos institucionais que, principalmente, as grandes empresas publicam nos seus sites, em plataformas como o YouTube ou o Vimeo, ou nas redes sociais. A legendagem de vídeos corporativos é cada vez mais frequente nas grandes empresas seja ela feita pelos departamentos de comunicação ou contratada fora.
A presença nas redes sociais é também uma prioridade para muitas empresas e, mesmo na língua original, a legendagem é essencial para vídeos consumidos em dispositivos móveis, onde o áudio pode não ser uma opção viável.
Em termos de acessibilidade, conteúdos legendados ajudam públicos com deficiência auditiva.
Em vídeos de treinamento corporativo a legendagem e dublagem são essenciais para a capacitação de equipes multinacionais internas ou de parceiros globais. Ao contrário dos conteúdos de entretenimento ou informativos, em que há todo um leque de emoções que as vozes sintetizadas ainda têm dificuldade em reproduzir, as vozes atualmente disponíveis permitem já atingir todos os objetivos de treinamento a custo muito inferiores aos da dublagem por humanos.
Também a transcrição de podcasts melhora a indexação por motores de busca.
A transcrição de reuniões e a tradução de documentos são ferramentas transversais úteis para grandes empresas.
Desafios
Para o sucesso da implementação de uma solução que atenda aos diferentes casos de uso enunciados ou outros específicos de uma determinada empresa, há que ter em conta um conjunto de fatores.
Suporte a Idiomas e Variantes
A avaliação da qualidade dos idiomas suportados é essencial, pois a performance varia conforme o idioma e os pares linguísticos. O ideal é escolher soluções que não dependam de um único fornecedor e que ofereçam suporte adequado a variantes linguísticas, como o português do Brasil, essencial nas tarefas de tradução e de síntese de fala.
Dado o avanço permanente e o investimento que é feito em diferentes línguas pelos vários atores, o ideal será optar por uma solução que não esteja dependente de um único fornecedor deste tipo de tecnologias.
Compatibilidade de Formatos
Verifique os formatos de vídeo, áudio e texto suportados na entrada e saída, garantindo compatibilidade com os processos e sistemas existentes.
Ter em conta se os formatos de legendas exportados são suportados por plataformas como o YouTube, por exemplo, caso seja esse o veículo de publicação da empresa.
Falando do YouTube, a legendagem automática já disponível nesta plataforma está longe da qualidade exigida para conteúdos corporativos daí a necessidade de dispor das ferramentas corretas para fazer a adaptação dos vídeos a outros mercados.
Revisão Humana
A possibilidade de revisão humana é fundamental para garantir qualidade e conformidade com normas corporativas.
Facilidade de Uso e Colaboração
A plataforma escolhida deve ser intuitiva, permitindo a gestão eficiente do fluxo de trabalho por equipes colaborativas.
Fluxos de Trabalho Integrados
Como se viu, a legendagem ou dublagem com vozes sintetizadas de um vídeo num outro idioma, implica uma sequência de tarefas pelo que, uma plataforma que suporte todas as tecnologias de IA descritas de forma integrada, é a solução ideal. Sem planejamento acaba por se contratar um conjunto de plataformas diferentes, não integradas e que não falam umas com as outras complicando os workflows.
Customização
Além da revisão humana, qualquer solução terá que ser customizável em termos corporativos. Um exemplo é contemplar o uso de glossários na transcrição e na tradução, para ter em conta terminologia específica de uma marca ou de um vertical. Outro é o da possibilidade de personalizar os modelos de legendas usados nos diversos canais, Web, YouTube ou redes sociais.
Automação e Integração com Outros Sistemas
A solução ideal deve oferecer APIs para integração com sistemas existentes. Algumas automações podem ser implementadas com recurso a hot folders ou serviços similares, que monitorizam um conjunto de pastas corporativas e automaticamente desencadeiam um fluxo de trabalho sempre que um novo ficheiro ali é colocado.
Infraestrutura em Nuvem
Os custos operacionais da IA exigem infraestrutura robusta, tornando as soluções em nuvem a melhor opção.
Privacidade e Conformidade
A solução adotada deve estar em conformidade com regulações e políticas corporativas, garantindo a segurança dos dados e informando sobre o uso de serviços de terceiros, onde se localizam e quais os termos e condições de cada um deles nomeadamente no que toca à utilização dos dados para treinar motores.
Modelo de Licenciamento
Além de todos os aspetos já referidos ou pelo menos os que se aplicam à sua organização, o modelo de licenciamento é obviamente um ponto determinante na escolha de uma solução deste tipo. Embora os preços por usuário possam parecer atrativos à primeira vista, verificar se um modelo baseado no volume de conteúdo audiovisual processado não acaba por ser mais interessante para a organização, quer em termos de preço quer de eficiência dos fluxos de trabalho.
Suporte local
O suporte local é um diferencial, especialmente para treinamento e integração de sistemas.
Conclusão
A combinação de tecnologias de IA de diferentes fornecedores, somada à colaboração e integração de fluxos de trabalho, aumenta consideravelmente a produtividade das equipas de adaptação de conteúdo audiovisual. Isso amplia a distribuição de conteúdo e fortalece a conexão das marcas com públicos globais.
Na Amplex, contamos com uma equipe dedicada para auxiliar a sua organização a adaptar seus conteúdos audiovisuais ao mercado global por meio da solução plain X.
Imagem: Divulgação.