A Tradução Automática da Microsoft

O Igor Medeiros, que deixou o comentário que resultou no artigo de ontem, disse, entre outras coisas “A Microsoft está usando uma ferramenta de tradução de suas páginas de suporte para várias línguas e só me dei conta disso depois de ler uma página quase que inteira e no final notei um pequeno erro se sentido no emprego das palavras”. Não sei se é questão de sorte, de meu olho de tradutor ou talvez de puro despeito, mas nunca achei uma daquelas páginas da Microsft traduzidas a máquina que não fosse ridícula. Eita servicinho mal feito!

O que me surpreende, é exatamente a má qualidade. Não porque eu esperasse que a MS, por ter um vasto plantel de programadores, fosse obrigada a ter um programa perfeito. Em informática, como em todos os outros ramos do conhecimento, existe sempre o problema da vocação. Uma empresa pode ter vocação para desenvolver programas gráficos, por exemplo, e ser péssima em processadores de texto. O problema é outro e vou tentar explicar agora.

Todo software de tradução tem suas limitações. Essas limitações muitas vezes são desconhecidas do público e mesmo escondidas dele, por motivos comerciais, mas devem ser perfeitamente conhecidas pelo desenvolvedor. Um dos modos de contornar essas limitações é usar linguagem controlada, quer dizer, um subconjunto da língua que a máquina consiga processar. Meio complicado de explicar, mas, mal comparando, podemos dizer que é semelhante àqueles livros em inglês simplificado, onde se usa inglês correto e idomático, mas as estruturas e vocabulário são limitados. Por exemplo, num livro para iniciantes, não se diz “What are they up to over there down under?”, mas sim “What do they intend to do in Australia?” Perde-se no estilo, ganha-se na facilidade de compreensão.

Existem dois métodos de usar linguagem controlada: ou os autores são treinados para escrever de acordo com as limitações impostas, ou os textos são reformulados por um revisor profissional que domine o sistema. O produto da tradução automática deve lucrar muito, mas o problema é que o sistema é caro. Quer dizer, caro, em termos. No caso da MS, sairia barato, porque o mesmo texto é traduzido para muitas línguas, diluindo o custo da reformulação em linguagem controlada.

Então, de duas uma, ou eles não usam linguagem controlada, ou o programinha é ruim mesmo.

Ainda tenho muito a dizer sobre isso, mas vamos com calma. Obrigado pela visita.

EN→PTBR |Tradutor profissional desde 1970.


4 Comentarios em "A Tradução Automática da Microsoft"

  • Vitor T. Machado
    09/02/2011 (2:46 pm)
    Responder

    Olá Danilo e Kelly,

    Vocês já ouviram falar de tecnologias de internacionalização para traduzir interfaces de sistemas?
    Coisas como o Get text ou o I18e?

  • Sheila
    25/01/2011 (9:06 am)
    Responder

    Isso me traz à mente a “novilingua” do Orwell em 1984. Diminuir o escopo da língua e o pensar/refletir sobre ela, que ataca diretamente nossa identidade e o pensar/se expressar através dela. Se o que o futuro nos reserva é ter a linguagem controlada pelo GTranslate e similares (que valorizo muito como ferramenta), só cabe a nós manter a diversidade de pensares e fazeres que ainda impede que a ferramenta vire o manipulador. (E aí lembro de Matrix – arte imita a vida e vice-versa?). Só uma reflexão..e que venham muitas outras.

    • Danilo
      25/01/2011 (5:01 pm)
      Responder

      Sheila, excelente comentário! As linguagens controladas, juntamente com o “politicamente correto” são o “newspeake”, a “novilíngua”. Olha lá, eu nunca tinha pensado nisso.

  • danilo augusto
    18/07/2009 (2:41 pm)
    Responder

    Fico bastante surpreso pela qualidade da tradução do sistema do Google, que há alguns anos era impensável.
    E ainda com todas as contribuições que são feitas pelos usuários para melhoria do sistema, vai ser mais preciso com o passar do tempo.
    Eu acredito que a tradução automática vai substituir pessoas de carne e osso, um dia. Eu me surpreendo com maravilhas da tecnologia a cada dia, que nunca imaginei poderem existir.
    Enfim, pode comentar algo sobre a "linguística de corpus"? Na tradução e no geral, p.ex. porque não é usada nos dicionários, gramáticas, etc.
    []'s


O que achou do artigo? Deixe seu comentário.

Pode publicar em html também