Pular para o conteúdo principal
Translator
Esta página foi traduzida automaticamente pelo serviço de tradução automática do Microsoft Translator. Saiba Mais

Microsoft Tradutor blog

Traduzir documentos PDF digitalizados com tradução de documentos

Telefone utilizado para captar imagem de documento.

Hoje, o Tradução de documentos característica do Translator, um Serviço Cognitivo Microsoft Azure, adds a capacidade de traduzir documentos PDF contendo conteúdo de imagens digitalizadas, eliminando a necessidade dos clientes de os pré-processar através de um motor OCR antes da tradução.

A tradução de documentos foi geralmente disponibilizada no ano passado, 25 de Maio de 2021, permitindo aos clientes traduzir documentos inteiros e lotes de documentos em mais de 110 línguas e dialectos preservando o layout e a formatação do ficheiro original. A tradução de documentos suporta uma variedade de tipos de ficheiros, incluindo Word, PowerPoint e PDF, e os clientes podem utilizar modelos de tradução automática pré-construídos ou personalizados. A tradução de documentos está preparada para a empresa com autenticação Azure Active Directory, proporcionando acesso seguro entre o serviço e o armazenamento através da Managed Identity.

Traduzir PDFs com conteúdo de imagem digitalizada é uma funcionalidade altamente solicitada aos clientes de tradução de documentos. Os clientes têm dificuldade em separar documentos PDF que têm texto regular ou conteúdo de imagem digitalizada através da automatização. Isto cria problemas de fluxo de trabalho, uma vez que os clientes têm de encaminhar primeiro documentos PDF com conteúdo de imagem digitalizada para um motor de OCR antes de os enviar para a tradução de documentos.

Os serviços de tradução de documentos têm agora a inteligência

  • para identificar se o documento PDF contém ou não conteúdo de imagem digitalizada,
  • para encaminhar PDFs contendo conteúdo de imagens digitalizadas para um motor de OCR internamente para extrair texto,
  • para reconstruir o conteúdo traduzido como texto regular PDF, mantendo a disposição e estrutura originais.

Formatação de fontes como negrito, itálico, sublinhado, destaques, etc. não são retidos para conteúdo PDF digitalizado uma vez que a tecnologia OCR não os capta actualmente. Contudo, a formatação da fonte é preservada enquanto se traduzem documentos PDF de texto regular.

A tradução de documentos suporta actualmente documentos PDF contendo conteúdo de imagens digitalizadas de 68 línguas de origem para 87 línguas de destino. Oportunamente será acrescentado apoio para línguas de origem e línguas-alvo adicionais.

Agora é mais fácil para os clientes enviar todos os documentos PDF directamente para a tradução de Documentos e deixá-los decidir quando e como utilizar o motor de OCR de forma eficiente.

Para os clientes que já utilizam a tradução de Documentos, não é necessária qualquer alteração de código para poderem utilizar esta nova funcionalidade. Documentos PDF com conteúdo digitalizado podem ser submetidos para tradução como qualquer outro formato de documento suportado.

Temos também o prazer de anunciar que a tradução de Documentos acrescenta suporte ao conteúdo de documentos PDF digitalizados, sem custos adicionais para os clientes. Estão disponíveis dois planos de preços para a tradução de documentos através do Azure - o plano Pay-as-you-go e o plano de desconto por volume D3 para volumes mais elevados de tradução de documentos. Os detalhes dos preços podem ser encontrados em t.c.p./TranslatorPricing.

Saiba como começar com a tradução de documentos em também conhecido como docDocumentsTranslationDocs.
Envie o seu feedback para mtfb@microsoft.com.