Overslaan naar hoofdinhoud
Translator
Deze pagina is automatisch vertaald door de machine vertaalservice van Microsoft Translator. Meer informatie

Microsoft Translator Blog

Vertaal gescande PDF-documenten met documentvertaling

Telefoon gebruikt om afbeelding van document vast te leggen.

Vandaag, de Document vertaling functie van Translator, een Microsoft Azure Cognitive Service, voegt de mogelijkheid toe om PDF-documenten met gescande afbeeldingsinhoud te vertalen, waardoor klanten ze niet meer hoeven voor te bereiden via een OCR-engine voordat ze worden vertaald.

Documentvertaling werd vorig jaar, 25 mei 2021, algemeen beschikbaar gesteld, waardoor klanten volledige documenten en batches documenten konden vertalen naar meer dan 110 talen en dialecten met behoud van de lay-out en opmaak van het originele bestand. Documentvertaling ondersteunt een verscheidenheid aan bestandstypen, waaronder Word, PowerPoint en PDF, en klanten kunnen vooraf gebouwde of aangepaste machinevertalingsmodellen gebruiken. Documentvertaling is bedrijfsklaar met Azure Active Directory-verificatie en biedt beveiligde toegang tussen de service en opslag via Beheerde identiteit.

Het vertalen van PDF's met gescande afbeeldingsinhoud is een veelgevraagde functie van klanten voor documentvertaling. Klanten vinden het moeilijk om PDF-documenten met gewone tekst of gescande afbeeldingsinhoud te scheiden door middel van automatisering. Dit zorgt voor workflowproblemen, omdat klanten PDF-documenten met gescande afbeeldingsinhoud eerst naar een OCR-engine moeten leiden voordat ze naar documentvertaling worden verzonden.

Documentvertalingsdiensten beschikken nu over de intelligentie

  • om te bepalen of het PDF-document gescande afbeeldingsinhoud bevat of niet,
  • om PDF's met gescande afbeeldingsinhoud intern naar een OCR-engine te routeren om tekst te extraheren,
  • om de vertaalde inhoud te reconstrueren als gewone tekst-PDF met behoud van de oorspronkelijke lay-out en structuur.

Lettertypeopmaak zoals vet, cursief, onderstrepen, markeringen, enz. worden niet bewaard voor gescande PDF-inhoud, omdat OCR-technologie ze momenteel niet vastlegt. De lettertypeopmaak blijft echter behouden tijdens het vertalen van gewone pdf-tekstdocumenten.

Documentvertaling ondersteunt momenteel PDF-documenten met gescande afbeeldingsinhoud van 68 brontalen naar 87 doeltalen. Ondersteuning voor extra bron- en doeltalen zal te zijner tijd worden toegevoegd.

Nu is het voor klanten eenvoudiger om alle PDF-documenten rechtstreeks naar Documentvertaling te sturen en het te laten beslissen wanneer en hoe ze de OCR-engine efficiënt gebruiken.

Voor klanten die al documentvertaling gebruiken, is er geen codewijziging vereist om deze nieuwe functie te kunnen gebruiken. PDF-documenten met gescande inhoud kunnen worden ingediend voor vertaling zoals alle andere ondersteunde documentindelingen.

We zijn ook verheugd aan te kondigen dat de documentvertaling ondersteuning biedt voor gescande PDF-documentinhoud zonder extra kosten voor klanten. Er zijn twee tariefplannen beschikbaar voor documentvertaling via Azure: het Pay-as-you-go-abonnement en het D3-volumekortingsplan voor grotere volumes documentvertaling. Prijsinformatie is te vinden op aka.ms/TranslatorPricing.

Leer hoe u aan de slag kunt gaan met documentvertaling op aka.ms/DocumentTranslationDocs.
Stuur uw feedback naar mtfb@microsoft.com.