Gå til hovedinnhold
Oversetter
Denne siden er automatisk oversatt av Microsoft Translator sin maskinoversettelsestjeneste. få mer informasjon

Microsoft oversetter blogg

Oversett skannede PDF-dokumenter med dokumentoversettelse

Telefon som brukes til å ta bilde av dokumentet.

I dag er Dokumentoversettelse funksjonen til Translator, en Microsoft Azure Cognitive Service, legger til muligheten til å oversette PDF-dokumenter som inneholder skannet bildeinnhold, og eliminerer behovet for kunder å forhåndsbehandle dem gjennom en OCR-motor før oversettelse.

Dokumentoversettelse ble gjort allment tilgjengelig i fjor, 25. mai 2021, slik at kunder kan oversette hele dokumenter og grupper med dokumenter til mer enn 110 språk og dialekter samtidig som oppsettet og formateringen av originalfilen bevares. Dokumentoversettelse støtter en rekke filtyper, inkludert Word, PowerPoint og PDF, og kunder kan bruke enten forhåndsbygde eller tilpassede maskinoversettelsesmodeller. Dokumentoversettelse er bedriftsklar med Azure Active Directory-autentisering, og gir sikker tilgang mellom tjenesten og lagringen gjennom Managed Identity.

Å oversette PDF-er med skannet bildeinnhold er en svært etterspurt funksjon fra kunder med dokumentoversettelse. Kunder finner det vanskelig å skille PDF-dokumenter som har vanlig tekst eller skannet bildeinnhold gjennom automatisering. Dette skaper arbeidsflytproblemer ettersom kunder må rute PDF-dokumenter med skannet bildeinnhold først til en OCR-motor før de sendes til dokumentoversettelse.

Dokumentoversettelsestjenester har nå etterretningen

  • for å identifisere om PDF-dokumentet inneholder skannet bildeinnhold eller ikke,
  • å rute PDF-er som inneholder skannet bildeinnhold til en OCR-motor internt for å trekke ut tekst,
  • å rekonstruere det oversatte innholdet som vanlig tekst-PDF samtidig som den originale layouten og strukturen beholdes.

Skriftformatering som fet skrift, kursiv, understreking, uthevinger osv. beholdes ikke for skannet PDF-innhold, da OCR-teknologi for øyeblikket ikke fanger dem. Skriftformatering bevares imidlertid når vanlige PDF-tekstdokumenter oversettes.

Dokumentoversettelse støtter for øyeblikket PDF-dokumenter som inneholder skannet bildeinnhold fra 68 kildespråk til 87 målspråk. Støtte for ytterligere kilde- og målspråk vil bli lagt til etter hvert.

Nå er det enklere for kunder å sende alle PDF-dokumenter til dokumentoversettelse direkte og la det bestemme når og hvordan OCR-motoren skal brukes effektivt.

For kunder som allerede bruker dokumentoversettelse, er ingen kodeendring nødvendig for å kunne bruke denne nye funksjonen. PDF-dokumenter med skannet innhold kan sendes inn for oversettelse som alle andre støttede dokumentformater.

Vi er også glade for å kunngjøre at dokumentoversettelsen gir støtte for skannet PDF-dokumentinnhold uten ekstra kostnader for kundene. To prisplaner er tilgjengelige for dokumentoversettelse gjennom Azure – Pay-as-you-go-planen og D3-volumrabattplanen for høyere volumer av dokumentoversettelse. Prisdetaljer finner du på aka.ms/TranslatorPricing.

Lær hvordan du kommer i gang med dokumentoversettelse på aka.ms/DocumentTranslationDocs.
Send tilbakemelding til mtfb@microsoft.com.