Salt la conținutul principal
Translator
Această pagină a fost tradusă automat de serviciul de traducere automată Microsoft Translator. Aflați mai multe

Blogul Microsoft Translator

Traducerea documentelor PDF scanate cu traducerea documentelor

Telefon folosit pentru a captura imaginea documentului.

Astăzi, Traducerea documentelor caracteristică a Translator, un serviciu cognitiv Microsoft Azure, adaugă capacitatea de a traduce documente PDF care conțin conținut de imagine scanat, eliminând necesitatea ca clienții să le preproceseze printr-un motor OCR înainte de traducere.

Traducerea documentelor a fost pusă la dispoziție în general anul trecut, 25 mai 2021, permițând clienților să traducă documente întregi și loturi de documente în mai mult de 110 limbi și dialecte păstrând în același timp aspectul și formatarea fișierului original. Traducerea documentelor acceptă o varietate de tipuri de fișiere, inclusiv Word, PowerPoint și PDF, iar clienții pot utiliza modele de traducere automată predefinite sau particularizate. Traducerea documentelor este pregătită pentru întreprindere cu autentificarea Azure Active Directory, oferind acces securizat între serviciu și stocare prin identitate gestionată.

Traducerea PDF-urilor cu conținut de imagine scanat este o caracteristică foarte solicitată de la clienții traducerii documentelor. Clienților le este dificil să segrege documente PDF care au text obișnuit sau conținut de imagine scanat prin automatizare. Acest lucru creează probleme cu fluxul de lucru, deoarece clienții trebuie să direcționeze documentele PDF cu conținut de imagine scanat mai întâi către un motor OCR înainte de a le trimite la traducerea documentelor.

Serviciile de traducere a documentelor au acum inteligența

  • pentru a identifica dacă documentul PDF conține sau nu conținut de imagine scanat,
  • să direcționeze PDF-urile care conțin conținut de imagine scanat către un motor OCR intern pentru a extrage text,
  • pentru a reconstrui conținutul tradus ca PDF text obișnuit, păstrând în același timp aspectul și structura originală.

Formatarea fonturilor, cum ar fi caracterele aldine, cursive, sublinierea, evidențierile etc. nu sunt reținute pentru conținutul PDF scanat, deoarece tehnologia OCR nu le captează în prezent. Cu toate acestea, formatarea fonturilor este păstrată în timpul traducerii documentelor PDF cu text obișnuit.

Traducerea documentelor acceptă în prezent documente PDF care conțin conținut de imagine scanat din 68 de limbi sursă în 87 de limbi țintă. Suportul pentru limbile sursă și țintă suplimentare va fi adăugat în timp util.

Acum este mai ușor pentru clienți să trimită toate documentele PDF la Traducerea documentelor direct și să decidă când și cum să utilizeze eficient motorul OCR.

Pentru clienții care utilizează deja traducerea documentului, nu este necesară nicio modificare de cod pentru a putea utiliza această nouă caracteristică. Documentele PDF cu conținut scanat pot fi trimise pentru traducere ca orice alte formate de documente acceptate.

De asemenea, suntem încântați să vă anunțăm că traducerea documentului adaugă suport pentru conținutul documentului PDF scanat, fără taxe suplimentare pentru clienți. Două planuri tarifare sunt disponibile pentru traducerea documentelor prin Azure - planul pay-as-you-go și planul de reducere a volumului D3 pentru volume mai mari de traducere a documentelor. Detalii despre prețuri pot fi găsite la aka.ms/TranslatorPricing.

Aflați cum să începeți lucrul cu traducerea documentelor la aka.ms/DocumentTranslationDocs.
Trimite feedback-ul dvs. mtfb@microsoft.com.