Preklad naskenovaných dokumentov PDF s prekladom dokumentov
Dnes sa Preklad dokumentu funkcia Translator, kognitívnej služby Microsoft Azure, pridáva možnosť prekladať dokumenty PDF obsahujúce naskenovaný obrazový obsah, čím eliminuje potrebu zákazníkov pred spracovaním prostredníctvom OCR nástroja pred prekladom.
Preklad dokumentov bol všeobecne dostupný minulý rok, 25. mája 2021, čo zákazníkom umožnilo preložiť celé dokumenty a šarže dokumentov do viac ako 110 jazykov a dialektov pri zachovaní rozloženia a formátovania pôvodného súboru. Preklad dokumentov podporuje rôzne typy súborov vrátane Wordu, PowerPointu a PDF a zákazníci môžu používať predpripravené alebo vlastné modely strojového prekladu. Preklad dokumentov je podnikovo pripravený s autentifikáciou Azure Active Directory, ktorá poskytuje zabezpečený prístup medzi službou a úložiskom prostredníctvom spravovanej identity.
Preklad pdf s naskenovaným obrazovým obsahom je veľmi žiadanou funkciou od zákazníkov prekladu dokumentov. Pre zákazníkov je ťažké oddeliť dokumenty PDF, ktoré majú pravidelný text alebo naskenovaný obrazový obsah prostredníctvom automatizácie. Tým sa vytvoria problémy s pracovným postupom, pretože zákazníci musia najprv smerovať dokumenty PDF s naskenovaným obrazovým obsahom do nástroja OCR a až potom ich odoslať na preklad dokumentov.
Služby prekladu dokumentov majú teraz spravodajské informácie
- zistiť, či dokument PDF obsahuje naskenovaný obsah obrázka alebo nie,
- interne smerovať dokumenty PDF obsahujúce naskenovaný obsah obrázka do nástroja OCR, aby sa extrahoval text,
- rekonštruovať preložený obsah ako bežný text PDF pri zachovaní pôvodného rozloženia a štruktúry.
Formátovanie písma, ako je tučné písmo, kurzíva, podčiarknutie, zvýraznenie atď., sa nezachováva pre naskenovaný obsah PDF, pretože technológia OCR ich v súčasnosti nezachytáva. Formátovanie písma sa však zachová pri preklade bežných textových dokumentov PDF.
Preklad dokumentov v súčasnosti podporuje dokumenty PDF obsahujúce naskenovaný obrazový obsah zo 68 zdrojových jazykov do 87 cieľových jazykov. Podpora pre ďalšie zdrojové a cieľové jazyky bude pridaná v dohľadnom čase.
Teraz je pre zákazníkov jednoduchšie poslať všetky dokumenty PDF priamo do prekladu dokumentov a nechať ho rozhodnúť, kedy a ako efektívne používať OCR engine.
Pre zákazníkov, ktorí už používajú preklad dokumentu, nie je potrebná žiadna zmena kódu, aby mohli používať túto novú funkciu. Dokumenty PDF s naskenovaným obsahom je možné odoslať na preklad ako akékoľvek iné podporované formáty dokumentov.
S potešením vám tiež oznamujeme, že preklad dokumentu pridáva podporu pre naskenovaný obsah dokumentu PDF bez ďalších poplatkov pre zákazníkov. Pre preklad dokumentov cez Azure sú k dispozícii dva cenové plány – plán Pay-as-you-go a plán množstevných zliav D3 pre vyššie objemy prekladu dokumentov. Podrobnosti o cenách nájdete na aka.ms/TranslatorPricing.
Prečítajte si, ako začať s prekladom dokumentov na aka.ms/DocumentTranslationDocs.
Odošlite svoje pripomienky na mtfb@microsoft.com.