Przejdź do głównej zawartości
Translator
Ta strona została automatycznie przetłumaczona przez usługę tłumaczenia maszynowego Microsoft Translator. Dowiedz się więcej

Blog Microsoft Translator

Tłumaczenie zeskanowanych dokumentów PDF za pomocą translatora dokumentów

Telefon używany do przechwytywania obrazu dokumentu.

Obecnie Tłumaczenie dokumentów Funkcja Translator, usługi Microsoft Azure Cognitive Service, dodaje możliwość tłumaczenia dokumentów PDF zawierających zeskanowaną zawartość obrazu, eliminując potrzebę wstępnego przetwarzania ich przez klientów za pomocą aparatu OCR przed tłumaczeniem.

Tłumaczenie dokumentów zostało udostępnione w zeszłym roku, 25 maja 2021 r., umożliwiając klientom tłumaczenie całych dokumentów i partii dokumentów na więcej niż 110 języków i dialektów zachowując układ i formatowanie oryginalnego pliku. Tłumaczenie dokumentów obsługuje różne typy plików, w tym Word, PowerPoint i PDF, a klienci mogą korzystać z gotowych lub niestandardowych modeli tłumaczenia maszynowego. Tłumaczenie dokumentów jest przystosowane do obsługi w przedsiębiorstwie dzięki uwierzytelnianiu usługi Azure Active Directory, zapewniającemu bezpieczny dostęp między usługą a magazynem za pośrednictwem tożsamości zarządzanej.

Tłumaczenie plików PDF z zeskanowaną zawartością obrazu jest bardzo pożądaną funkcją od klientów zajmujących się tłumaczeniem dokumentów. Klienci mają trudności z segregacją dokumentów PDF, które mają zwykły tekst lub zeskanowaną zawartość obrazu za pomocą automatyzacji. Stwarza to problemy z obiegiem pracy, ponieważ klienci muszą kierować dokumenty PDF z zeskanowaną zawartością obrazu najpierw do aparatu OCR, zanim wyślą je do tłumaczenia dokumentów.

Usługi tłumaczenia dokumentów mają teraz inteligencję

  • w celu określenia, czy dokument PDF zawiera zeskanowaną zawartość obrazu, czy nie,
  • kierowanie plików PDF zawierających zeskanowaną zawartość obrazu do wewnętrznego silnika OCR w celu wyodrębnienia tekstu,
  • aby zrekonstruować przetłumaczoną zawartość jako zwykły tekstowy plik PDF przy zachowaniu oryginalnego układu i struktury.

Formatowanie czcionek, takie jak pogrubienie, kursywa, podkreślenie, podświetlenie itp., Nie jest zachowywane dla zeskanowanej zawartości PDF, ponieważ technologia OCR obecnie ich nie przechwytuje. Jednak formatowanie czcionek jest zachowywane podczas tłumaczenia zwykłych tekstowych dokumentów PDF.

Tłumaczenie dokumentów obsługuje obecnie dokumenty PDF zawierające zeskanowaną zawartość obrazu z 68 języków źródłowych do 87 języków docelowych. Obsługa dodatkowych języków źródłowych i docelowych zostanie dodana w odpowiednim czasie.

Teraz klientom łatwiej jest wysyłać wszystkie dokumenty PDF bezpośrednio do usługi Tłumaczenie dokumentów i pozwolić im decydować, kiedy i jak efektywnie korzystać z silnika OCR.

W przypadku klientów korzystających już z usługi Tłumaczenie dokumentów nie jest wymagana żadna zmiana kodu, aby móc korzystać z tej nowej funkcji. Dokumenty PDF z zeskanowaną zawartością można przesyłać do tłumaczenia jak wszystkie inne obsługiwane formaty dokumentów.

Z przyjemnością informujemy również, że tłumaczenie dokumentów dodaje obsługę zeskanowanej zawartości dokumentu PDF bez dodatkowych opłat dla klientów. Dostępne są dwa plany cenowe dla tłumaczenia dokumentów za pośrednictwem platformy Azure — plan płatności zgodnie z rzeczywistym użyciem i plan rabatu zbiorczego D3 dla większych ilości tłumaczeń dokumentów. Szczegóły cennika można znaleźć na stronie aka.ms/TranslatorPricing.

Dowiedz się, jak rozpocząć pracę z tłumaczeniem dokumentów na stronie aka.ms/DocumentTranslationDocs.
Wyślij swoją opinię do mtfb@microsoft.com.