Menerjemahkan dokumen PDF yang dipindai dengan terjemahan Dokumen
Hari ini, Terjemahan dokumen Fitur Translator, Microsoft Azure Cognitive Service, menambahkan kemampuan untuk menerjemahkan dokumen PDF yang berisi konten gambar yang dipindai, menghilangkan kebutuhan pelanggan untuk memprosesnya terlebih dahulu melalui mesin OCR sebelum diterjemahkan.
Terjemahan dokumen tersedia secara umum tahun lalu, 25 Mei 2021, memungkinkan pelanggan untuk menerjemahkan seluruh dokumen dan kumpulan dokumen menjadi lebih dari 110 bahasa dan dialek sambil mempertahankan tata letak dan pemformatan file asli. Terjemahan dokumen mendukung berbagai jenis file, termasuk Word, PowerPoint dan PDF, dan pelanggan dapat menggunakan model terjemahan mesin pra-dibangun atau kustom. Terjemahan dokumen siap untuk perusahaan dengan autentikasi Azure Active Directory, menyediakan akses aman antara layanan dan penyimpanan melalui Identitas Terkelola.
Menerjemahkan PDF dengan konten gambar yang dipindai adalah fitur yang sangat diminta dari pelanggan terjemahan Dokumen. Pelanggan merasa sulit untuk memisahkan dokumen PDF yang memiliki teks biasa atau konten gambar yang dipindai melalui otomatisasi. Ini menciptakan masalah alur kerja karena pelanggan harus merutekan dokumen PDF dengan konten gambar yang dipindai terlebih dahulu ke mesin OCR sebelum mengirimnya ke terjemahan dokumen.
Layanan terjemahan dokumen sekarang memiliki kecerdasan
- untuk mengidentifikasi apakah dokumen PDF berisi konten gambar yang dipindai atau tidak,
- untuk merutekan PDF yang berisi konten gambar yang dipindai ke mesin OCR secara internal untuk mengekstrak teks,
- untuk merekonstruksi konten yang diterjemahkan sebagai PDF teks biasa sambil mempertahankan tata letak dan struktur asli.
Pemformatan font seperti tebal, miring, garis bawah, sorotan, dll. tidak disimpan untuk konten PDF yang dipindai karena teknologi OCR saat ini tidak menangkapnya. Namun, pemformatan font dipertahankan saat menerjemahkan dokumen PDF teks biasa.
Terjemahan dokumen saat ini mendukung dokumen PDF yang berisi konten gambar yang dipindai dari 68 bahasa sumber menjadi 87 bahasa target. Dukungan untuk sumber tambahan dan bahasa target akan ditambahkan pada waktunya.
Sekarang lebih mudah bagi pelanggan untuk mengirim semua dokumen PDF ke terjemahan Dokumen secara langsung dan membiarkannya memutuskan kapan dan bagaimana menggunakan mesin OCR secara efisien.
Untuk pelanggan yang sudah menggunakan terjemahan Dokumen, tidak diperlukan perubahan kode untuk dapat menggunakan fitur baru ini. Dokumen PDF dengan konten yang dipindai dapat dikirimkan untuk terjemahan seperti format dokumen lain yang didukung.
Kami juga dengan senang hati mengumumkan bahwa terjemahan Dokumen menambahkan dukungan untuk konten dokumen PDF yang dipindai tanpa biaya tambahan kepada pelanggan. Dua paket harga tersedia untuk terjemahan Dokumen melalui Azure — paket Bayar sesuai pemakaian dan paket diskon volume D3 untuk volume terjemahan dokumen yang lebih tinggi. Detail harga dapat ditemukan di aka.ms/TranslatorPricing.
Pelajari cara memulai terjemahan Dokumen di aka.ms/DocumentTranslationDocs.
Kirim umpan balik Anda ke mtfb@microsoft.com.