Μετάφραση σαρωμένων εγγράφων PDF με μετάφραση εγγράφου
Σήμερα, η Μετάφραση εγγράφων Η δυνατότητα translator, μιας γνωστικής υπηρεσίας Microsoft Azure, προσθέτει τη δυνατότητα μετάφρασης εγγράφων PDF που περιέχουν σαρωμένο περιεχόμενο εικόνας, εξαλείφοντας την ανάγκη των πελατών να τα προεπεξεργάσουν μέσω ενός μηχανισμού OCR πριν από τη μετάφραση.
Η μετάφραση εγγράφων ήταν γενικά διαθέσιμη πέρυσι, 25 Μαΐου 2021, επιτρέποντας στους πελάτες να μεταφράσουν ολόκληρα έγγραφα και παρτίδες εγγράφων σε περισσότερα από 110 γλώσσες και διάλεκτοι διατηρώντας παράλληλα τη διάταξη και τη μορφοποίηση του αρχικού αρχείου. Η μετάφραση εγγράφων υποστηρίζει διάφορους τύπους αρχείων, συμπεριλαμβανομένων των Word, PowerPoint και PDF, και οι πελάτες μπορούν να χρησιμοποιήσουν είτε προ-κατασκευασμένα είτε προσαρμοσμένα μοντέλα μηχανικής μετάφρασης. Η μετάφραση εγγράφων είναι έτοιμη για επιχειρήσεις με έλεγχο ταυτότητας της υπηρεσίας καταλόγου Active Directory Azure, παρέχοντας ασφαλή πρόσβαση μεταξύ της υπηρεσίας και του χώρου αποθήκευσης μέσω διαχειριζόμενης ταυτότητας.
Η μετάφραση PDF με σαρωμένο περιεχόμενο εικόνας είναι μια λειτουργία που ζητήθηκε ιδιαίτερα από τους πελάτες μετάφρασης εγγράφων. Οι πελάτες δυσκολεύονται να διαχωρίσουν έγγραφα PDF που έχουν κανονικό κείμενο ή σαρωμένο περιεχόμενο εικόνας μέσω αυτοματισμού. Αυτό δημιουργεί προβλήματα ροής εργασίας, καθώς οι πελάτες πρέπει πρώτα να δρομολογήσουν έγγραφα PDF με σαρωμένο περιεχόμενο εικόνας σε μηχανισμό OCR πριν τα στείλουν σε μετάφραση εγγράφων.
Οι υπηρεσίες μετάφρασης εγγράφων έχουν τώρα τις πληροφορίες
- για να προσδιορίσετε αν το έγγραφο PDF περιέχει σαρωμένο περιεχόμενο εικόνας ή όχι,
- για τη δρομολόγηση PDF που περιέχουν σαρωμένο περιεχόμενο εικόνας σε μηχανισμό OCR εσωτερικά για την εξαγωγή κειμένου,
- για την ανακατασκευή του μεταφρασμένου περιεχομένου ως κανονικού κειμένου PDF διατηρώντας παράλληλα την αρχική διάταξη και δομή.
Μορφοποίηση γραμματοσειράς όπως έντονη γραφή, πλάγια γραφή, υπογράμμιση, επισημάνσεις κ.λπ., δεν διατηρούνται για σαρωμένο περιεχόμενο PDF, καθώς η τεχνολογία OCR δεν τα καταγράφει αυτήν τη στιγμή. Ωστόσο, η μορφοποίηση γραμματοσειράς διατηρείται κατά τη μετάφραση εγγράφων PDF κανονικού κειμένου.
Η μετάφραση εγγράφων υποστηρίζει αυτήν τη στιγμή έγγραφα PDF που περιέχουν σαρωμένο περιεχόμενο εικόνας από 68 γλώσσες προέλευσης σε 87 γλώσσες-στόχους. Η υποστήριξη για πρόσθετες γλώσσες προέλευσης και προορισμού θα προστεθεί σε εύθετο μαθήματα.
Τώρα είναι ευκολότερο για τους πελάτες να στέλνουν όλα τα έγγραφα PDF απευθείας στη μετάφραση του Εγγράφου και να το αφήνουν να αποφασίζει πότε και πώς να χρησιμοποιεί αποτελεσματικά τη μηχανή OCR.
Για τους πελάτες που χρησιμοποιούν ήδη μετάφραση εγγράφου, δεν απαιτείται αλλαγή κώδικα για να μπορούν να χρησιμοποιήσουν αυτήν τη νέα δυνατότητα. Τα έγγραφα PDF με σαρωμένο περιεχόμενο μπορούν να υποβληθούν για μετάφραση όπως και οποιεσδήποτε άλλες υποστηριζόμενες μορφές εγγράφων.
Είμαστε επίσης στην ευχάριστη θέση να ανακοινώσουμε ότι η μετάφραση του εγγράφου προσθέτει υποστήριξη για σαρωμένο περιεχόμενο εγγράφου PDF χωρίς πρόσθετες χρεώσεις στους πελάτες. Δύο προγράμματα τιμολόγησης είναι διαθέσιμα για μετάφραση εγγράφων μέσω Azure — το πρόγραμμα Pay-as-you-go και το πρόγραμμα έκπτωσης όγκου D3 για μεγαλύτερους όγκους μετάφρασης εγγράφων. Λεπτομέρειες τιμολόγησης μπορείτε να βρείτε στη aka.ms/TranslatorPricing.
Μάθετε πώς μπορείτε να ξεκινήσετε με τη μετάφραση εγγράφων στο aka.ms/DocumentTranslationDocs.
Στείλτε τα σχόλιά σας στο mtfb@microsoft.com.