Προσαρμόσιμη μεταγραφή ομιλίας, μετάφραση και σύνθεση τώρα διαθέσιμη στην ενοποιημένη υπηρεσία ομιλίας
Ενοποιήστε την ομιλία στις εφαρμογές, τις ροές εργασίας και τις τοποθεσίες Web που χρησιμοποιείτε με την ενοποιημένη υπηρεσία ομιλίας, που ανακοινώθηκε αυτήν την εβδομάδα στο Δημιουργία Microsoft. Η ομιλία συνδυάζει τις δυνατότητες του υπάρχοντος API ομιλίας μετάφρασης, του API ομιλίας Bing και της υπηρεσίας προσαρμοσμένης ομιλίας (προεπισκόπηση) σε μια ενοποιημένη και πλήρως προσαρμόσιμη υπηρεσία.
Μπορείτε τώρα να χρησιμοποιήσετε την ομιλία στο κείμενο, τη μετάφραση ομιλίας και το κείμενο σε υπηρεσίες ομιλίας με την ίδια συνδρομή. Και οι τρεις υπηρεσίες μπορούν να προσαρμοστούν χρησιμοποιώντας την προεπισκόπηση του νέες προσαρμοσμένες λειτουργίες ομιλίας, μετάφρασης και φωνής, ανακοινώθηκε επίσης αυτή την εβδομάδα σε/build:
- Ομιλία σε κείμενο (μεταγραφή ομιλίας) – μετατροπή ομιλητικού ήχου σε κείμενο με προεπιλεγμένα ή προσαρμοσμένα μοντέλα προσαρμοσμένα σε συγκεκριμένο λεξιλόγιο ή στυλ ομιλίας των χρηστών (προσαρμογή μοντέλου γλώσσας) ή για καλύτερη αντιστοιχία με το αναμενόμενο περιβάλλον, όπως με το φόντο ήχου (προσαρμογή ακουστικού μοντέλου). Η τεχνολογία ομιλίας σε κείμενο ενεργοποιεί ένα ευρύ φάσμα περιπτώσεων χρήσης, όπως φωνητικές εντολές, μεταγραφές σε πραγματικό χρόνο και ανάλυση κλήσεων στο κέντρο κλήσης.
- Κείμενο σε ομιλία (σύνθεση ομιλίας)-φέρνοντας τη φωνή σε οποιαδήποτε εφαρμογή μετατρέποντας το κείμενο σε ήχο σε άμεσο πραγματικό χρόνο με την επιλογή πάνω από 75 προεπιλεγμένες φωνές, ή με τα νέα προσαρμοσμένα μοντέλα φωνής, δημιουργώντας μια μοναδική και αναγνωρίσιμη φωνή επωνυμίας συντονισμένοι στις δικές σας ηχογραφήσεις.
- Μετάφραση ομιλίας – παροχή δυνατοτήτων μετάφρασης ομιλίας σε πραγματικό χρόνο με μοντέλα βασισμένα σε τεχνολογίες νευρωνικών μηχανών (NMT). Μπορούν τώρα να προσαρμοστούν τρία στοιχεία του αγωγού μετάφρασης ομιλίας: αναγνώριση ομιλίας, κείμενο σε ομιλία και μηχανική μετάφραση.
Νευρικές μεταφράσεις με η νεότερη έκδοση του API κειμένου μετάφρασης (έκδοση 3), μπορείτε επίσης να χρησιμοποιήσετε προσαρμοσμένα συστήματα που έχουν κατασκευαστεί με τη νέα προσαρμοσμένη δυνατότητα μετάφρασης.
Αυτή τη στιγμή η ενοποιημένη υπηρεσία ομιλίας προσφέρεται ως προεπισκόπηση. Για τη μετάφραση ομιλίας που απαιτεί μια υπηρεσία στη γενική διαθεσιμότητα, οι προγραμματιστές θα πρέπει να συνεχίσουν να χρησιμοποιούν το API ομιλίας μετάφρασης της Microsoft. Παρακαλούμε ακολουθήστε το μεταφραστή της Microsoft Blog Και Πειραχτήρι σελίδα για να συνεχίσετε, ενημερωμένες ανακοινώσεις της υπηρεσίας μετάφρασης της Microsoft.
Μάθετε περισσότερα για το Ιστολόγιο γνωστικών υπηρεσιών.