דלג לתוכן הראשי
תרגום
דף זה תורגם באופן אוטומטי על-ידי שירות תרגום המכונות של Microsoft מתרגם. למד עוד

בלוג מתרגם של מיקרוסופט

בדיקת איכות תרגום: בלוג אורח

ואנאנד Chakravarty הוא SDET על צוות תרגום מכונה עבור העבר 2.5 שנים, כבר ב-Microsoft במשך 8 שנים, והיה הבודק המוצר הראשון על הצוות MT (ו "עדיין נהנה בדיקות MT:-))").  היום הבלוג של האורח הוא על בדיקת איכות התרגום. 

—————————————————————————————————————

אחת הנקודות הראשונות שעולה לראש, כאשר מדברים על אימות איכות של מערכת התרגום, האם כיצד למדוד את האיכות, או להיות מדויק, את הדיוק של התרגום? תרגום בין שפות אנושיות באמצעות מחשבים הוא תחום שכמעט חצי מהמאה הקודמת. האזור הוא מאתגר מספיק, כי גם מערכות תרגום המכונה הטובה ביותר כרגע זמין אינם קרובים להשגת איכות לשונית כי יהיה משביע רצון לחלוטין.

חלק מאתגר הוא נקודות מידע שונות ורבות שבני האדם מעבדים כדי להבין את המשמעות של טקסט מדברי/כתוב. יש את התחביר, את הניתוח, את הסמנטיקה, את ההקשר, את ההתחבולים, את סידור הסדר, כולם, ועוד, נכנסים להבנת משפט. . וזה רק המשפט בשפה אחת כעת שקול ליישם את כל זה כדי לבנות מחדש את המשפט בשפה אחרת ולהפוך אותו משמעותי באותה מידה.

דוגמאות מסוימות עשויות לסייע כדי להבהיר את הנקודה. המונח ' אולימפיאדת 2008 ' הוא די חד משמעי. באופן דומה, אפשר לצפות שהמונח ' בחירות 2008 ' מתכוון לבחירות לנשיאות בארה ב. עם זאת, אם המשתמש הוא מ, נניח, קנדה, סביר יותר להתייחס לבחירות המקומיות שם.

כללי יותר, ולכן נפוץ יותר, דוגמה היא משפט כמו ' הפתק היה שגוי '. האם המילה ' הערה ' היא התייחסות להודעה אינפורמטיבית או למונח מוסיקלי? התרגום המתאים תלוי בהקשר. להשתמש יותר הקשר, ואת הסיכויים שלך לקבל תרגום מדויק יותר לשפר. אולם זה מגיע במחיר: ההקשר יותר המערכת מנסה להשיג, את הביצועים שלה לאט יותר. החלטות משלוח חכמות מעורבות בביצוע האיזון הנכון בין שיפור הדיוק של התרגום והעברת תוצאות תרגום מעשי למשתמשים. . כמובן ששניהם חשובים המפתח הוא להבין היכן אתה מכוון את המאמצים לשיפור בהתאם למידת התועלת הסופית של המשתמש.

זה הופך למעניין במיוחד בעת תרגום מסמכים או דפי אינטרנט, במקום משפטים בודדים בלבד. נניח שבקשה לתרגום התקבלה עבור דף אינטרנט המכיל 100 משפטים. בהתאם לארכיטקטורה של מערכת התרגום, משפטים אלה יכולים כל ללכת לתהליך אחד, או להיות מופץ על פני תהליכים מרובים/מכונות. בכל מקרה, ברור כי הזמן שנלקח לתרגם דף זה בשלמותו הוא פרופורציונלי לזמן המקסימלי שנלקח לתרגם משפט. כמה זמן אנו משקיעים בתרגום משפט לפני שהזמן המושקע הופך למזיק לזמן המשתמש? במרדף אחר התרגום הטוב ביותר, אולי בסופו של דבר לחסום את המשתמש מלקבל משהו אינפורמטיבי בתגובה לבקשת התרגום שלהם. כלי השירות של המערכת מנוהל אפוא על ידי החלטות העשויות לאזן את איכות הלשון ואת ביצועי היישום.

בעזרת המוצר של Microsoft, יש את התכונה הנוספת של הצופה הדו-לשוני שלנו, משהו ייחודי בין מוצרי תרגום זמינים לציבור. הוא תומך בסימון טקסט מקבילי, גלילה מסונכרנת ומציג את הדף (עם) עם עיבוד פרוגרסיבי. זה מוסיף שכבה נוספת למה שהמשתמשים שלנו רואים, וכתוצאה מכך שכבה נוספת לפולנית ולסיום.

בשבועות הקרובים, אנו מקווים להביא לכם פרטים נוספים של אזורים ספציפיים שהיו ונבדקים לשלוח מערכת תרגום באיכות מעולה. הרגש חופשי לפרסם את כל השאלות שיש לך בעניין זה, משהו שתמיד רצית לשאול:-), במקטע הערות.