번역 품질 테스트: 게스트 블로그
아난드 chakravarty는 지난 2.5 년 동안 기계 번역 팀의 sdet 이며, 8 년 동안 마이크로소프트에서 왔으며, mt 팀의 첫 번째 제품 테스터 였습니다 (그리고 "mt:-)를 테스트 하는 데 여전히 재미 있다"). 오늘의 게스트 블로그는 번역 품질을 테스트 하는 것입니다.
—————————————————————————————————————
번역 시스템의 품질을 확인 하는 것에 대해 이야기 할 때 마음에 오는 첫 번째 점 중 하나는 품질을 측정 하거나 번역의 정확성을 정확 하 게 하는 것입니다. 컴퓨터를 사용 하 여 인간의 언어를 번역 하는 것은 거의 반세기 오래 된 필드입니다. 이 지역은 현재 사용 가능한 최고의 기계 번역 시스템 조차도 완전히 만족할 만한 언어적 품질을 얻기에는 충분 하지 않을 정도로 도전적입니다.
도전의 일부는 사람들이 말한/서 면 텍스트의 의미를 이해 하기 위해 처리 하는 많은 다른 데이터 포인트입니다. 구문, 구문 분석, 의미 체계, 컨텍스트, 명확성, 재정렬 등이 있으며 문장을 이해 하는 데 더 많이 들어갑니다. 그리고 이것은 단지 1 언어의 문장입니다. 이제 다른 언어로 문장을 다시 작성 하 고 동등 하 게 의미 있도록 모든 그것을 적용 하는 것이 좋습니다.
몇 가지 예는이 점을 명확 하 게 하는 데 도움이 될 수 있습니다. ' 올림픽 2008 ' 이라는 용어는 상당히 모호 합니다. 마찬가지로, ' 선거 2008 ' 이라는 용어는 미국의 대통령 선거를 의미 하는 것으로 예상할 수 있다. 그러나, 사용자가 캐나다 라고 하는 경우에는 지역 선거를 언급할 가능성이 더 큽니다.
더 일반적이 고, 따라서 더 일반적인 예는 ' 메모가 잘못 되었습니다 '와 같은 문장입니다. 단어 ' 참고 ' 정보 메시지 또는 음악 용어에 대 한 참조? 적절 한 변환은 컨텍스트에 따라 달라 집니다. 더 많은 맥락을 사용 하 고, 더 정확한 번역을 얻을 확률이 향상 됩니다. 그러나 이것은 비용에 온다: 시스템에서 더 많은 컨텍스트를 가져오려고 하면 성능이 느려집니다. 스마트 배송 의사 결정은 번역의 정확성을 개선 하 고 사용자에 게 가능한 번역 결과를 제공 하는 것 사이에 적절 한 균형을 유지 하는 것을 포함 합니다. 물론, 둘 다 중요 합니다. 핵심은 최종 결과가 사용자에 게 얼마나 유용한가에 따라 개선에 대 한 직접적인 노력을 이해 하는 것입니다.
이는 개별 문장이 아니라 문서나 웹 페이지를 번역할 때 특히 흥미롭습니다. 우리는 100 문장을 포함 하는 웹 페이지에 대 한 번역 요청을 수신 했다고 가정 해 봅시다. 번역 시스템의 아키텍처에 따라 이러한 문장은 모두 하나의 프로세스로 이동 하거나 여러 프로세스/시스템에 분산 될 수 있습니다. 어느 쪽이 든이 페이지 전체를 번역 하는 데 걸린 시간이 문장을 번역 하는 데 걸린 최대 시간에 비례 한다는 것은 분명 합니다. 투자 시간이 사용자의 시간에 해를 끼칠 수 있기 전에 문장을 번역 하는 데 얼마나 걸립니까? 최고의 번역을 추구, 우리는 그들의 번역 요청에 대 한 응답에 아무것도 정보를 얻기에서 사용자를 차단 끝낼 수 있습니다. 따라서 시스템의 유용성은 언어적 품질 및 응용 프로그램 성능의 균형을 유지 하기 위해 결정 됩니다.
마이크로 소프트 번역기 제품으로, 우리의 이중 언어 뷰어의 추가 기능이 있다, 공개적으로 사용할 수 있는 번역 제품 중 독특한 무언가. 병렬 텍스트 강조 표시, 동기화 된 스크롤을 지원 하 고 점진적 렌더링을 사용 하 여 페이지를 제공 합니다. 이렇게 하면 사용자에 게 표시 되는 다른 레이어가 추가 되 고 결과적으로 다른 레이어가 폴란드어 및 마무리 됩니다.
앞으로 몇 주 동안, 우리는 당신에 게 최고 품질의 번역 시스템을 제공 하기 위해 테스트 되 고 있는 특정 분야의 세부 사항을 가져올 수 있도록 노력 하겠습니다. 당신이이 문제에 대 한 질문을 게시 주시기 바랍니다, 당신이 항상 물어보고 싶은 뭔가--), 코멘트 섹션에서.