본문 바로가기

테크크런치기사

Flitto의 언어 데이터는 기계 번역 시스템의 정확성을 높여줍니다.

https://techcrunch.com/2017/11/26/flittos-language-data-helps-machine-translation-systems-get-more-accurate/?ncid=rss

Flitto의 창립자이자 CEO 인 Simon Lee

인공 지능 기반의 번역은 점점 더 혼잡 해지고 있으며, Google, Microsoft, Amazon 및 Facebook은 모두 자체 서비스로 작업하고 있습니다. 그러나 기술은 여전히 ​​전문적인 인간의 번역과 일치하지 않으며 기계로 생성 된 결과는 종종 맞지 않습니다. 하나의 온라인 번역 서비스 인 Flitto 는 이제 다른 회사에 기계 번역 프로그램을 교육하는 데 필요한 언어 데이터를 제공하는 데 중점을두고 있습니다.

서울에 본사를두고있는 Flitto는 2012 년에 번역 크라우드 소싱 플랫폼으로 출시되었습니다. 모바일 앱에서 전문 번역가에 이르기까지 약 750 만 명의 사용자에게 번역 서비스를 제공합니다. 그러나 매출의 약 80 %는 Baidu, Microsoft, Tencent, NTT DoCoMo, 한국 정부 전자 통신 연구원 등의 고객들에게 "corpus"라는 언어 데이터를 판매 한 결과입니다.

5 년 전에 출시 된 Flitto의 주요 경쟁은 Google 번역이었으며 창립자 겸 CEO 인 Simon Lee는 말합니다. Google 번역은 혼합 된 결과를 제공했지만 대부분의 사람들은 전문 번역 서비스에 액세스 할 수 없었습니다. 플리또 (Flitto)는 일본 게임 개발 업체 인 콜럽 (Colopl)이 후원자로 합류했다. 요청자가 번역을 선택하면 120 만 명의 번역가와 함께 번역가가 지급됩니다.

그런 다음 2016 년 Google은 신경 시스템 번역 시스템을 도입하여 Google 번역의 정확성을 향상 시켰습니다. 현재 마이크로 소프트, 아마존, 페이스 북, 애플 등 많은 빅 테크 기업들이 자체 인공 지능 번역 도구 개발에 주력하고 있습니다.

결과가 나아지고 있지만, 여전히 불완전합니다. 인공 지능 기반의 번역 시스템에는 Flitto가 들어오는 곳에서 많은 양의 데이터가 필요합니다.

"서로 다른 상황에서 다른 의미를주는 무언가를 번역하는 방법은 여러 가지가 있으므로 엄청난 양의 데이터와 인간이 올바른지 확인하기 위해 모든 데이터를 검사해야합니다."Lee의 설명입니다.

그는 "코퍼스를 구축하는 것은 어렵고 IT 회사는 기술에 중점을 둠으로써 코퍼스 구축을 좋아하지 않는다"고 덧붙였다.

Flitto의 앱은 먼저 기계 번역을 제공 한 다음 요청이있을 경우 crowdsourced 번역을 제공합니다.

Flitto의 코퍼스는 속어, 대중 문화 참조 또는 기계 번역 서비스를 방해 할 수있는 방언과 같은 것에 사용되는 crowdsourcing 서비스에서 인간이 번역 한 문장 세트를 포함합니다. Lee는 지난 5 년 동안 Flitto가 1 억 개 이상의 번역 된 언어 데이터 세트를 축적했다고 말합니다.

코퍼스 제공 업체에는 옥스포드 대학 출판사 (Oxford University Press)가 있으며 옥스포드 잉글리시 코퍼스 (Oxford English Corpus )와 Microsoft 및 Google 같은 회사 는 시스템을 교육하기 위해 자료를 구축했습니다. 그러나 새로운 자료는 많은 자원을 필요로하기 때문에 끊임없이 새로운 코퍼스에 대한 수요가 존재합니다. Deepmind의 AlphaGo와 같은 프로그램은 인간의 도움이 거의없이 스스로 훈련 할 수 있지만 기계 번역은 여전히 ​​사람의 손길이 필요합니다.

"다른 분야에서 기계는 자체 데이터를 만들 수 있지만 언어와 번역에서는 기계가 번역 데이터를 직접 만드는 것은 불가능합니다."Lee의 말입니다. "그래서 모든 데이터를 처리하는 인간 번역가가 항상 있어야합니다."