구글 퇴사하고, 구글보다 뛰어난 인공지능 번역 시스템을 개발하기까지
구글 퇴사하고, 구글보다 뛰어난 인공지능 번역 시스템을 개발하기까지
2022-11-07

“어떤 식재료를 사용하느냐에 따라
신선하고 맛있는 음식이 될 수도 있고,
그렇지 않을 수도 있죠.
그런 점에서 XL8는 식재료의 역할을 하는
데이터를 굉장히 중요하게 보고 있어요.”

  • 전 세계적으로 사랑받았던 넷플릭스의 <오징어 게임> 시리즈. 한때 유튜브에서는 <오징어 게임> 속 수많은 명대사가 각국에서는 어떻게 번역되었는지 보여주는 콘텐츠가 인기를 끌었습니다. 한국어만의 말맛을 얼마나 잘 살려냈는지를 살펴보는 재미가 쏠쏠했죠. 이처럼 콘텐츠의 글로벌화가 활발해지면서, ‘번역’의 중요성 또한 점점 커지고 있는데요. 레드오션인 번역 시장에서 ‘미디어 콘텐츠’ 번역으로 자리를 잡고 있는 스타트업이 있습니다. 구글 본사에서 자연어 처리 시스템 프로젝트를 리딩한 후, AI 번역 스타트업을 창업한 XL8 정영훈 대표를 만나봤습니다.

1. 안녕하세요, 인공지능 번역 스타트업 XL8 대표 정영훈입니다

삼성전자 스마트폰 플랫폼을 만드는 부서에서 커리어를 시작했습니다. 글로벌 기업인 인텔(Intel)과의 합작을 통해 프로젝트를 진행했는데요. 당시 스마트 TV, 스마트폰, 스마트워치에 들어가는 플랫폼 개발하는 일을 담당했습니다. 이후 2011년 미국 컬럼비아대학으로 유학을 가 컴퓨터공학으로 박사 학위를 취득, 구글에 입사했습니다. 구글에서는 서치팀(Search Team)의 소프트웨어 엔지니어로 근무했는데요. 거대한 자연어 처리(Natural Language Processing, NLP) 시스템을 출시하는 프로젝트를 리딩했어요.
(*NLP: 컴퓨터를 이용해 사람의 자연어를 분석하고 처리하는 기술)

자연어 처리 분야는, 중의적인 의미를 잘 예측하고 판단해야 하는 분야라는 점에서 매우 흥미롭습니다. 예를 들어 ‘자동차’라는 단어를 검색했다고 가정해 볼게요. 이때, 검색한 사람의 검색 의도가 자동차를 사고 싶은  건지, 근처에 있는 중고 자동차 판매 시장의 현황을 알고 싶은 건지, 아니면 새로 나온 자동차 판매 모델이 궁금한 건지 변수가 참 많죠. 또한, 검색자가 사는 배경은 어떤지, 이 지역에서 가장 많이 검색된 단어는 무엇인지 등, 마치 포춘 텔러(Fortune-teller)처럼 검색자의 의도를 파악하므로 엄청나게 많은 연산 과정이 필요해요. 이렇게 복잡하고 변수가 많은 자연어 처리 프로젝트를 리딩하면서 이 분야에 대한 자신감을 갖게 됐죠.

2. 레드오션인 번역시장에서, 새로운 기회를 찾았어요

창업에 대한 꿈은 오래전부터 갖고 있었어요. 내가 스타트업으로 이뤄낼 수 있는 분야가 뭘까 계속 생각해왔고, 구글에서의 경험을 통해 자연스럽게 자연어 처리, 번역을 그 분야로 선택했습니다. 더불어 저는 미국에 산 지 12년 차가 된, 영어가 모국어가 아닌 한국인인데요. 제2외국어인 영어를 어떻게 하면 잘 학습해 자유자재로 구사할 수 있을지에 대한 고민이 많았습니다. 언어가 통하지 않으면 모든 생활 범위가 한정적일 수밖에 없거든요. 저는 기술이 언어 장벽의 해결책이 될 거라 확신했어요. 기술을 통해 사람들이 언어를 더 편하게, 그리고 부담 없이 받아들일 수 있을 것이라 생각했습니다.

때마침 전 세계적으로 번역 시장의 수요는 계속해서 증가하는 추세였어요. 지금도 물론 마찬가지고요. 이미 레드오션일 수도 있는 시장에서 저희는 미디어에 특화된 기계번역 분야에 집중했습니다. 그동안 번역 시장에 뛰어든 대부분의 기업들은 문어체 번역에 집중된 기술을 개발해왔어요. 저희는 미디어에 특화된 전략을 취한 만큼, 구어체 번역으로 영역을 잡았죠. 오랫동안 고착화되어있던 번역 시장에서 새로운 기회를 찾게 된 겁니다. ‘기계 번역’이야말로 미디어 번역 시장을 완전히 바꿔놓을 수 있겠다는 가설이 세워졌어요.

3. 빅테크 기업에서의 인연을 통해 공동 창업가를 만났습니다

오른쪽부터 박진영 CTO, 정영훈 CEO, Josh Pine CRO (출처: XL8)

공동 창업가인 박진형 CTO와는 콜롬비아대학교에서 박사 과정 중에 처음 만났어요. 졸업 후 저는 구글에서, 박진형 CTO는 애플에서 엔지니어로 근무를 시작했어요. 그렇게 4년 정도 일을 하다가, 기계 번역 분야로 창업을 하고 싶다는 이야기를 털어놓으니, 함께하고 싶다고 하더라고요. 최고의 퍼포먼스를 내는 동시에 협업이 원활한 분들로 팀 세팅을 진행했고, 현재는 23분 정도의 팀원분들이 합류해 함께하고 있습니다.

4. 시장 상황에 맞춰서 프로덕트를 얼라인시키는 것이 중요합니다

번역 시장은 트렌드가 굉장히 빠르게 변화하는 시장입니다. AI 기계번역이라는 저희의 사업 아이템을 고도화하기 위해 시장 조사를 부지런히 하고 있어요. 미디어 번역을 잘하고 있는 회사는 어딘지, 시장 규모는 얼마나 확장할 것으로 예상되는지, 우리의 제품이 어느 정도의 경쟁력을 갖고 얼마 만큼의 매출을 창출해낼 수 있을지 등 통상적인 조사를 진행하고 있습니다.

(출처: Pixabay)

넷플릭스, 왓챠, 쿠팡플레이 등 여러 OTT 플랫폼들이 경쟁적으로 글로벌 콘텐츠를 제공하기 시작하면서, 이제는 우리에게 익숙했던 영미권 문화만이 아닌 다른 문화권의 콘텐츠 또한 대중들에게 사랑받고 있잖아요. 이렇게 대중의 트렌드가 어떤 방향으로 변화하고 있는지 파악하고, 우리가 만드는 프로덕트를 시장 상황에 얼라인시키는 것, 즉 ‘프로덕트 마켓 핏(Product Market Fit)’을 잘 찾는 것이 중요합니다

5. 데이터는 식재료고, 네트워크는 레시피에요

저는 인공지능 서비스 개발 과정이 요리와 유사하다고 생각해요. 데이터를 ‘식재료’에, 인공지능에 사용되는 모델이나 네트워크 등을 ‘레시피’라고 비유해볼게요. 요리를 할 때 레시피는 굉장히 중요합니다. 떡볶이를 만들기 전 유튜브에 ‘떡볶이 레시피’라고 검색해볼까요. 그러면 백종원님이 소개한 레시피부터 다양한 요리 방법들이 나오죠. 정해진 레시피대로만 요리를 하면 원하는 맛이 그대로 구현될 텐데요. 여기서 맛의 차이를 만들어 내는 건 식재료예요. 어떤 식재료를 사용하느냐에 따라 신선하고 맛있는 음식이 될 수도 있고, 그렇지 않을 수도 있죠. 그런 점에서 XL8는 식재료의 역할을 하는 데이터를 굉장히 중요하게 보고 있어요. 데이터의 적합성과 퀄리티에 집중하는 거죠.

(출처: XL8 블로그)

품질 높은 번역의 핵심은 ‘문맥’을 잘 인식한 번역입니다. XL8는 문맥 인식 번역을 통해 앞뒤 상황적 맥락이 잘 녹아들도록 훌륭하게 번역을 진행합니다. 사실 문맥 인식 번역의 개념 자체는 완전히 새로운 것이 아니에요. 이미 문맥 인식 번역을 이론적으로 가능하게 하는 기술은 충분히 마련되어 있습니다.

여기서 XL8만이 가진 좋은 식재료, 데이터의 힘이 발휘합니다. XL8는 지난 20년 동안 전문 번역가가 직접 번역한 고품질 번역 데이터를 활용해 번역 엔진에 학습시켰습니다. 일반적으로 쉽게 얻을 수 있는 번역 데이터가 아닌, 문장의 앞뒤 맥락을 반영할 수 있도록 심층적인 대화를 모두 포함하는 거죠. 예를 들어 한국어의 경우, 존댓말과 반말이 잘못 번역될 경우 거의 데이터를 사용하지 못합니다. 어투에도 –하소서,-합쇼,-해라 등 여러 종류가 있잖아요? 그 말투에 맞춰서 번역할 수 있도록 만들었고, 마찬가지로 장르에 맞게 번역하는 기술을 개발하면서 퀄리티가 굉장히 좋아졌죠. 유명한 맛집에는 그들만의 숨겨진 비법이 있기 마련인데요. 데이터가 바로 저희만의 ‘비법’이라고 할 수 있습니다. 현재 글로벌 번역 서비스 제공업체 ‘아이유노’와 협업을 통해 계속해서 기술을 고도화하고 있어요.

6. 미디어 콘텐츠 번역을 기반으로 성장하고 있는 곳은 XL8가 유일합니다

전 세계에 기계 번역을 하는 회사는 약 50곳 정도입니다. 구글, 마이크로소프트, 아마존과 같은 거대 기업이 중심을 잡고 있고, 그 밖에 중견기업, 스타트업들이 자리하고 있죠. 그중에 미디어 콘텐츠 번역을 기반으로 성장하고 있는 기업은 XL8이 현재로서는 유일합니다.

앞서 말씀드렸듯, 저희는 모든 번역어를 만들 때 미디어 콘텐츠에서 나온 자료를 포함, 정확한 퀄리티의 언어를 기반으로 만듭니다. 그렇기 때문에 저희가 개발한 번역어를 미디어 콘텐츠에 적용했을 때 오류가 날 확률이 낮아요. 이 분야에 다른 기업들이 쉽게 진입하지도 못합니다. 처음에는 우리의 경쟁 서비스가 구글 번역 서비스라고 생각해서 비교를 했는데요. 이제는 저희가 비교할 수 없을 정도로 높은 퀄리티를 자랑하고 있습니다. 그 이유는 이 도메인에서 가장 적합한 데이터를 썼다는 점, 그리고 그 데이터가 아무 데서나 클라우드소싱을 해서 만든 자막이 아닌, 전문가들이 고치고 또 고쳐서 한 땀 한 땀 만들어낸 100% 수작업으로 이뤄진 자막이기 때문이죠.

7. 휴먼 번역가가 일하는 방식은 이미 꽤 많이 변화했어요

기존의 번역 프로세스는 사람이 번역을 한 뒤, 다른 번역가들이 수정을 하는 구조였습니다. 사람이 하는 번역에는 오류가 있을 수 있기 때문에, 여러 명의 번역가가 더 적합한 언어로 바꾸는 과정을 두세 번씩 거쳤는데요. 이제는 저희의 엔진을 활용해서 초벌 번역을 하고, 그 뒤에 전문 번역가들이 부드럽고 자연스럽게 바꾸는 작업을 진행하기 때문에 훨씬 그 과정이 편리하고 수월해졌죠. 전체적인 시간과 비용이 절약된 겁니다. 앞으로는 실시간 번역, 통역, 현장 생중계 등 휴먼 터치와 더불어 기계의 정확성이 필요한 번역 분야에 더 진출할 계획을 갖고 있어요.

8. 구성원들의 이해와 협력을 끌어내는 것, 가장 어렵지만 보람된 일입니다

사람들은 모두 저마다의 창문을 갖고 살아갑니다. 어떤 창문을 보느냐에 따라 특정 사건을 보는 관점이 달라지기 마련이죠. 가령 조직 내에서 내 행동의 의도를 다른 팀원은 다르게 받아들일 수 있는 거예요. ‘저 사람이 열심히 일하는 건 알겠는데 왜 이런 방식으로 일을 진행할까?’에 대한 의문을 품고 있는 사람들도 많을 테고요.

구성원들 간의 불필요한 오해가 생기지 않고, 업무 몰입에 방해되지 않도록 잘 조율하는 게 초기 스타트업 대표의 역할인 것 같아요. 정말 쉽지 않지만 그만큼 보람된 일이기도 해요. 결국은 구성원들이 서로를 잘 이해하고 협력으로 나아갈 수 있도록 하는 역할이 중요하다고 생각합니다.  

9. 먼저 자신의 분야에서 최고가 되어보는 것이 중요해요

실리콘밸리의 창업가들은 모두 다양한 백그라운드를 갖고 있어요. 디자이너 출신, 엔지니어 출신, 파이낸스, 법 등 이력이 정말 다양합니다. 그렇게 여러 백그라운드를 갖고 창업한 사람들 대부분 자신의 분야에서는 충분한 전문성을 갖추고 있습니다. 성공할 수 있을 만큼의 실력과 일하는 스킬, 그리고 안목을 쌓아서 이를 확장해 창업을 잘 이끌어 가시는 사람들인 거죠.

물론 페이스북 창업가와 같이 아무런 사회 경험 없이도 성공하는 경우도 많습니다. 그럼에도 자신의 현재 경험이 미래의 자산이 되기 때문에 지금 내가 하고 있는 일을 어떻게 남들보다 더 잘할지, 큰 임팩트를 낼 수 있을지 고민을 많이 해보는 것이 중요할 것 같아요.

10. 더 많은 사람들이, 더 자유롭게 언어의 장벽을 허무는 그날까지

XL8의 비전은 언어의 장벽을 허물어 사람들이 자유롭고 부담 없이 소통할 수 있게 만드는 것입니다. 저는 우리 회사의 비전을 성공적으로 이룬 창업가로 남고 싶어요. 언어를 습득하면 내가 대화할 수 있는 상대, 읽을 수 있는 문서, 진출할 수 있는 시장이 커지는 만큼 굉장히 큰 삶의 가치를 창출할 수 있어요. 더 많은 사람들의 언어의 장벽을 하나씩 없애는 걸 이뤄내고 싶습니다.


XL8 정영훈 대표

안녕하세요. 엑스엘에이트(XL8) 창업자이자 CEO를 맡고 있는 정영훈입니다.
창업 직전까지 구글에서 자연어처리 시스템 개발 리드를 담당했고, 많은 발전이 있었지만 구글도 미디어 번역 분야에서 여전히 해결하지 못하는 문제가 많았습니다.
그러한 문제를 해결하고자 “혁신적인 인공지능 기술로 언어 장벽을 허물어 모두가 더욱 넓은 세상을 경험하게 한다”라는 비전을 가지고 회사를 창업했습니다.
다양한 미디어 콘텐츠에 최적화된 최상의 기계번역을 제공하는 세계 최고의 기업이 되어, 문화나 언어가 달라도 시청자는 원본 콘텐츠의 감동을 원어민과 똑같이 느낄 수 있도록 만들어 주는 게 저희의 목표입니다.