디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

플리토 이정수 대표 "온디바이스 AI, LLM으로 데이터 중요성 커져"

IT동아갤로그로 이동합니다. 2024.03.04 15:41:55
조회 108 추천 0 댓글 0
[IT동아 남시현 기자]

“언어 번역은 전문가 영역이고, 번역 기술은 인공지능, 개발 영역이다. 대다수 LSP(언어 서비스 제공 기업)는 둘 중 하나를 강조하지만, 플리토는 기계 번역과 직접 번역의 접점을 바탕으로 기술과 사람이 공존하는 개발 환경을 만들고 있다”


이정수 플리토 대표 / 출처=IT동아



이정수 플리토 대표(이하 이 대표)는 성장배경부터 언어와 가까웠다. 외국 주재원인 아버지를 따라 쿠웨이트, 사우디아라비아는 물론 미주, 유럽 등지에서 국제 학교를 다니며 다양한 언어를 경험했고, 대원외고와 고려대를 졸업한 이후에는 SKT에서 해외사업 제휴 및 인수합병 등의 일을 했다. 그러다 ‘스마트폰을 활용해 언어 데이터를 수집하면 언어 보존, 연구 개발에 쓸 수 있겠다’라는 생각을 갖고 2012년 플리토를 창업했다.

이 대표는 ‘언어의 장벽을 무너뜨리자’는 일념 하나로 플리토를 전 세계 1400만 명이 사용하는 참여형 번역 플랫폼을 만들었으며, AI 학습 및 대형언어모델(LLM)용 언어 데이터 수요가 크게 늘면서 플리토 역시 언어 데이터 전문 기업으로 떠올랐다. 이정수 플리토 대표를 만나 사람과 기계 번역의 접점, 그리고 번역 기술의 세계를 직접 들어봤다.

“번역 넘어 언어 데이터 기업추구, GPT가 번역 업계 바꾸는 중”



플리토는 기계 번역과 집단지성 번역을 합친 형태의 서비스를 제공한다 / 출처=IT동아



이 대표는 “지금은 누구나 데이터가 답이라고 하지만, 처음엔 아니었다. 하지만 2016년 딥러닝 기술이 떠오르고, 번역에 인공신경망이 도입되며 번역 기술이 한 단계 진화했다. 플리토가 1000만 명을 넘은 건 2019년의 일”라면서, “시장이 생기며 17년에 본격적으로 데이터 매출을 올렸고, 데이터 품질이 중요해질수록 더 고객이 몰렸다. 현재 매출은 데이터가 80%, 플랫폼이 20%”라고 말했다.

플랫폼은 인공신경망 기반의 기계 번역과 사용자 참여형 번역, 그리고 기계 번역과 문맥에 맞춰 의역을 더하는 ‘플리토 AI+’ 번역 등을 제공한다. 사용자는 언어 실력 향상을 위해 직접 집단지성 번역에 참여하거나 전문 번역 작업 등을 진행할 수 있다. 번역 업계의 강호로 떠오른 ‘딥엘’, 전통적인 번역 강자 ‘구글 번역’과의 차이점은 무엇일까.


플리토는 자체 번역 결과와 타사 번역 결과를 모두 보여주는 기능도 제공한다. 이정수 대표가 직접 플리토와 타사 번역 간의 차이를 설명하고 있다 / 출처=IT동아



이 대표는 “딥엘은 원래 쌍형어 사전을 만드는 기업인데, 이 데이터를 바탕으로 만든 게 딥엘 번역이다. 딥엘은 GPT가 뜨기 전부터 GPT 모델을 적용해 번역 완성도를 높였고, 기존 번역을 패러프레이징(뜻이 바뀌지 않는 선에서 의역)한 결과를 내놓는다. 구글 번역의 경우 인공신경망과 막대한 포털 수집 데이터로 정확도를 높이는데, 플리토 번역은 구글 번역 같은 기계 번역에 가깝다”라며 차이점을 설명했다.

이어서 ‘오늘 날씨가 흐린데, 고량주 한 잔 어때?’라는 문장을 플리토, 구글, 딥엘, 파파고로 각각 번역된 내용을 보여주었다. 그 결과 구글과 플리토의 결과는 정확하게 고량주를 고유명사로 인식해 번역했고, 딥엘은 리큐르나 와인 등 이해가 쉬운 다른 용어로 바꿔 번역했다. 문장 이해의 난도는 딥엘이 좋았지만, 원문을 바꾸는 ‘패러프레이징’이 적용된 탓이다.


최근 플리토의 사례가 미국 CNN 인터내셔널에 생방송으로 보도되기도 했다 / 출처=CNN



이런 번역 특성 덕분에 의료관광 등의 분야에서 호응이 좋다고 한다. 이 대표는 “강남 TU치과나 성형외과 등 외국인 비중이 높은 의료 기관에서 플리토를 쓴다. 기존의 번역기는 범용 엔진이어서 전문 용어 등에 대한 번역 성능이 떨어지는데, 플리토 번역은 기계 번역의 정확성을 유지하면서, 상황에 따라 놓치는 부분을 집단지성 및 전문 번역가의 결과물로 보완하는 게 강점이다”라고 말했다.

데이터 고도화 위한 플랫폼 구상 중··· 성능에도 계속 투자


플리토는 번역 플랫폼을 통해 하루에 약 70만 단어의 데이터를 수집하고, 텍스트뿐만 아니라 광학 문자 인식(OCR), 음성 데이터도 모은다. 텍스트는 플리토 번역 플랫폼 전반에서 유입되고, 이미지나 목소리, 사진 등은 플랫폼 사용자가 제공한다. 또한 다국어 번역이 필요한 해외, 관광 등의 분야를 대상으로 하는 메뉴 및 공간 번역 서비스 ‘플리토 플레이스’로 데이터 수집 자체를 수익 모델로 만들었다.


베트남 하노이의 유명 식당 ‘꽌안응온’에서도 플리토 플레이스 기반의 번역을 제공한다 / 출처=IT동아



이 대표는 “플리토 플레이스는 메뉴판, 간판, 설명 등의 이미지를 전달하면, 그 형태 그대로 번역 데이터를 합성해주는 서비스다. 한국인 관광객이 많은 베트남, 대만의 유명 식당에서 우리 서비스를 쓰고 있고, 국내에서도 신세계백화점, 더현대 서울, 롯데백화점까지 쓰고 있다”라면서, “청계천 및 광화문 일대에 설치된 AI기술 기반 실시간 통번역 대화나 메타 휴먼 기반의 번역 응대 서비스도 주목받고 있다. 실시간 통번역 대화의 경우 11개 국어를 지원한다”라고 말했다.

플리토는 기계와 사람의 혼합번역을 넘어서, 초월번역의 영역까지 도전하고 있다. 최근 사전 테스트를 시작한 ‘데저트 폭스’ 서비스가 대표적이다. 이 대표는 “온라인상에서 사용자들이 주고받는 밈(Meme)을 기계 및 사람이 번역하는 플랫폼을 만들고 있다. 밈의 경우 손글씨나 화질 저하 등 OCR이 불가능한 경우가 많고, 기계번역으로 직독직역하면 이해하기 어려운 뜻이 된다”라면서, “기계 번역과 사용자 번역이 함께하고, 댓글로 번역 결과를 다국어 사용자들이 평가한다. 서비스는 상반기 혹은 그 이후에 계획 중”이라고 말했다.

“온디바이스 AI, LLM, 플리토 사업에 직접 영향 준다”



이정수 대표는 온디바이스 AI로 고품질 언어 데이터의 중요성이 높아질 것으로 본다 / 출처=IT동아



온디바이스 AI는 언어 사업에 어떤 영향을 미칠까. 온디바이스 AI는 서버와의 데이터 송수신 없이 기계 자체에서 AI를 처리하는 방식인데, 가장 먼저 소비자에게 소개된 온디바이스 AI 기술 중 하나가 하필이면 실시간 번역 기술이다. 위기감을 느끼지 않는가 하는 질문이 이 대표는 그렇지 않다고 말했다.

이 대표는 “온디바이스 AI와 해당 기술 기반의 번역이 등장한 것 자체가 환영할 일”이라면서, “하지만 아직 초기 단계여서 외국어에서 한국어 번역은 잘 되나, 반대는 오류가 있는 편이다. 한국어는 문맥을 고려하는데 외국어는 AI가 이를 파악하기 어렵다. 정확도를 높이기 위해서는 플리토처럼 AI 언어 데이터에 한국어 STT (Speech to Text), TTS(Text to Speech) 데이터를 꾸준히 학습시켜 나가야 한다”라고 덧붙였다.


언어의 장벽이 없는 세상이 플리토의 미션이다 / 출처=IT동아



또한 온디바이스 AI를 위한 소형 언어 모델 개발이 가속되면 그만큼 플리토의 고품질 데이터가 수혜를 입을 것이라 말했다. 이 대표는 “온디바이스 AI로 매개변수에 제약이 생기면서, 언어 모델의 데이터 양 보다 품질이 더 중요해졌다. 적은 데이터로도 좋은 성과를 내기 위해서는 파인 튜닝(고도화)된 데이터가 필요하다”라면서, “LLM 말고도 온디바이스 AI에 탑재하는 소형 언어 모델도 필요해지면서 주목도가 높아지고 있다”라고 말했다.

“미션 변함없다··· 언어 장벽 없는 세상 만들 것”


마지막으로 이 대표는 플리토의 설립 목표를 다시 한번 말했다. 그는 “언어 장벽이 없는 세상을 만들자는 플리토의 미션은 변하지 않는다. 그 과정에서 매출을 늘리고, 주주의 이익을 극대화하는 것도 포함이다. 이를 실현하기 위해서는 플랫폼을 고도화해 참여율을 높이고, 데이터의 품질을 높여야 한다”라면서, “편리하다고 느끼는 번역 서비스와 매출의 극대화, 두 가지 모두 잡기 위해 노력할 것”이라고 말했다.

글 / IT동아 남시현 (sh@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ 세일즈포스, 전 세계 자동화·AI 전략 구축 담은 '2024 연결성 벤치마크' 발표▶ [칼럼] 생성형 AI 시대, 성공적인 도입 전략▶ 오픈AI, 영상 생성 AI '소라' 공개…악용 우려에 '레드팀 검증'부터



추천 비추천

0

고정닉 0

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 손해 보기 싫어서 피해 입으면 반드시 되갚아 줄 것 같은 스타는? 운영자 24/11/18 - -
4556 전문가가 제시하는 스타트업 ESG 경영 전략…’2024 서울 스타트업 ESG 포럼’ IT동아갤로그로 이동합니다. 11.21 25 0
4555 수원대학교 'WoW 스타트업 브랜치 오픈이노베이션' 개최 IT동아갤로그로 이동합니다. 11.21 27 0
4554 [스타트업리뷰] 로닉 “인공지능 맞춤형 음식 도우미, AI 로봇셰프 큐브” IT동아갤로그로 이동합니다. 11.21 2554 0
4553 [IT기획자의 탄생] 3. IT기획자에게 필요한 상상력과 글로벌 전략 IT동아갤로그로 이동합니다. 11.21 41 0
4552 [IT’s 가성비] 삼성 크리스탈 UHD TV, 2024년형/85인치 모델에 눈길? IT동아갤로그로 이동합니다. 11.21 1795 0
4551 [스케일업] 클리카 [3] 피터 노빅과의 대담으로 살펴본 'AI 스타트업'의 방향성 IT동아갤로그로 이동합니다. 11.21 39 0
4550 [생활 속 IT] LG 가전 활용도 넓히는 'LG ThinQ' 연결 및 사용법 IT동아갤로그로 이동합니다. 11.21 33 0
4549 [생활 속 IT] 소프트웨어 활용 습관 바꿔줄 윈도 11 ‘가상 데스크톱’ [1] IT동아갤로그로 이동합니다. 11.20 90 0
4548 [부산창경 BEF 2024] 기술로 문제 풀이와 오답 노트 작성 효율 높인 ‘프라이머스’ IT동아갤로그로 이동합니다. 11.20 54 0
4547 IBM-연세대, 슈퍼컴 능가하는 127 큐비트 양자컴퓨터 국내 첫 도입 [3] IT동아갤로그로 이동합니다. 11.20 4773 4
4546 [주간스타트업동향] 휴머닉스, 위플로 CES 2025 혁신상 수상 外 IT동아갤로그로 이동합니다. 11.20 108 0
4545 [부산창경 BEF 2024] 만만한녀석들 “모듈형 집기로 친환경 MICE 산업 선도한다” IT동아갤로그로 이동합니다. 11.20 52 0
4544 [부산창경 BEF 2024] 나누기월드 “외국인 유학생, 장애인 문제 해결에 기여” [4] IT동아갤로그로 이동합니다. 11.20 262 0
4543 선박 제조업의 디지털 전환 이끄는 ‘버추얼 트윈’ 기술 IT동아갤로그로 이동합니다. 11.19 81 0
4542 에릭슨엘지 “네트워크도 API로 제공…개발자 참여 독려해야” IT동아갤로그로 이동합니다. 11.19 81 0
4541 [IT애정남] 노트북 SSD의 OEM 파티션, 삭제해도 되나요? IT동아갤로그로 이동합니다. 11.19 85 0
4540 [부산창경 BEF 2024] 그린에너지(주) “산업 현장 악취·유해물질 플라즈마로 해결” IT동아갤로그로 이동합니다. 11.19 85 0
4539 [자동차와 法] 행락철 교통사고 책임과 법적 대처 방안 IT동아갤로그로 이동합니다. 11.19 674 0
4538 아이작 컨셉츠 김태영 대표, "반도체·열유체 공학의 산학협력 교두보 만들겠다" IT동아갤로그로 이동합니다. 11.19 82 0
4537 [시승기] 돋보이는 디자인과 안전 사양 ‘KGM 액티언’ [1] IT동아갤로그로 이동합니다. 11.18 364 0
4536 +불필요한 PC 앱, 지우려면 이렇게! [이럴땐 이렇게!] [1] IT동아갤로그로 이동합니다. 11.18 5101 5
4535 [스케일업] 반프 [3] 정예솔 전략총괄 “반프의 가치, 글로벌 시장에서도 매력적” IT동아갤로그로 이동합니다. 11.18 113 0
4534 [주간투자동향] 숨빗AI, 50억 원 규모 시드 투자 유치 外 IT동아갤로그로 이동합니다. 11.18 104 0
4533 [투자를IT다] 2024년 11월 2주차 IT기업 주요 소식과 주가 흐름 IT동아갤로그로 이동합니다. 11.16 205 0
4532 [스케일업] 보라웨어 [2] 전영복ㆍ이효주 “구성원 복지ㆍ기업 성장이 공존하는 곳” IT동아갤로그로 이동합니다. 11.15 199 0
4531 [생성 AI 길라잡이] 8종의 AI 모델 골라 쓰는 ‘SKT 에이닷’ 웹 버전 IT동아갤로그로 이동합니다. 11.15 187 0
4530 디지포레, “제조산업의 디지털 전환, ‘팩토리얼 프로’로 앞당길 것" IT동아갤로그로 이동합니다. 11.15 180 0
4529 [리뷰] 모니터링 헤드폰의 새로운 기준점 제시, 소니 MDR-M1 [5] IT동아갤로그로 이동합니다. 11.15 6207 1
4528 [2024 고려대] 스페이스점프 “자영업·소상공인 기자재의 모든 것, 소상공간” IT동아갤로그로 이동합니다. 11.15 171 0
4527 퀄컴, 온디바이스 AI·차량 전동화에 초점 맞춘 최신 솔루션 선보여 IT동아갤로그로 이동합니다. 11.15 192 0
4526 [창업도약+경북대] 비빔블 “비커스ㆍ버튜디오로 상상 이상의 가상경험 제공할 것” IT동아갤로그로 이동합니다. 11.15 149 0
4525 [AI와 미래] 기존 저작물은 AI 학습에 어디까지 활용할 수 있을까? IT동아갤로그로 이동합니다. 11.15 1369 0
4524 [월간자동차] 24년 10월, 신차 등록 두 달 연속 증가…싼타페 판매 1위 IT동아갤로그로 이동합니다. 11.15 143 0
4523 [리뷰] 10G 업링크 지원 네트워크 스위치, 넷기어 GS108MX IT동아갤로그로 이동합니다. 11.14 173 0
4522 데이터 주권 강조하는 소버린 AI, 진정한 의미는? [1] IT동아갤로그로 이동합니다. 11.14 710 0
4521 [스케일업] 스쿨버스 [3] 통학버스 전문 플랫폼 개발자 인터뷰 IT동아갤로그로 이동합니다. 11.14 172 0
4520 [UDC 2024] 다양한 산업을 변화시키는 블록체인의 힘 IT동아갤로그로 이동합니다. 11.14 165 0
4519 로봇과 문화예술의 만남, 브이디컴퍼니x장 줄리앙의 종이세상 IT동아갤로그로 이동합니다. 11.14 322 0
4518 [IT애정남] 갤럭시워치를 아이폰과 연결해서 쓸 수 있나요? IT동아갤로그로 이동합니다. 11.13 4657 0
4517 [신차공개] BMW ‘뉴 4시리즈 그란 쿠페’·로터스 ‘에메야’ 공식 출시 [3] IT동아갤로그로 이동합니다. 11.13 4765 1
4516 [스타트업-ing] 오아시스 스튜디오 “OVP·오닉스·디보틀로 콘텐츠 에코시스템 구축” IT동아갤로그로 이동합니다. 11.13 176 0
4515 [생활 속 IT] 취업 서류, 정부24에서 내려받는 법 IT동아갤로그로 이동합니다. 11.12 211 0
4514 기한 지나면 과태료…운전면허 적성검사 및 갱신 방법 살펴보니 IT동아갤로그로 이동합니다. 11.12 2390 3
4513 [창업도약+경북대] 준컴퍼니 “자동차 구매부터 판매까지 아우르는 모빌리티 통합 플랫폼 꿈꾼다” IT동아갤로그로 이동합니다. 11.12 202 0
4512 [스케일업] 모넷코리아 [2] HDC랩스와 협업 통해 AIoT 기반 부동산 관리 플랫폼 고도화 IT동아갤로그로 이동합니다. 11.12 234 0
4511 [2024 고려대] R2C컴퍼니 “데이터 수요·공급자 만족 이끄는 플랫폼” IT동아갤로그로 이동합니다. 11.12 652 0
4510 갤럭시 스마트폰의 위젯 기능, 제대로 쓰려면? IT동아갤로그로 이동합니다. 11.12 259 1
4509 [AWS 인더스트리 위크 2024] 국내 금융/핀테크 기업에 AWS 솔루션은 이렇게 적용됐다 [1] IT동아갤로그로 이동합니다. 11.11 2047 1
4508 '제조 스타트업 대상으로 소싱디렉팅·제품 제작까지'··· 서울과기대의 실질적 지원 들여다보니 IT동아갤로그로 이동합니다. 11.11 221 0
4507 [AWS 인더스트리 위크 2024] AWS가 실현하고 있는 인공지능 기술의 현재 IT동아갤로그로 이동합니다. 11.11 280 0
뉴스 '텐트 밖은 유럽' 공포의 활화산 앞에서 역대급 캠핑, 줄리아 로버츠도 사랑한 나폴리 피자의 맛은? 디시트렌드 11.21
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2