디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

구글 “음성 인공지능 USM으로 세계 언어 장벽 허문다”

IT동아갤로그로 이동합니다. 2023.03.08 09:00:57
조회 1125 추천 5 댓글 9
[IT동아 차주경 기자] 구글이 100개 이상의 언어를 자동으로 인식하고, 이를 번역하거나 자막으로 만드는 음성 인공지능 ‘USM(Universal Speech Model)’의 발전 현황을 공개했다. 구글은 USM의 개발 상황과 성과, 학습 구조와 개선 계획을 함께 소개하면서 연구자들에게 API(Application Programming Interface, 앱 개발 도구) 접근 권한도 준다고 밝혔다.


구글 1,000개 언어 이니셔티브 프로그램 소개 사진. 출처 = 구글 블로그



USM은 구글이 2022년 11월 공개한 ‘1,000개 언어 이니셔티브’를 현실로 이끌 첫 기술이다. 1,000개 언어 이니셔티브는 세계 각국의 언어 1,000개를 지원하는 인공지능 모델이다. 당시 구글은 USM의 개념을 함께 설명했는데, 이번에는 USM이 어떤 방식으로 얼마나 많이 공부했고 어느 정도의 능력을 발휘했는지 밝혔다.

구글 USM은 지금까지 300개 이상의 언어로 말한 목소리를 1,200만 시간 분량, 문장을 280억 개 이상 분석해 공부했다. 구글은 영어와 중국어 등 세계 주요 언어는 물론, 세계에서 2,000만 명 미만이 쓰는 소수 언어에 이르기까지 다양한 종류의 목소리와 문장을 가르쳤다고 강조했다.

각기 다른 언어 300여 개를 인공지능에게 가르치는 것은 여간 어려운 일이 아니다. 쓰는 사람이 적은 소수 언어는 목소리와 문장 데이터 자체를 구하기 어렵다. 이 데이터를 구했다고 해도, 이것을 인공지능에게 가르칠 때 필요한 레이블(분류 기록)의 지정 작업이 또 하나의 난관이다. 데이터가 많을수록, 분석하기 까다로울수록 레이블 지정에 수고와 비용이 많이 든다.


구글 USM이 배운 세계 각국의 언어들. 출처 = 구글 블로그



수많은 언어 데이터를 알맞게, 그리고 효율 좋게 분석해서 인공지능에게 가르칠 알고리듬(명령을 수행하는 절차)도 찾아내야 한다. 이 알고리듬은 수많은 데이터를 원활하게 받아들여야 하며 수시로 개선해도 교육에 영향을 주지 않아야 한다. 새로운 언어(데이터)의 목소리와 문장을 접해도 혼동하지 않고, 이전과 같은 방식으로 받아들이는 유연성도 발휘해야 한다.

구글은 먼저 300여 개 언어의 목소리 데이터 1,000만 시간 분량을 레이블 지정 작업 없이 USM에게 가르쳤다. 여기에 가장 많은 자원을 할당했다. 이어 두 번째로 300여 개 언어의 문장 데이터 280억 개를 가르치면서 이를 분석하는 인코더(데이터를 신호로 바꾸는 기능), 목소리 인코더와 문장 인코더를 합치는 알고리듬을 새로 적용했다. 동시에 레이블 지정 작업을 하지 않은 목소리 데이터, 레이블 지정 작업을 한 목소리 데이터(200만 시간 분량)와 문장 데이터 모두를 USM에게 가르쳤다. 세 번째로 USM을 미세 조정(기존 데이터로 인공지능을 다시 훈련시키는 절차)하면서 알고리듬이 얼마나 모델링(인공지능이 데이터를 분석해 알고리듬을 만드는 과정)을 잘 하는지 검증했다.


구글이 USM을 가르친 과정. 출처 = 구글 블로그



구글은 USM의 능력을 파악하려고 유튜브의 다국어 목소리 데이터를 제시했다. 이 다국어 목소리 데이터는 73개 언어로 구성됐는데, 각 언어당 3,000시간 미만의 분량만 있을 정도로 규모가 작았다. 그럼에도 구글 USM은 다국어 목소리 데이터를 듣고 평균 30% 미만의 단어 오류율(WER, Word Error Rate, 음성 인식이나 기계 번역의 성능을 측정하는 기준)을 기록했다. 이는 지금까지 나온 음성 인공지능 가운데 가장 우수한 수치다. 구글 USM은 음성 번역도 잘했다. BLEU(BiLingual Evaluation Understudy, 언어간 기계 번역의 품질을 평가하는 기준)실험 결과, 여기에서도 지금까지 나온 음성 인공지능 가운데 가장 우수한 성적을 냈다.

세계에는 7,000개 이상의 언어가 있다고 알려졌다. 구글 USM은 극소수 사람만 쓰는 언어라 해도, 인공지능이 원활하고 정확하게 다룬다는 것을 증명했다. 사어(사라진 언어)를 다룰 가능성도 있다. 구글 USM이 고도화를 거쳐 언어의 장벽을 허물면, 세계인 누구나 편리하게 소통하는 시대가 열릴 것으로 기대한다.

구글은 “USM은 세계의 정보를 체계화해서 누구나 쉽게 접근하도록 돕는 중요한 기술이다. 이번 성과는 1,000개 언어 이니셔티브를 구축할 토대가 될 것이다.”라고 밝혔다.

글 / IT동아 차주경(racingcar@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ 해외여행에서 외국어 소통, 번역앱으로 이렇게![이럴땐 이렇게!]▶ 디지털 취약 해소할 배리어 프리·인공지능 키오스크 나온다▶ 인공지능, 위성 통신 시대 오나…MWC 2023에서 확인한 미래 키워드



추천 비추천

5

고정닉 0

2

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 오픈 마인드로 이성을 만날 것 같은 스타는? 운영자 24/12/02 - -
2458 같은 메뉴도 매장보다 배달앱에서 더 비싸… 배달가격에 기만당하는 소비자 [5] IT동아갤로그로 이동합니다. 23.03.10 360 0
2457 [시드팁스] 카본사우루스, "모든 기업이 탄소중립 동참하는 생태계 꿈꾼다" IT동아갤로그로 이동합니다. 23.03.10 121 0
2456 [농업이 IT(잇)다] 맘꽃가든 “가변형 입식 베드 스마트팜, 농가 불편 해소” IT동아갤로그로 이동합니다. 23.03.10 131 0
2455 [뉴스줌인] 오비고-토요타 협업, 국내 IT 업체들과 협력 강화하는 수입차 업계 [1] IT동아갤로그로 이동합니다. 23.03.10 1226 0
2454 구글·네이버 위협하는 딥엘(DeepL) 번역기, 한국어 버전 품질은? [19] IT동아갤로그로 이동합니다. 23.03.09 3280 9
2453 美·EU “中 정부에 정보 제공” 주장에 틱톡 “사실무근” [13] IT동아갤로그로 이동합니다. 23.03.09 1085 3
2452 [스타트업-ing] 직접 체험하며 소통하는 디지털 사이니지, 쉐어박스 밋업 IT동아갤로그로 이동합니다. 23.03.09 96 0
2451 배달 앱 쇠퇴에 소상공인 “스마트 상점으로 경쟁력 강화” [6] IT동아갤로그로 이동합니다. 23.03.09 1635 1
2450 구글 안드로이드 14 개발자판 공개, 눈에 띄는 기능은 IT동아갤로그로 이동합니다. 23.03.09 269 1
2449 LG전자, 선 없애고 더 밝아진 2023 올레드 TV 발표, “삼성 OLED TV 진출 오히려 환영” [10] IT동아갤로그로 이동합니다. 23.03.08 2000 4
2448 [시드팁스] 리피드 전준봉 대표, “베트남에서 폐식용유를 수거합니다” IT동아갤로그로 이동합니다. 23.03.08 141 1
2447 완전무선 이어폰 트렌드, ‘편의성’ 넘어 ‘음질’로 간다 [3] IT동아갤로그로 이동합니다. 23.03.08 1369 3
2446 [스타트업+ing] 비젼코스모 송기봉 대표, "강소기업의 원동력은 기술력 기반의 품질 경영" IT동아갤로그로 이동합니다. 23.03.08 98 0
구글 “음성 인공지능 USM으로 세계 언어 장벽 허문다” [9] IT동아갤로그로 이동합니다. 23.03.08 1125 5
2444 청소년 온라인 불법 도박, 치료와 함께 강한 규제 걸어야 [1] IT동아갤로그로 이동합니다. 23.03.07 214 1
2443 '클라우드 무상 교육에 취업까지 돕는다'··· 'AWS 리스타트' 본격 가동 IT동아갤로그로 이동합니다. 23.03.07 1100 1
2442 [IT애정남] 봄나들이에 쓸 중고 카메라, 어떻게 해야 제대로 고를까? [5] IT동아갤로그로 이동합니다. 23.03.06 1264 3
2441 트랜쇼-팀프레시, "동대문 패션 의류를 새벽배송으로 제공합니다" [1] IT동아갤로그로 이동합니다. 23.03.06 936 1
2440 해외여행에서 외국어 소통, 번역앱으로 이렇게![이럴땐 이렇게!] IT동아갤로그로 이동합니다. 23.03.06 955 1
2439 [인터뷰] AWS의 교육 프로그램, 현업·실무자들이 진행해본 소감은? IT동아갤로그로 이동합니다. 23.03.06 153 1
2438 포스코 “IMP 2.1, 스타트업·체인지업그라운드 세계로” IT동아갤로그로 이동합니다. 23.03.06 106 0
2437 [주간투자동향] 파두, 120억 원 규모로 프리 IPO 마무리 IT동아갤로그로 이동합니다. 23.03.06 160 0
2436 [뉴스줌인] 해상도 대신 주사율에 올인한 게이밍 모니터, MSI G32C4X IT동아갤로그로 이동합니다. 23.03.03 143 0
2435 하이브와 카카오의 SM인수전... 업계의 관심은 '팬덤플랫폼' IT동아갤로그로 이동합니다. 23.03.03 138 0
2434 서울국제오디오쇼에서 만난 기어라운지..."좋은 소리 원하면 하이파이 음향기기로" [2] IT동아갤로그로 이동합니다. 23.03.03 1087 0
2433 [농업이 IT(잇)다] 현관앞마켓 “하이퍼로컬 신선식품 구독 새 장 연다” IT동아갤로그로 이동합니다. 23.03.03 137 1
2432 [시드팁스] 아젠다북, "리서치의 디지털화로 설문조사의 새로운 장 연다" IT동아갤로그로 이동합니다. 23.03.03 115 0
2431 인텔, 차세대 노트북용 13세대 코어 모바일 프로세서 국내 정식 출시 [11] IT동아갤로그로 이동합니다. 23.03.02 1773 0
2430 디지털 취약 해소할 배리어 프리·인공지능 키오스크 나온다 IT동아갤로그로 이동합니다. 23.03.02 735 0
2429 [시드팁스] 캘러스컴퍼니 배규진 대표, “치매 발병? 늦출 수 있습니다” IT동아갤로그로 이동합니다. 23.03.02 804 0
2428 MWC 2023 신기술, 스마트폰 어떻게 바꿀까? [6] IT동아갤로그로 이동합니다. 23.03.01 3820 1
2427 [뉴스줌인] 레드햇과 삼성전자가 손잡은 이유, 5G vRAN이 무엇이길래? IT동아갤로그로 이동합니다. 23.02.28 208 0
2426 50평 규모 식당, 서빙로봇 4대와 홀 직원 1명으로도 '거뜬' [5] IT동아갤로그로 이동합니다. 23.02.28 415 1
2425 [스타트업 리뷰] 웹 장애를 자동으로 확인한다, 인포플라 웹 장애 모니터링 IT동아갤로그로 이동합니다. 23.02.28 124 0
2424 [스케일업] 성과점검 [2] 엘핀, 이노디테크, 제이디솔루션, 케이파워, 펫나우 IT동아갤로그로 이동합니다. 23.02.28 108 0
2423 [스케일업] 성과점검 [1] 누비랩, 레다게임즈, 본투비, 부지런컴퍼니, 세븐미어캣 IT동아갤로그로 이동합니다. 23.02.28 109 0
2422 中 스마트폰 MWC 딛고 세계로, 가격·보안 개선 과제 [39] IT동아갤로그로 이동합니다. 23.02.28 3657 6
2421 다이슨 슈퍼소닉 드라이어의 새 노즐, '플라이어웨이 스무더' 써보니 IT동아갤로그로 이동합니다. 23.02.28 162 0
2420 [리뷰] 3D-V캐시로 끌어올린 게임 성능, AMD 라이젠 9 7950X3D [16] IT동아갤로그로 이동합니다. 23.02.27 2257 0
2419 [리뷰] 특별한 NAS와 스토리지의 만남, 큐냅 HS-264와 씨게이트 아이언울프 HDD/SSD IT동아갤로그로 이동합니다. 23.02.27 159 0
2418 "사수 없어도 걱정말아요"...랜선사수 퍼블리 체험해보니 [4] IT동아갤로그로 이동합니다. 23.02.27 1888 1
2417 [스케일업] 케이파워 [3] “케이파워의 본질은 연료 사업입니다” IT동아갤로그로 이동합니다. 23.02.27 122 0
2416 [가상자산 제대로 알기] 완. 연재를 마치며 IT동아갤로그로 이동합니다. 23.02.27 116 0
2415 [주간투자동향] 마인이스, 41.5억 원 규모의 시드 투자 유치 IT동아갤로그로 이동합니다. 23.02.27 709 0
2414 [스케일업] 제이디솔루션 [3] 알파브라더스 “도약의 조건, 대표·중간 리더 역량 강화” IT동아갤로그로 이동합니다. 23.02.27 121 0
2413 [뉴스줌인] LG CNS-어도비 협력 강화, 그 이유는? [1] IT동아갤로그로 이동합니다. 23.02.24 174 0
2412 [스타트업-ing] 인포플라 최인묵 대표 “쉽게 쓰는 RPA로 우리 삶을 편하게 할 것” IT동아갤로그로 이동합니다. 23.02.24 141 0
2411 [리뷰] 깔끔한 디자인에 손쉬운 조립, 카멜마운트 고든 GDA3 모니터암 [7] IT동아갤로그로 이동합니다. 23.02.24 3431 1
2410 [농업이 IT(잇)다] 일루베이션 “3D 돼지 무게 측정, 축산가에 새 가치” IT동아갤로그로 이동합니다. 23.02.24 166 0
2409 [시드팁스] 인슈딜, '양도 가능한 연금 보험, 해약보다 중개 플랫폼이 이득' IT동아갤로그로 이동합니다. 23.02.24 127 0
뉴스 정해인, 팬미팅 투어 ‘아워 타임’ 서울 공연 성료...“앞으로도 힘 될 것” 디시트렌드 12.02
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2