디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

구글 “음성 인공지능 USM으로 세계 언어 장벽 허문다”

IT동아갤로그로 이동합니다. 2023.03.08 09:00:57
조회 1082 추천 5 댓글 9
[IT동아 차주경 기자] 구글이 100개 이상의 언어를 자동으로 인식하고, 이를 번역하거나 자막으로 만드는 음성 인공지능 ‘USM(Universal Speech Model)’의 발전 현황을 공개했다. 구글은 USM의 개발 상황과 성과, 학습 구조와 개선 계획을 함께 소개하면서 연구자들에게 API(Application Programming Interface, 앱 개발 도구) 접근 권한도 준다고 밝혔다.


구글 1,000개 언어 이니셔티브 프로그램 소개 사진. 출처 = 구글 블로그



USM은 구글이 2022년 11월 공개한 ‘1,000개 언어 이니셔티브’를 현실로 이끌 첫 기술이다. 1,000개 언어 이니셔티브는 세계 각국의 언어 1,000개를 지원하는 인공지능 모델이다. 당시 구글은 USM의 개념을 함께 설명했는데, 이번에는 USM이 어떤 방식으로 얼마나 많이 공부했고 어느 정도의 능력을 발휘했는지 밝혔다.

구글 USM은 지금까지 300개 이상의 언어로 말한 목소리를 1,200만 시간 분량, 문장을 280억 개 이상 분석해 공부했다. 구글은 영어와 중국어 등 세계 주요 언어는 물론, 세계에서 2,000만 명 미만이 쓰는 소수 언어에 이르기까지 다양한 종류의 목소리와 문장을 가르쳤다고 강조했다.

각기 다른 언어 300여 개를 인공지능에게 가르치는 것은 여간 어려운 일이 아니다. 쓰는 사람이 적은 소수 언어는 목소리와 문장 데이터 자체를 구하기 어렵다. 이 데이터를 구했다고 해도, 이것을 인공지능에게 가르칠 때 필요한 레이블(분류 기록)의 지정 작업이 또 하나의 난관이다. 데이터가 많을수록, 분석하기 까다로울수록 레이블 지정에 수고와 비용이 많이 든다.


구글 USM이 배운 세계 각국의 언어들. 출처 = 구글 블로그



수많은 언어 데이터를 알맞게, 그리고 효율 좋게 분석해서 인공지능에게 가르칠 알고리듬(명령을 수행하는 절차)도 찾아내야 한다. 이 알고리듬은 수많은 데이터를 원활하게 받아들여야 하며 수시로 개선해도 교육에 영향을 주지 않아야 한다. 새로운 언어(데이터)의 목소리와 문장을 접해도 혼동하지 않고, 이전과 같은 방식으로 받아들이는 유연성도 발휘해야 한다.

구글은 먼저 300여 개 언어의 목소리 데이터 1,000만 시간 분량을 레이블 지정 작업 없이 USM에게 가르쳤다. 여기에 가장 많은 자원을 할당했다. 이어 두 번째로 300여 개 언어의 문장 데이터 280억 개를 가르치면서 이를 분석하는 인코더(데이터를 신호로 바꾸는 기능), 목소리 인코더와 문장 인코더를 합치는 알고리듬을 새로 적용했다. 동시에 레이블 지정 작업을 하지 않은 목소리 데이터, 레이블 지정 작업을 한 목소리 데이터(200만 시간 분량)와 문장 데이터 모두를 USM에게 가르쳤다. 세 번째로 USM을 미세 조정(기존 데이터로 인공지능을 다시 훈련시키는 절차)하면서 알고리듬이 얼마나 모델링(인공지능이 데이터를 분석해 알고리듬을 만드는 과정)을 잘 하는지 검증했다.


구글이 USM을 가르친 과정. 출처 = 구글 블로그



구글은 USM의 능력을 파악하려고 유튜브의 다국어 목소리 데이터를 제시했다. 이 다국어 목소리 데이터는 73개 언어로 구성됐는데, 각 언어당 3,000시간 미만의 분량만 있을 정도로 규모가 작았다. 그럼에도 구글 USM은 다국어 목소리 데이터를 듣고 평균 30% 미만의 단어 오류율(WER, Word Error Rate, 음성 인식이나 기계 번역의 성능을 측정하는 기준)을 기록했다. 이는 지금까지 나온 음성 인공지능 가운데 가장 우수한 수치다. 구글 USM은 음성 번역도 잘했다. BLEU(BiLingual Evaluation Understudy, 언어간 기계 번역의 품질을 평가하는 기준)실험 결과, 여기에서도 지금까지 나온 음성 인공지능 가운데 가장 우수한 성적을 냈다.

세계에는 7,000개 이상의 언어가 있다고 알려졌다. 구글 USM은 극소수 사람만 쓰는 언어라 해도, 인공지능이 원활하고 정확하게 다룬다는 것을 증명했다. 사어(사라진 언어)를 다룰 가능성도 있다. 구글 USM이 고도화를 거쳐 언어의 장벽을 허물면, 세계인 누구나 편리하게 소통하는 시대가 열릴 것으로 기대한다.

구글은 “USM은 세계의 정보를 체계화해서 누구나 쉽게 접근하도록 돕는 중요한 기술이다. 이번 성과는 1,000개 언어 이니셔티브를 구축할 토대가 될 것이다.”라고 밝혔다.

글 / IT동아 차주경(racingcar@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ 해외여행에서 외국어 소통, 번역앱으로 이렇게![이럴땐 이렇게!]▶ 디지털 취약 해소할 배리어 프리·인공지능 키오스크 나온다▶ 인공지능, 위성 통신 시대 오나…MWC 2023에서 확인한 미래 키워드



추천 비추천

5

고정닉 0

2

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 비난 여론에도 뻔뻔하게 잘 살 것 같은 스타는? 운영자 24/06/03 - -
2520 [농업+IT=스마트팜] 4. 환경 데이터 수집용 센서 구축하기 (1) IT동아갤로그로 이동합니다. 23.03.28 128 0
2519 택시 서비스 기업 “요금 나눠서 여럿이 싸게 타세요” [12] IT동아갤로그로 이동합니다. 23.03.28 2030 0
2518 일상에 스며든 블록체인 서비스 IT동아갤로그로 이동합니다. 23.03.28 120 0
2517 [메타버스에 올라타자] 3. 전 세계 메타버스 시장 현황 IT동아갤로그로 이동합니다. 23.03.28 183 0
2516 [마인드테크 시대가 온다] 3. 명상테크, 스스로하는 마인드 케어 IT동아갤로그로 이동합니다. 23.03.28 101 0
2515 웨스턴디지털, '샌디스크 프로페셔널' 라인업 추가··· "전문가용 경험 확대" IT동아갤로그로 이동합니다. 23.03.28 127 0
2514 日 JOLED 사실상 파산, 韓·中 OLED 2파전 굳혀 [60] IT동아갤로그로 이동합니다. 23.03.28 3216 16
2513 레드햇 앤드류 해브굿 부사장 “파트너십 확대, 한국 기업 글로벌 진출 도울 것” IT동아갤로그로 이동합니다. 23.03.27 165 0
2512 [리뷰] 최대 96GB 통합 메모리로 성능·효율 다 잡았다, 애플 맥북 프로 16 [26] IT동아갤로그로 이동합니다. 23.03.27 2407 3
2511 [IT하는법] 껐다 켜는 게 다가 아니다, 알면 도움 되는 '시스템 소리' 설정 IT동아갤로그로 이동합니다. 23.03.27 148 0
2510 [주간투자동향] 크로커스, 64억 원 규모의 시리즈B 투자 유치 완료 IT동아갤로그로 이동합니다. 23.03.27 96 0
2509 모니터 돌리고 세워 쓰려면 이렇게![이럴땐 이렇게!] [8] IT동아갤로그로 이동합니다. 23.03.27 4572 10
2508 ‘보이지 않는’ 핵심 시스템을 개발합니다, 인포플라의 백엔드 개발자 이야기[스타트업人] IT동아갤로그로 이동합니다. 23.03.27 90 0
2507 [IT신상공개] 새 폴더블폰 화웨이 메이트 X3, 갤럭시Z 폴드4와 차이는? [29] IT동아갤로그로 이동합니다. 23.03.27 3109 3
2506 [뉴스줌인] 상업적 이용도 OK, 올해도 무료 글꼴 배포한 가비아 IT동아갤로그로 이동합니다. 23.03.24 147 1
2505 [IT애정남] 갤럭시 워치에 교통카드를 넣고 싶어요 [6] IT동아갤로그로 이동합니다. 23.03.24 1113 6
2504 [IT강의실] 알아두면 좋은 게이밍 이어폰 특징·사양 [7] IT동아갤로그로 이동합니다. 23.03.24 923 1
2503 [시드팁스] 스니커즈 정은애 대표, "실시간 초개인화 정보, 스트릿 캐스터가 답합니다" IT동아갤로그로 이동합니다. 23.03.24 96 0
2502 [리뷰] 10년에 걸쳐 쌓아 온 LG 올레드 TV 기술의 정수, LG 올레드 evo G3 [2] IT동아갤로그로 이동합니다. 23.03.24 410 0
2501 [농업이 IT(잇)다] 농업회사법인 신선 “청주신선주로 전통주 문화 넓힐 것” IT동아갤로그로 이동합니다. 23.03.24 88 0
2500 요란함 벗고 차분해진 게이밍기어, 마이크로닉스 2023 신제품 발표회 IT동아갤로그로 이동합니다. 23.03.23 139 0
2499 [리뷰] 데스크톱을 넘어선 모바일 프로세서, 인텔 코어 i9-13980HX [9] IT동아갤로그로 이동합니다. 23.03.23 1254 0
2498 카카오모빌리티가 英 스플리트를 인수한 이유는? IT동아갤로그로 이동합니다. 23.03.23 103 0
2497 물류센터 화재 예방, 관리계획서와 시스템 갖춰야 IT동아갤로그로 이동합니다. 23.03.23 102 0
2496 컨텍 “우주급 비즈니스 꿈꾸는 인재들, 우리와 함께하길”[스타트업人] IT동아갤로그로 이동합니다. 23.03.23 85 0
2495 애플페이 한국 상륙, 소상공인 대응 방안은? IT동아갤로그로 이동합니다. 23.03.23 898 0
2494 [시드팁스] 가이버스 김승훈 대표, “미트가이버는 알아서 고기를 숙성시켜 줍니다” IT동아갤로그로 이동합니다. 23.03.22 111 1
2493 건설인력 시장 디지털화 “앱으로 현장 골라 일하고 경력 관리도” IT동아갤로그로 이동합니다. 23.03.22 114 1
2492 동영상 만드는 인공지능 ‘런웨이 GEN-2’의 실력은? [4] IT동아갤로그로 이동합니다. 23.03.22 1236 2
2491 [리뷰] 내실 다진 PCIe 4.0 SSD, 씨게이트 뉴 파이어쿠다 520 M.2 NVMe IT동아갤로그로 이동합니다. 23.03.21 149 0
2490 [IT하는법] 유튜브 과몰입 방지하는 ‘사용 시간 제한’ [7] IT동아갤로그로 이동합니다. 23.03.21 978 2
2489 [IT애정남] ‘이퀄라이저’는 어떻게 쓰는 건가요? [1] IT동아갤로그로 이동합니다. 23.03.21 192 0
2488 카멜그룹, 모니터 암·디스플레이 넘어 '가구 브랜드'로 진화 中 IT동아갤로그로 이동합니다. 23.03.21 1008 2
2487 "첫날 오전에만 17만 명 가입"··· 애플 페이의 한국 서비스가 지닌 의의는? [2] IT동아갤로그로 이동합니다. 23.03.21 1048 2
2486 최치호 홍릉강소특구단장 “바이오 스타트업 생태계 돕고파” IT동아갤로그로 이동합니다. 23.03.21 87 0
2485 [주간투자동향] 트래블월렛, 197억 원 규모의 시리즈C 투자 유치 IT동아갤로그로 이동합니다. 23.03.21 119 0
2484 '노 코딩' RPA 제작, 인포플라 ‘알파카’로 RPA 스크립트 만들어보니[스타트업 리뷰] [5] IT동아갤로그로 이동합니다. 23.03.20 1086 1
2483 주름 없는 폴더블폰 속속 등장, 삼성 폴드∙플립5는 방수∙방진까지? [21] IT동아갤로그로 이동합니다. 23.03.20 2824 7
2482 스마트폰 홈 화면에 바로가기 만들려면 이렇게! [이럴땐 이렇게!] [7] IT동아갤로그로 이동합니다. 23.03.20 2903 2
2481 [뉴스줌인] 더함 안드로이드 TV, 버전 9→11로 업데이트, 뭐가 달라지지? IT동아갤로그로 이동합니다. 23.03.17 181 0
2480 "카메라·렌즈 직접 써보세요", 오프라인 경험 확대 나선 카메라 업계 IT동아갤로그로 이동합니다. 23.03.17 121 1
2479 [농업이 IT(잇)다] 팡세 “바이오 3D 프린팅으로 배양육 대중화” [6] IT동아갤로그로 이동합니다. 23.03.17 2323 2
2478 [시드팁스] 유동산 오준식 대표, "기업·기관 중심의 선순위 대출, 모두를 위한 기회로" IT동아갤로그로 이동합니다. 23.03.17 94 0
2477 [리뷰] 공간효율성과 ‘손맛’을 동시에, 마이크로닉스 워프 WK4 텐키리스 게이밍 키보드 [9] IT동아갤로그로 이동합니다. 23.03.16 1610 1
2476 가상자산 제도화를 위한 조언, DCON 2023 IT동아갤로그로 이동합니다. 23.03.16 95 0
2475 [디지털 취약 극복] 에이티소프트 “전자 점자, 문서 표·셀까지 표현해야” IT동아갤로그로 이동합니다. 23.03.16 88 0
2474 이통 3사 “2시간 미만 장애 10배 보상”…과실 입증은 소비자가? IT동아갤로그로 이동합니다. 23.03.16 646 0
2473 GPT-4, 사진 알아보고 변호사·대입 시험 성적도 우수 [11] IT동아갤로그로 이동합니다. 23.03.16 2046 6
2472 [IT강의실] 초보자를 위한 ‘SSD 데이터 통째로 복제하기’ IT동아갤로그로 이동합니다. 23.03.15 913 1
2471 [리뷰] ‘스펙’ 충만 4K/120Hz 게이밍 TV, 더함 우버기어 UG651QLED [6] IT동아갤로그로 이동합니다. 23.03.15 904 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2