디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

인공지능의 진화, 설명·목소리만 듣고 사진 한 장 뚝딱

IT동아갤로그로 이동합니다. 2022.04.12 08:23:06
조회 1443 추천 2 댓글 7
[IT동아 차주경 기자] 나날이 발전하는 사진 인공지능 기술이 사람의 능력을 뛰어넘을 기세다. 문장 한두 마디를 듣고 그 설명을 고스란히 그림이나 사진으로 묘사하는 인공지능이 등장했다. 사람의 목소리를 들으면 그 사람의 얼굴 생김새를 추측해 그리는 인공지능도 주목 받는다.

미국 인공지능 개발 기업 ‘오픈AI(OpenAI)’가 개발한 사진 인공지능 ‘DALL-E 2’는 특정 문장 한두 마디를 입력하면 이를 토대로 사진이나 그림을 만든다.


오픈AI DALL-E 2가 문장을 듣고 만든 그림과 사진. 출처 = 오픈AI



위 그림과 사진은 DALL-E 2가 각각 ‘우주에서 고양이와 농구 하는 우주 비행사’와 ‘해변가에 앉은 웰시코기 강아지’를 듣고 만든 것이다. 앞서 인공지능 기술 개발 기업 엔비디아가 이와 비슷한 기술 ‘GauGAN2’를 공개했다. 문장을 듣고 그대로 사진으로 만드는 인공지능이다. 오픈AI의 DALL-E 2는 엔비디아의 GauGAN2보다 사진을 더 선명하게, 고해상도로 만든다. 배경 흐림, 빛 묘사 등 고급 사진 기술도 넣는다.

DALL-E 2는 문장을 듣고 사진에 피사체를 추가하거나, 사진의 구도를 바꾸는 능력도 가졌다. 방 사진을 인식한 후 DALL-E 2에게 ‘방 구석에 노란 색 소파’라고 입력하면 그대로 표현한다. ‘방 왼쪽 구석’을 입력하면 방 사진에는 없는 구석을 스스로 묘사한다. 단, 복잡한 문장이나 표현은 인식하지 못한다. 그림자나 빛의 방향을 다소 어색하게 표현할 때도 있다.

유사한 기술로, 앞서 미국 매사추세츠 공과대학교(MIT)의 컴퓨터 과학·인공지능 연구소(CSAIL) 소속 과학자들이 공개한 목소리 인식 인공지능 기술 ‘Speech2Face’가 화제가 됐었다. 이 인공지능은 사람의 목소리를 듣고 억양과 높낮이, 단어와 발음을 토대로 그 사람의 얼굴 생김새를 추론한다.


실제 사람 사진(왼쪽)과 이들의 목소리를 들은 Speech2Face가 묘사한 인물 사진. 출처 = 깃허브



CSAIL 과학자들은 유튜브에 올라온 동영상 수백만 개를 활용해 사람 얼굴과 목소리의 특성, 관계를 연구했다. 그 결과, Speech2Face는 사람의 목소리만 듣고도 놀라울 정도로 정확하게 그 사람의 얼굴을 재현했다.

이 두 인공지능 기술도 일부 사진 인공지능 기술의 사례와 마찬가지로 나쁘게 쓰일 가능성이 제기됐다. 기술 개발자들은 여러 제한과 안전 장치를 둬서 부작용을 막는다고 밝혔다.

오픈AI는 DALL-E 2가 나쁘게 쓰이지 않도록 음란·폭력·증오 관련 단어와 문구를 데이터베이스에서 지웠다. 사람의 얼굴도 만들지 못하게 설계하고, 이 기술을 일반 소비자에게는 제공하지 않는다. CSAIL은 Speech2Face를 만들 때 유튜브의 동영상을 활용한 만큼, 데이터 분포가 균등하지 않다고 밝혔다. 이어 이 기술을 사람의 목소리의 특징을 연구하고 더 많은 응용 프로그램을 만들기 위해 개발했다고 강조했다.

글 / IT동아 차주경(racingcar@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ 반도체 수급난, 러시아 침공 등 이어지는 악재에 광학 기기 가격 줄인상▶ 고가·고급 미러리스 딛고 디카 시장 부활 기미, 낙관 경계론도▶ 창과 방패의 대결, 인공지능 가짜 사진 vs 가짜 사진 판별 인공지능



추천 비추천

2

고정닉 0

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 비난 여론에도 뻔뻔하게 잘 살 것 같은 스타는? 운영자 24/06/03 - -
1148 [리뷰] 진보된 성능, 아쉬운 존재감. AMD 라이젠 9 6900HS [8] IT동아갤로그로 이동합니다. 22.05.09 1944 3
1147 [스타트업 in 과기대] 스콘박스, ‘드론 몰카’ 걱정은 이미 눈앞, 대응책에 주목하라 [12] IT동아갤로그로 이동합니다. 22.05.09 995 2
1146 금융데이터거래소 개소 2년…성과와 과제는 IT동아갤로그로 이동합니다. 22.05.09 91 0
1145 1분기 세계 태블릿·크롬북 판매량 감소, 교육 수요 늘 하반기 회복 가능성 IT동아갤로그로 이동합니다. 22.05.09 120 0
1144 퀄컴, 코로나로 멈췄던 IT 투어 재개한다…"한국 학생들 미국 본사에 초청" [3] IT동아갤로그로 이동합니다. 22.05.09 1793 3
1143 [주간투자동향] SK스퀘어-SKT, 글로벌 게임사 ‘해긴’에 500억 원 공동 투자 IT동아갤로그로 이동합니다. 22.05.09 58 0
1142 ‘위드 코로나’로 활기 더한 모빌리티 플랫폼, 곳곳 ‘암초’도 IT동아갤로그로 이동합니다. 22.05.06 80 0
1141 아키핀 "영어 교육 재밌어야 한다, 방법은 체험형 게임" IT동아갤로그로 이동합니다. 22.05.06 96 0
1140 [리뷰] 12세대 인텔 코어 시리즈의 '군계일학', 인텔 코어 i9-12900KS [1] IT동아갤로그로 이동합니다. 22.05.06 166 0
1139 변신·진화하는 차세대 액션 캠, 인스타360 원 RS(One RS) IT동아갤로그로 이동합니다. 22.05.06 101 0
1138 [스타트업人] 개발만큼 중요한 것은 '고객과의 소통', 당근마켓 서비스 운영 이야기 [13] IT동아갤로그로 이동합니다. 22.05.06 2612 1
1137 [모빌리티 인사이트] 일상 속 자율주행, 로봇청소기 IT동아갤로그로 이동합니다. 22.05.06 1949 0
1136 한국안경렌즈협동조합, '한국 안경 산업, 세계 시장에서 K-렌즈로 우뚝' IT동아갤로그로 이동합니다. 22.05.06 96 0
1135 한차례 폭풍 지나간 조각투자 업계…엇갈리는 속내 IT동아갤로그로 이동합니다. 22.05.05 115 0
1134 우려 현실로, 악재 겹친 디카 시장 3월 출하량 더 줄어 IT동아갤로그로 이동합니다. 22.05.05 87 0
1133 [기고] "위드 코로나 시대의 협업... 비동기적 협업이 중요해질 것" IT동아갤로그로 이동합니다. 22.05.04 78 0
1132 "결제 먼저, 지불은 나중" 후불결제로 젊은층 선점 나선 빅테크 [1] IT동아갤로그로 이동합니다. 22.05.04 404 0
1131 [스타트업-ing] 주식회사 마이브 김종배 대표, “초소형전기차 ‘마이브’는 여전히 달리고 있습니다” [1] IT동아갤로그로 이동합니다. 22.05.04 101 0
1130 금융보안원 “데이터 주권 확보의 핵심은 보안…안전한 마이데이터 사업 정착 돕겠다” IT동아갤로그로 이동합니다. 22.05.04 74 0
1129 마드라스체크 이학준 대표, "지식 근로자 갖춘 모든 기업이 플로우의 고객" IT동아갤로그로 이동합니다. 22.05.04 70 0
1128 [상생플러스] 크레파스솔루션 김민정 대표, “통장 없는 청년은 대출을 받을 수 없잖아요?” IT동아갤로그로 이동합니다. 22.05.04 60 0
1127 [혁신스타트업 in 홍릉] 레디큐어 “치매 특화 저선량 방사선 치료 시스템 시대 연다” IT동아갤로그로 이동합니다. 22.05.04 62 0
1126 [뉴스줌인] PS5 화질 향상된다는 VRR 기술, 무슨 원리? [7] IT동아갤로그로 이동합니다. 22.05.04 2941 5
1125 B급 감성으로 위로와 재미를? "배민은 이용자와 즐겁게 논다" [7] IT동아갤로그로 이동합니다. 22.05.03 1103 0
1124 "초코파이는 더 맛있어져야 한다"...카카오 물류의 핵심은 '공유'와 '디지털전환' [21] IT동아갤로그로 이동합니다. 22.05.03 1531 0
1123 시중은행 점포 폐쇄 가속화…금융소외계층 위한 해법은 IT동아갤로그로 이동합니다. 22.05.03 80 0
1122 지브레인, 200억 규모 국책과제 '알키미스트 프로젝트' 최종 선정 IT동아갤로그로 이동합니다. 22.05.03 69 0
1121 [스케일업] 포스코·펫나우 “1000만 반려동물 위한 행복 플랫폼 만든다” IT동아갤로그로 이동합니다. 22.05.03 726 1
1120 [리뷰] 목에 거는 3채널 블랙박스, 링크플로우 FITT360 PB IT동아갤로그로 이동합니다. 22.05.03 87 0
1119 "애플페이만 NFC 결제 허용하는 건 반독점 위반"…칼 빼든 EU [2] IT동아갤로그로 이동합니다. 22.05.03 823 3
1118 디지털 전환 시대, 서비스로 다가서는 스타트업 IT동아갤로그로 이동합니다. 22.05.03 136 1
1117 가정의 달 선물, '모니터'로 아이부터 부모님 눈 건강 챙겨볼까 IT동아갤로그로 이동합니다. 22.05.02 102 0
1116 [리뷰] 한층 뛰어난 음질과 노이즈 캔슬링 원한다면, 젠하이저 모멘텀 TW3 [5] IT동아갤로그로 이동합니다. 22.05.02 1504 1
1115 [인터뷰] 도봉구청 이우건 주무관, "문화 예술도시 창동, 메타버스 선도 도시로 변화 중" IT동아갤로그로 이동합니다. 22.05.02 72 0
1114 서비스·아이폰 호조 애플 1분기 좋은 실적…2분기는 안갯속 [2] IT동아갤로그로 이동합니다. 22.05.02 410 1
1113 [주간투자동향] 뮤직카우, 1000억 원 규모의 투자 유치 IT동아갤로그로 이동합니다. 22.05.02 88 0
1112 [상생플러스] 오내피플 조아영 대표 “번거로운 개인정보 관리, 저희가 해결하고 있습니다” IT동아갤로그로 이동합니다. 22.05.02 61 0
1111 러시아-우크라이나 전쟁, "사이버공격이 시스템적 리스크로 진화" IT동아갤로그로 이동합니다. 22.04.29 2183 3
1110 [리뷰] 스마트한 공부방 위한 IoT 스탠드, 텐플 LED 스마트 무선충전 스탠드 IT동아갤로그로 이동합니다. 22.04.29 89 0
1109 청년 스마트팜 기업 상상텃밭 “가장 진보한 기술로 가장 오래된 산업에 혁신을” IT동아갤로그로 이동합니다. 22.04.29 166 0
1108 [스타트업人] 모든 IT 서비스는 개발에서 비롯된다 - 로앤컴퍼니 엔지니어 이야기 IT동아갤로그로 이동합니다. 22.04.29 100 0
1107 [NFT산업현장] 2. "이번에도 늦어선 안돼"... NFT시장 선점 나선 금융권 IT동아갤로그로 이동합니다. 22.04.29 87 0
1106 [인터뷰] 이혁재 서울대 교수 “반도체 전문인력 부족…서울대가 찾은 해법은” [9] IT동아갤로그로 이동합니다. 22.04.29 2245 5
1105 [스케일업] 부엔까미노 (2) 재미있는 콘텐츠로 저축 돕는 '금융 서비스' 스타트업 IT동아갤로그로 이동합니다. 22.04.29 65 0
1104 [뉴스줌인] PB급 용량 가능한 시놀로지의 기업용 NAS/SAN 솔루션 이모저모 IT동아갤로그로 이동합니다. 22.04.29 77 0
1103 [상생플러스] 왓섭 김준태 대표, “지출 정보를 분석한다는 것의 진정한 의미를 제공합니다” IT동아갤로그로 이동합니다. 22.04.29 99 0
1102 [검색광고 AtoZ] ② 광고비 낭비하는 ‘부정 클릭’ 효과적 대응 방법은? IT동아갤로그로 이동합니다. 22.04.29 74 0
1101 금융위, 조각투자 증권성 판단 기준 내놓았다…핵심 내용은? [1] IT동아갤로그로 이동합니다. 22.04.28 114 0
1100 "팬과 가수는 한 배에 탄 동료다".. 팬더스트리 성장은 계속될 것 [4] IT동아갤로그로 이동합니다. 22.04.28 1344 0
1099 나무기술 박열경 부사장 “칵테일 클라우드 온 오픈시프트, 국산+외산 장점 통합한 독보적 PaaS 제품” IT동아갤로그로 이동합니다. 22.04.28 72 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2