디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[생성 AI 길라잡이] 더 사람 같아진 AI, 'GPT-4o'는 어떻게 다를까?

IT동아갤로그로 이동합니다. 2024.05.17 12:20:22
조회 1378 추천 1 댓글 2
※생성 인공지능이 세계를 뜨겁게 달굽니다. 사람만큼, 더러는 사람보다 더 그림을 잘 그리고 글을 잘 쓰는 생성 인공지능. 생성 인공지능을 설치하고 활용하는 방법과 최신 소식을 매주 전합니다.

[IT동아 권택경 기자] 오픈AI가 지난 13일(현지시각) 최신 대형언어모델(LLM)인 ‘GPT-4o’를 발표했습니다. 구글 ‘제미나이’, 앤트로픽 ‘클로드’, 메타 ‘라마’ 등 수많은 LLM이 등장해 경쟁이 치열해지는 와중에 오픈AI가 이번 업데이트로 다시 한 번 기술 격차를 벌리고, 생성 AI 업계 대표이자 선두라는 걸 입증하는 모양새입니다.

GPT-4o의 o는 옴니(Omni)를 뜻합니다. ‘모든’을 뜻하는 라틴어 접두사입니다. 이 말에 걸맞게 글뿐만 아니라 사진, 영상, 음성 등 여러 종류 데이터를 처리할 수 있는 능력인 ‘멀티 모달리티(Multimodality)를 극한까지 밀어붙였습니다. 하나의 AI 모델로 모든 게 가능한 ‘옴니 모델(Omni Model)’이라는 의미가 담긴 이름입니다. 그야말로 만능인 셈입니다.


지난 13일 열린 오픈AI의 GPT-4o의 발표 행사 / 출처=오픈AI



이번 발표의 하이라이트라고 할 수 있는 음성 모드가 옴니모델의 특장점을 잘 보여줍니다. 음성 모드는 사람과 대화하듯 챗GPT와 음성으로 대화하는 기능입니다. 이번 GPT-4o의 적용으로 반응 속도가 최소 232밀리초, 평균 320밀리초 수준으로 개선됐습니다. 2~5초 수준이었던 이전 버전들과는 비교하면 환골탈태 수준입니다.

오픈AI의 시연을 보면 마치 인간과 대화하는 듯한 자연스러움을 느낄 수 있는데, 실제로 250밀리초 수준으로 알려진 인간만큼 반응 속도가 빠르기 때문입니다. 이렇게 음성 모드가 빨라진 건 음성을 음성 그 자체로 인식하고 처리할 수 있게 됐기 때문입니다. 이전에는 음성을 텍스트로 바꿔 인식하고, 답변도 텍스트로 생성한 다음 이를 단순 음성 합성으로 읊는 방식이었다고 합니다.


실시간 영상 인식과 음성 기능으로 마치 AI와 영상통화를 하듯 대화할 수 있다 / 출처=오픈AI



처리 방식이 바뀌면서 반응 속도만 빨라진 게 아니라 음성에 담긴 톤이나 배경에 섞인 소리도 인식할 수 있게 됐습니다. 반대로 AI가 목소리에 감정을 담거나, 웃거나, 노래를 부르는 일도 가능해졌습니다. 오픈AI가 공개한 시연 영상을 보면 챗GPT가 사용자의 농담에 반응해 웃거나, 자장가를 부릅니다. 두 챗GPT가 서로 자연스럽게 대화를 이어가기도 합니다.

샘 올트먼 오픈AI CEO는 AI와 사랑에 빠지는 영화 ‘그녀(Her)’를 언급하기도 했는데, 영화에나 나올 법한 사람 같은 수준의 AI가 현실이 됐다는 평가도 그리 과장은 아닌 것처럼 느껴질 정도입니다. 이 모든 게 GPT-4o가 텍스트, 화상, 오디오 등 여러 형태의 데이터를 하나의 신경망으로 처리하는 옴니모델이기에 가능한 일입니다.


챗GPT에 태블릿 화면 속 수학 문제를 공유해 AI 과외 선생님처럼 활용할 수도 있다 / 출처=오픈AI



속도와 바용도 개선됐습니다. 특히 영어 외 언어에서 토큰(AI 데이터 처리의 최소 단위) 효율이 대폭 개선되면서 처리 능력이 올랐습니다. 한국어도 토큰 효율이 1.7배 개선됐습니다. 같은 양의 한국어 텍스트를 더 적은 토큰으로 처리할 수 있게 됐다는 의미입니다. 그만큼 GPT-4o를 활용하는 앱이나 서비스들의 속도가 빨라지고, 비용도 저렴해집니다. 오픈AI에서는 GPT-4o의 응용 프로그램 인터페이스(API)가 이전 버전인 GPT4-터보와 같은 성능을 더 빠르고 50% 저렴하게 제공한다고 설명합니다.


음성 모드를 사용 중인 오픈AI 개발자/ 출처=오픈AI



발표와 함께 오픈AI는 우선 GPT-4o의 텍스트와 이미지 기능을 먼저 출시했습니다. 월 20달러(약 2만 7100원)의 유료 서비스 ‘챗GPT 플러스’ 이용자에게만 제공됐던 GPT-4, GPT-4 터보 등과 달리 무료 이용자들도 현재 이용이 가능합니다. 다만 이용 가능한 메시지 수에 제한이 있습니다. 사용량과 수요에 따라 유동적으로 결정됩니다. 유료 이용자는 무료 이용자보다 5배 더 많은 메시지를 이용할 수 있습니다.

다만 아쉽게도 음성 모드는 아직 출시되지 않았습니다. 오픈AI는 앞으로 몇 주 내에 음성 모드 알파 버전을 일부 유료 이용자를 대상으로 순차 출시할 예정이라고 밝혔습니다.

글 / IT동아 권택경 (tk@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ 국내 기업 열에 일곱은 "이제 AI 활용 못 하는 직원은 고용 안 해"▶ [생성 AI 길라잡이] GPT 활용 사례 및 교육 커뮤니티, '지피터스'▶ 효율 중요한 키워드 검색광고, 인공지능에 해답 있다



추천 비추천

1

고정닉 0

7

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 비난 여론에도 뻔뻔하게 잘 살 것 같은 스타는? 운영자 24/06/03 - -
3899 시놀로지 “눈 높은 한국 고객들 의견 수렴하며 성과 거둬” IT동아갤로그로 이동합니다. 09:14 38 0
3898 노트북 출시 20주년 맞은 MSI, 컴퓨텍스 부스도 ‘노트북 풍년’ [7] IT동아갤로그로 이동합니다. 09:14 3628 2
3897 ‘모든 곳에 인공지능’을 위한 시작, 인텔 AI 서밋 서울 개최 IT동아갤로그로 이동합니다. 06.05 67 0
3896 시놀로지, 엔터프라이즈 솔루션 강화 ‘잰걸음’ IT동아갤로그로 이동합니다. 06.05 48 0
3895 [시승기] ‘K5 LPG 하이브리드’로 500km 주행 후 실연비 살펴보니 IT동아갤로그로 이동합니다. 06.05 51 0
3894 퀄컴 스냅드래곤X 시리즈, AI PC넘어 AI 산업도 노린다 IT동아갤로그로 이동합니다. 06.05 71 0
3893 국내 가상자산 커뮤니티 “텔레그램·카카오톡 활성화, 단기 시세에 민감” IT동아갤로그로 이동합니다. 06.05 53 0
3892 “디지털 혁신 이끈 3D 기술, AI로 문턱 더 낮아질 것“…어도비 서브스턴스 데이에서 엿본 미래 IT동아갤로그로 이동합니다. 06.05 56 0
3891 딥엑스, 엣지 AI용 NPU 'DX-M1'으로 중국·대만 시장에서 두각 IT동아갤로그로 이동합니다. 06.05 76 0
3890 SK하이닉스, 컴퓨텍스 2024서 GDDR7, 자체 컨트롤러 등 전시 IT동아갤로그로 이동합니다. 06.05 73 0
3889 MSI, 컴퓨텍스 2024에 ‘AI+ PC’ 대거 선보이며 ‘기선제압’ IT동아갤로그로 이동합니다. 06.05 49 0
3888 ‘연 단위 출시, 네트워크 대역 확장’ 인공지능 가속기 경쟁 달아오른다 IT동아갤로그로 이동합니다. 06.04 60 0
3887 인텔 컴퓨텍스 2024 부스 가보니··· 'AI PC 사례·제온 6 공개 눈길' [2] IT동아갤로그로 이동합니다. 06.04 1421 0
3886 컴퓨텍스 2024 MSI 부스, ‘클로’ 8인치와 ‘AMG’ 노트북 공개로 ‘북적’ IT동아갤로그로 이동합니다. 06.04 59 0
3885 펫 겔싱어, "2030년 세계 2위 파운드리 목표··· 다음 주 18A 칩 구동" IT동아갤로그로 이동합니다. 06.04 116 0
3884 인텔 제온6·가우디3·루나레이크까지 총 출동··· '시장 주도권 노린다' IT동아갤로그로 이동합니다. 06.04 64 0
3883 전기차 캐즘에도 정면 돌파 택한 ‘현대차그룹’ IT동아갤로그로 이동합니다. 06.04 59 0
3882 "AI PC 시대, 피처폰에서 스마트폰 전환만큼 혁명적 도약" [1] IT동아갤로그로 이동합니다. 06.03 535 1
3881 韓 자동차 등대공장 0개...제조공정 혁신 시급 IT동아갤로그로 이동합니다. 06.03 77 0
3880 3세대 라이젠 AIㆍ라이젠 9000 시리즈, AMD 새 CPU 제품군 대거 공개 [6] IT동아갤로그로 이동합니다. 06.03 545 1
3879 6월부터 달라진 통신3사 요금·혜택 살펴보니 [1] IT동아갤로그로 이동합니다. 06.03 690 0
3878 [정구태의 디지털자산 리터러시] 1. 지금 당신이 디지털자산에 관심을 가져야할 이유 IT동아갤로그로 이동합니다. 06.03 68 0
3877 [주간투자동향] 벤디트, 80억 원 규모 프리 시리즈A 투자 유치 IT동아갤로그로 이동합니다. 06.03 696 2
3876 여름철 필수품 '선풍기', 용도·기능에 맞춰 고르는 법! [이럴땐 이렇게!] IT동아갤로그로 이동합니다. 06.03 83 0
3875 블랙웰 다음 루빈, 엔비디아 차기 인공지능 가속 플랫폼 공개 [2] IT동아갤로그로 이동합니다. 06.03 1897 1
3874 베일에 싸였던 구글의 '검색 알고리즘'…유출 문건으로 실체 드러나 IT동아갤로그로 이동합니다. 05.31 150 0
3873 가비아, 한국마사회에 클라우드 PC ‘가비아 DaaS’ 공급 IT동아갤로그로 이동합니다. 05.31 117 0
3872 차트분석 도구 ‘트레이딩뷰’ 파고들기 - 13 IT동아갤로그로 이동합니다. 05.31 115 0
3871 외산 솔루션 가격 인상, 국산 가상화 시장 훈풍 기대 IT동아갤로그로 이동합니다. 05.31 106 0
3870 [리뷰] 게이밍-홈시네마 넘나드는 전천후 빔프로젝터, 뷰소닉 LX700-4K IT동아갤로그로 이동합니다. 05.31 1051 1
3869 [생성 AI 길라잡이] 1분 만에 영상·이미지 제작 ‘브이캣’ [2] IT동아갤로그로 이동합니다. 05.31 4821 5
3868 [농업이 IT(잇)다] 실내 수직형 스마트팜으로 생산량 극대화하는 ‘플랜티팜’ [1] IT동아갤로그로 이동합니다. 05.31 403 0
3867 페라리 DNA 담은 12기통 2인승 '12 칠린드리'…아시아 최초 공개 IT동아갤로그로 이동합니다. 05.30 121 0
3866 블랙웰에 FOPLP 조기 도입 고려 중인 엔비디아, 미세공정 넘어 생산 경쟁 유도하나? IT동아갤로그로 이동합니다. 05.30 190 0
3865 북블라 “창업의 꿈, 가천대 코코네스쿨에서 이뤄” IT동아갤로그로 이동합니다. 05.30 136 0
3864 스페이스앤빈 “뉴스페이스로의 전환, 상용 부품 적용 물꼬부터 터야” IT동아갤로그로 이동합니다. 05.30 99 0
3863 [리뷰] AFMF로 가성비 게이밍 환경 구축, AMD 라데온 RX 7700 XT [8] IT동아갤로그로 이동합니다. 05.30 5403 5
3862 [스타트업 첫걸음] 스타트업, 창업 아이디어는 어떻게 시작할까 IT동아갤로그로 이동합니다. 05.30 93 0
3861 KT클라우드, 엔비디아 GPU 기반 학습 서비스 'AI Train' 출시 IT동아갤로그로 이동합니다. 05.30 88 0
3860 캐딜락, 브랜드 최초 순수 전기 SUV ‘리릭’ 출시 [2] IT동아갤로그로 이동합니다. 05.30 448 1
3859 SBA 유망 스타트업의 면모 확인, ‘2024 연합 데모데이’ 이모저모 IT동아갤로그로 이동합니다. 05.29 93 0
3858 AI 구심점으로 떠오른 '컴퓨텍스', 올해 주목할만한 기업 별 소식은? [2] IT동아갤로그로 이동합니다. 05.29 444 0
3857 [IT애정남] 로봇청소기 고를 때 고려할 점은? IT동아갤로그로 이동합니다. 05.29 874 0
3856 두루·무의 “모두의1층이니셔티브로 장애 인식·접근성 개선” IT동아갤로그로 이동합니다. 05.29 105 0
3855 [자동차와 法] 음주운전 시 위드마크 공식 적용의 문제점에 대하여 IT동아갤로그로 이동합니다. 05.28 867 0
3854 [신차공개] 기아 'EV3'·벤틀리 '더 뉴 컨티넨탈 GT' 론칭 예고 IT동아갤로그로 이동합니다. 05.28 132 0
3853 [뉴스줌인] 내연기관차 이어 전기차 찍은 LG전자 웹OS, 다음 목표는? IT동아갤로그로 이동합니다. 05.28 206 0
3852 글로벌 가상자산 정책 동향 ‘제도 틀 안에서 규제 공백 보완’ IT동아갤로그로 이동합니다. 05.28 120 0
3851 샥즈, 오픈스윔 프로·오픈핏 에어 출시···오픈형 이어폰 1위 입지 굳힌다 IT동아갤로그로 이동합니다. 05.28 153 0
3850 서울과기대의 제조창업 지원, '밀도있는 심화 과정'으로 민다 IT동아갤로그로 이동합니다. 05.28 123 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2