디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[AI 리뷰] 사람처럼 보고 듣고 말하는 ‘GPT-4o’

리뷰타임스갤로그로 이동합니다. 2024.07.11 08:30:53
조회 2865 추천 4 댓글 1
[리뷰타임스=김우선 기자] OpenAI의 최신 자연어 처리 모델이자 차세대 생성형 AI인 GPT-4o(옴니를 의미하는 o)가 새롭게 공개됐다. 단순한 챗봇 이상의 가능성을 지닌 혁신적인 AI 모델이라는 게 OpenAI의 설명이다. SF 영화 속에 등장하는 인간과 자연스럽게 대화하는 고차원의 AI가 완성되고 있는 것이다.



생성형 AI의 혁신으로 일컬어지는 GPT-4o


 

GPT-4o를 한마디로 표현하면 ‘보고 듣고 말할 수 있는 복합적 AI’이다. 실제로 오픈AI가 공개한 데모 영상을 보면 GPT-4o는 사람처럼 자연스럽게 대화하는 데다 유머 실력까지 갖추고 있다. 기존 AI와 대화는 딱딱할 뿐 아니라, 사람이 말한 내용을 AI가 듣고 나서 답하는 형태였는데 GPT-4o와 대화는 그야말로 물 흐르듯 자연스레 이어진다.



텍스트, 오디오, 이미지 및 비디오의 모든 조합을 입력으로 받아들이고 텍스트, 오디오 및 이미지의 모든 조합을 생성한다. 오디오 입력에 대해서 반응속도가 232밀리초 안에 응답할 수 있으며, 평균 320밀리초로 인간의 응답 시간과 비슷하다.



챗GPT가 말하는 와중에 사람이 끼어들어 말할 수 있고, 여러 명의 목소리도 동시에 인식한다. GPT-4o가 응답하는 데 걸리는 시간은 평균 0.32초로 사람과 거의 비슷한 수준으로 진화했다. 기존 GPT-4의 응답 속도는 5.4초였다.



기존 유료모델인 ‘GPT-4 Turbo’보다 2배 빨라졌고, 절반이나 저렴하다. GPT-4 Turbo는 한 번에 12만 8천 개의 ‘토큰(단어량)’을 처리할 수 있고, 월 구독료는 20달러인데 반해 GPT-4o는 ‘GPT-3.5’ 모델처럼 모든 사용자에게 무료로 제공되는데 단, 유료 구독자는 무료 이용자보다 5배 이상 더 많은 메시지를 사용할 수 있다.



GPT-4o 모델 이름에서 o는 옴니(omni)의 줄임말로 ‘모든 것’, ‘어디에나 있다’는 뜻을 포함하고 있다. 오픈AI가 GPT-4o를 ‘AI 종합판’이라고 부르며 자신감을 드러낸 데는 기존 그리고 타 모델과 차별화된 5가지 옴니 기능 때문이다. 아래는 5가지 옴니 기능을 설명한 아이콘이다.




GPT-4o의 5가지 옴니 기능


 

-      텍스트, 이미지, 오디오 등 다양한 형식의 데이터를 처리할 수 있는 멀티모달(multi modal) 기능

-      이미지를 분석하고 설명하며 생성하는 강화된 비전(vision) 기능

-      실시간 웹 정보 검색을 통해 얻은 최신 정보를 기반으로 한 깊이 있는 답변 기능

-      외부 API(응용프로그램 인터스페이스)를 호출해 새로운 기능을 확장할 수 있는 펑션콜(function call) 기능

-      데이터 해석 능력을 바탕으로 한 비즈니스 인사이트 제공 기능 등이다.



주요 특징으로는 △향상된 언어 이해 능력: 이전 모델에 비해 더 높은 정확도로 텍스트를 이해하고 생성할 수 있다. 복잡한 문장 구조와 미묘한 뉘앙스까지 파악하여 자연스러운 대화를 이끌어낸다. △강화된 학습 데이터: 방대한 양의 최신 데이터로 학습된 GPT-4o는 최신 트렌드와 정보를 반영, 이를 통해 사용자에게 더욱 신뢰성 있는 정보를 제공한다. △다양한 언어 지원: GPT-4o는 다국어 지원 능력이 향상되어 다양한 언어를 능숙하게 처리하고 여러 언어 간 번역 능력도 뛰어나다. △맞춤형 응답: 사용자의 요구에 맞춘 개인화된 응답을 생성할 수 있어, 더 유연하고 적절한 대화가 가능하다.



다국어의 경우 기존에도 번역과 통역 기능은 있었지만 거의 즉각적으로 다른 언어 번역이 가능하도록 업그레이드됐다. 이에 따라 한국어 등 20개 언어를 토크나이저 압축으로 기능이 개선됐다. 아이언맨 영화에서 자비스를 장착한 수준으로 실시간 통역이 가능해 영어공부를 더 이상 할 필요가 없는 세상이 올지도 모른다.



GPT-4o에서 무엇보다 주목할 점은 AI가 카메라로 세상을 들여다본다는 점이다. 사람과 자연스럽게 대화가 가능해진 건 카메라를 통해 상대방 표정을 읽어내기 때문이다. 예를 들어, 사람이 수학 문제를 푸는 모습을 비춰주면 풀이 방법을 알려주거나, 컴퓨터 화면 속 코딩에서 잘못된 내용을 지적하는 것도 가능해졌다.




AI가 카메라를 통해 대화가 가능해졌다.


 

GPT-4o는 기존 'GPT-4' 'GPT-4V' 'GPT-4 터보' 등 기존 모델보다 더 빠르고 저렴하며 오디오와 비전 같은 입력으로부터 더 많은 정보를 유지하는 점에서 크게 개선됐다는 설명이다. 기술적으로는 기존에 대형언어모델(LMM)을 구동하기 위해 텍스트와 이미지, 음성 부분을 따로 담당하는 것을 넘어, 모델 3개를 하나로 통합했다.



이미지 인식과 음성 인식, 대답 등을 하나의 모델에서 추론함으로써 모든 대기 시간을 줄이고 사람이 하는 것과 동일한 수준으로 업그레이드됐다. 그 결과 입력된 소리에서 감정을 분석하여 대응할 수 있다. 예를 들어 거친 숨소리를 입력하면 '진정해, 긴장하지마' 라고 말해준다. 또한 데스크톱에서는 코딩을 함께 보면서 이 코딩에서는 어떤 부분을 고쳐야 하는지 음성으로 대화하면서 사람과 영상통화를 하면서 도움을 받는 듯한 느낌마저 준다.



기존 모델들은 여러 다른 모델들을 연결하고 오디오 및 비주얼과 같은 다른 매체를 텍스트로 변환한 후 다시 변환하는 방식을 사용했지만, 새로운 GPT-4o는 단일 모델에서 처음부터 멀티미디어 토큰으로 훈련, 텍스트로 변환하지 않고도 비전과 오디오를 직접 분석하고 해석할 수 있다는 것이다.



종합해보면 GPT-4o는 ‘보고 들으면서 말할 수 있는 복합 지능을 가진 AI’라고 할 수 있다. 인공지능 비서와 실제로 사랑에 빠지는 영화 Her가 점점 현실로 다가오고 있다.



GPT-4o는 모든 글로벌 이용자들에게 무료로 제공하지만, 기존 유료 이용자는 무료 이용자보다 5배 많은 질문을 할 수 있다. GPT-4o는 이날부터 사용 가능하며, 개발자는 이제 API에서 텍스트 및 비전 모델로 GPT-4o에 액세스할 수 있다. 앞으로 ChatGPT Plus 내에서 GPT-4o 알파 버전의 음성 모드 새 버전을 출시할 예정이다.

 

<ansonny@reviewtimes.co.kr>

<저작권자 ⓒ리뷰타임스, 무단전재 및 재배포 금지〉 



review_times

추천 비추천

4

고정닉 0

7

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 이성보다 동성에게 매력을 더 어필할 것 같은 남자 스타는? 운영자 24/07/29 - -
2505 [도서] 예스24, 전국 동네책방과 연계해 여름 북토크 개최 [2] 리뷰타임스갤로그로 이동합니다. 07.29 1887 1
2504 [안전] GS25, ‘차량용 소화기’ 선봬 [4] 리뷰타임스갤로그로 이동합니다. 07.29 2293 2
2503 [게임 리뷰] 가장 많은 광고비 쏟아부은 게임은 ‘블리자드’ [10] 리뷰타임스갤로그로 이동합니다. 07.29 2780 3
2502 [보안 보고서] 교묘해지는 공격 및 잠재위협 대응 위한 ‘보안관제센터 가시성 3요소’ 리뷰타임스갤로그로 이동합니다. 07.28 93 0
2501 [영상 리뷰] 유튜브 쇼츠 화질 높이는 방법 리뷰타임스갤로그로 이동합니다. 07.28 106 0
2500 [전자담배 트렌드] 액상 전담 합법화한 뉴질랜드, 흡연율 6.8%로 떨어져 리뷰타임스갤로그로 이동합니다. 07.28 92 0
2499 [클래식 리뷰 (11)] 모차르트를 빌보드 TOP10에 올려놓은 피협 21번 리뷰타임스갤로그로 이동합니다. 07.27 128 0
2498 [식당 리뷰] 맛은 ‘기본’, 기다림은 ‘덤’…짬뽕과 탕수육이 감동적인 구례 옥산식당 [1] 리뷰타임스갤로그로 이동합니다. 07.26 363 0
2497 [미용] 알페신, 이마트 신규 입점… 국내 유통 채널 다각화 박차 [6] 리뷰타임스갤로그로 이동합니다. 07.26 6030 3
2496 [리빙] 써모스, 원터치 마개 적용한 ‘어반 원터치 텀블러’ 출시 리뷰타임스갤로그로 이동합니다. 07.26 167 0
2495 [여행 리뷰] 올 여름휴가 위해 검색량 급증한 동남아 해변 여행지들 리뷰타임스갤로그로 이동합니다. 07.26 2027 1
2494 [식당 리뷰] 아재들 추억의 맛 ‘연탄불 삼겹살’을 맛보다 [4] 리뷰타임스갤로그로 이동합니다. 07.26 2464 4
2493 [국방] 휴니드 ‘MANET 솔루션’ 육군으로부터 군사적 활용 가치 인정받아 [5] 리뷰타임스갤로그로 이동합니다. 07.25 5186 0
2492 [AV] JBL, 야외 활동 블루투스 스피커 및 파티 스피커 2종 출시 [6] 리뷰타임스갤로그로 이동합니다. 07.25 1219 3
2491 [AI] 딥엘, AI 번역 서비스에 중국어 번체 추가 리뷰타임스갤로그로 이동합니다. 07.25 144 0
2490 [AV] 뱅앤올룹슨, 14대 한정 ‘베오사운드 익스플로어 블로섬 핑크’ 출시 리뷰타임스갤로그로 이동합니다. 07.25 145 0
2489 [여행 리뷰] 외국인 관광객 K-뮤직 보기 위해 한국 온다 [4] 리뷰타임스갤로그로 이동합니다. 07.25 1348 2
2488 [식당리뷰] 망원동에서 만두 잘하는 집, 만두란?! 리뷰타임스갤로그로 이동합니다. 07.25 137 0
2487 [프롭테크] 크레이지알파카, 부동산 빅데이터 플랫폼 '부동산지인' 운영사 인수 리뷰타임스갤로그로 이동합니다. 07.25 122 0
2486 [리뷰 만평] 하늘이 뚫렸다!_북한발 오물풍선 대통령실 청사 내 낙하 리뷰타임스갤로그로 이동합니다. 07.24 152 0
2485 [제품 리뷰] 케이블 고민 끝! 올인원 케이블 '롤링스퀘어 인차지 XL/X' 리뷰타임스갤로그로 이동합니다. 07.24 139 0
2484 [테크 리뷰] MS발 IT 대란 해결책, 멀티・하이브리드 클라우드 전략 리뷰타임스갤로그로 이동합니다. 07.24 149 0
2483 [환경] 지구 환경 위한 자연체험형 크루즈 그린보트, 5년만에 다시 출항 리뷰타임스갤로그로 이동합니다. 07.24 133 0
2482 [대회] 나는 백제의 예술가...한성백제박물관, 내달 12일 어린이 '백제 그림 대회' 리뷰타임스갤로그로 이동합니다. 07.24 136 0
2481 [식품 리뷰] 열대야로 잠 못 드는 밤 한우 활용 야식 추천 레시피 [33] 리뷰타임스갤로그로 이동합니다. 07.24 6348 2
2480 [PC] 샤오미, 27인치 가성비 모니터 12만원대 국내 출시 [35] 리뷰타임스갤로그로 이동합니다. 07.24 3408 4
2479 [제품 리뷰] 요즘 같은 ‘우기’에 꼭 필요한 제습기, 어느 제품이 가장 좋을까? [3] 리뷰타임스갤로그로 이동합니다. 07.24 2248 2
2478 [음식 칼럼] 음식 고수가 되는 색다른 향신료, 고수 리뷰타임스갤로그로 이동합니다. 07.24 127 0
2477 [여행 리뷰] 빌 게이츠도 픽한 튀르키예 럭셔리 휴양지 ‘보드룸’ [6] 리뷰타임스갤로그로 이동합니다. 07.24 2304 2
2476 [대회] 한글대왕 되고 싶은 전국 어린이 모여라...오는 8월 4일까지 선착순 모집 리뷰타임스갤로그로 이동합니다. 07.23 144 0
2475 [PC] MSI '프레스티지 14 AI Studio' 비즈니스 노트북 출시 리뷰타임스갤로그로 이동합니다. 07.23 154 0
2474 [라이프] 고물가 휴가 시즌, 휴가비 절약하는 몇 가지 꿀팁 [3] 리뷰타임스갤로그로 이동합니다. 07.23 5404 0
2473 [호텔] 라한호텔, 인기 작가와 함께하는 ‘여름 심야책방’ 운영 리뷰타임스갤로그로 이동합니다. 07.23 149 0
2472 [궁금증 리뷰] 마늘 쉽게 까는 법 ‘전자레인지 돌리기 vs 물에 불리기’ 결과는? [4] 리뷰타임스갤로그로 이동합니다. 07.23 2608 10
2471 [식품 리뷰] 세균 범벅 생수, 믿을 수 있나?...5개 생수업체 수질기준 위반 [1] 리뷰타임스갤로그로 이동합니다. 07.23 265 0
2470 [대회] 2030세대 걷기 대회 ‘우리 함께 걸어요’ 리뷰타임스갤로그로 이동합니다. 07.22 189 0
2469 [전시] 서울 도심 곳곳의 ‘한 평’이 조각 전시 열리는 미술관으로 변신 [1] 리뷰타임스갤로그로 이동합니다. 07.22 237 0
2468 [여행] 제주국제공항에 스누피가든 팝업 스토어 오픈 리뷰타임스갤로그로 이동합니다. 07.22 167 0
2467 [우리말 리뷰] '퀵 서비스' 대신 쉬운 우리말 '빠른 배달'로 써주세요 [40] 리뷰타임스갤로그로 이동합니다. 07.22 5778 4
2466 [스포츠] 2024 하반기 KLPGA 첫 골프퀸 누구?…제주삼다수 마스터스 8월 1~4일 개최 리뷰타임스갤로그로 이동합니다. 07.22 152 0
2465 [축제] 한국민속촌, 매일 밤 24시까지 K-공포축제 ‘심야공포촌’ 시작 [4] 리뷰타임스갤로그로 이동합니다. 07.22 2658 9
2464 [식음료 리뷰] 휴가철 맞아 열대과일 시즌 메뉴 출시 봇물 리뷰타임스갤로그로 이동합니다. 07.22 150 0
2463 [식당리뷰] 양재동 꽃시장의 명물 길거리 토스트 리뷰타임스갤로그로 이동합니다. 07.22 175 0
2462 [소셜] 틴더, AI가 가장 적합한 프로필 사진 골라준다 [2] 리뷰타임스갤로그로 이동합니다. 07.22 2362 3
2461 [소비 트렌드] 인플레이션으로 저가 상품 선호도 및 신용카드 사용 증가 [2] 리뷰타임스갤로그로 이동합니다. 07.22 504 0
2460 [제품 리뷰] 집 안 공기 상태를 색깔로 보여주는 똑똑한 솔루엠 룸메이트 리뷰타임스갤로그로 이동합니다. 07.22 147 0
2459 [AI폰] 갤럭시 2030세대 구매 비중 50% 돌파 [1] 리뷰타임스갤로그로 이동합니다. 07.19 377 0
2458 [식품] 여름에 먹으면 더 좋은 한우 보양식 다이어트 요리법 [16] 리뷰타임스갤로그로 이동합니다. 07.19 6957 1
2457 [항공] 싱가포르항공, 여름휴가 시즌 맞이 프로모션으로 여행객 사로잡아 리뷰타임스갤로그로 이동합니다. 07.19 213 0
2456 [전기차] 푸조, 국내 소형 전기차 대전 참여…전기차 2종 최대 1,400만원 할인 리뷰타임스갤로그로 이동합니다. 07.19 205 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2