디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

[스타트업-ing] 클레온 “AWS 인퍼런시아로 GPU 서버 비용 50% 줄였어요”

IT동아갤로그로 이동합니다. 2024.03.21 14:58:57
조회 144 추천 0 댓글 0
[IT동아 한만혁 기자] 생성형 인공지능(AI)이 주목받으면서 다양한 스타트업이 AI 기반 솔루션을 선보이고 있다. 새로운 시장을 개척하면서 글로벌 기업과 투자자의 주목을 끄는 곳도 적지 않다. 하지만 이들은 막대한 GPU 서버 비용을 감당해야 한다는 부담을 안고 있다. AI 솔루션 개발 이후에도 최적화, 경량화 작업에 많은 노력을 기울이는 이유다.

디지털 휴먼을 통해 소통의 경험을 개선하고 있는 클레온 역시 GPU 서버 비용에 부담을 느끼고 있는 스타트업 중 하나다. 클레온은 한 장의 사진과 30초 분량의 목소리로 디지털 휴먼 영상을 제작하는 클론, 디지털 휴먼과 자유롭게 대화하는 챗아바타 등의 서비스를 제공하고 있으며, 보다 많은 사람에게 디지털 휴먼 서비스를 제공하기 위해 노력하고 있다.

GPU 서버 비용 절감을 위해 고민하던 클레온은 최근 아마존웹서비스 인퍼런시아(AWS Inferentia)를 도입했다. 인퍼런시아는 딥러닝 추론 애플리케이션에 필요한 고성능을 최저 비용으로 제공하도록 설계된 AI 칩이다. 덕분에 클레온은 디지털 휴먼 생성 모델 추론 비용을 50% 절감했다.

클레온에서 인퍼런시아 도입을 담당했던 조대양 프로덕트AI팀장을 만나 좀 더 자세한 이야기를 나눴다.


조대양 클레온 프로덕트AI팀장 / 출처=AWS


디지털 휴먼으로 소통의 혁신 이룬다


IT동아: 안녕하세요, 조대양 팀장님. 우선 팀장님 소개 부탁드립니다.

조대양 팀장: 안녕하세요, 클레온에서 프로덕트 AI팀을 맡고 있는 조대양입니다. 저는 카이스트에서 박사 과정을 밟으면서 네트워크 시스템 고도화 연구를 하고 있었는데요. 동료, 선배의 권유로 디지털 휴먼 상용화에 기여하고자 클레온에 합류하게 되었습니다.

언뜻 보면 기존에 연구하던 분야와 차이가 있는 것 같지만 사실 딥러닝도 GPU라는 하드웨어에서 돌아갑니다. 제가 연구하던 것이 네트워크 시스템을 최적화하고 하드웨어의 로우 레벨 코드를 개발하는 작업이어서 원리는 비슷해요. 어느 정도 연관성은 있죠.

IT동아: 현재 클레온에서 프로덕트 AI 팀장을 맡고 있는데요. 어떤 일을 하는 팀인가요?

조대양 팀장: 클레온에는 R&D테크센터가 있고 그 안에 프로덕트 AI팀과 퓨처AI팀, 백엔드팀이 있습니다. 퓨처AI팀은 새로운 AI 기술을 연구하고, 프로덕트AI팀은 퓨처AI팀의 성과나 실제 서비스에 적용할 수 있는 기술을 찾아 고도화하는 역할을 합니다. 백엔드팀은 프로덕트AI팀이 고도화한 딥러닝 모델을 서비스에서 사용할 수 있도록 연동하고요. 그러니까 저희 팀은 주로 딥러닝 모델 연구, 솔루션 경량화, 데이터를 통한 모델 성능 개선 등의 업무를 하고 있습니다.

IT동아: 클레온에 대해서도 말씀 부탁드립니다.

조대양 팀장: 클레온은 디지털 휴먼을 통해 소통의 혁신을 이루고자 합니다. 기존의 소통은 대면이나 전화, 온라인, 화상회의 등을 통해 이뤄지는데 여기에는 시간적, 공간적, 언어적 한계가 있습니다. 저희는 디지털 휴먼을 통해 깨어 있을 때뿐 아니라 잠든 시간에도 소통하고, 자동 통역을 통해 언어에 구애받지 않고 소통하는 등 물리적인 장벽을 허물고 언제 어디서나 쉽고 빠르게 소통하는 세상을 만들고자 합니다.

이를 위해 현재 클론, 챗아바타, 클링 서비스를 출시했습니다. 클론은 한 장의 사진과 목소리로 디지털 휴먼을 생성하는 서비스입니다. 원하는 메시지를 텍스트로 전송하면 디지털 휴먼이 말하는 방식입니다.

챗아바타는 다양한 컨셉의 디지털 휴먼과 언제든지 대화할 수 있는 서비스입니다. 클론과 달리 실시간 대화형 서비스에요. 아바타에게 질문하면 바로 답변을 들을 수 있죠. 클링은 더빙 언어에 따른 입 모양을 생성하는 서비스입니다.


클레온이 디지털 휴먼으로 구현한 챗아바타 서비스 / 출처=클레온



IT동아: 이들 서비스를 위해 클레온이 구축한 기술은 무엇인가요?

조대양 팀장: 디지털 휴먼을 만들기 위해서는 얼굴, 입 모양, 전신, 감정 등 다양한 측면에서 딥러닝 모델을 활용해야 합니다. 저희는 원하는 대상의 전체 두상을 가져오는 헤드스와프(HeadSwap) 기술을 보유하고 있습니다. 기존에는 눈, 코, 입에 국한되는 페이스스와프(FaceSwap) 기술만 있었는데 지금은 머리카락, 얼굴 크기 등 머리 전체를 가져옵니다.

또한 음성에 맞춰 입 모양을 만드는 립싱크 생성 기술, 옷을 포함하여 몸 전신을 만드는 풀보디(Full Body) 생성 기술을 개발했습니다. 30초 정도 분량 목소리만 있으면 어떤 텍스트를 입력하든 그 목소리로 읽어주는 일종의 TTS 기술도 보유하고 있어요. 현재 5개 언어를 지원하고 있는데요. 지속적으로 추가할 예정입니다. 딥러닝 모델 경량화 또한 저희의 강점입니다. 덕분에 디지털 휴먼을 상대적으로 저렴한 비용에 서비스할 수 있어요.

GPU 서버 비용 절감 위한 선택


IT동아: 클레온은 최근에 AWS 인퍼런시아를 도입했습니다. 도입하게 된 계기가 있나요?

조대양 팀장: 저희는 AWS가 제공하는 엔비디아 GPU 서버 EC2 G4dn을 사용했습니다. 성능이나 개발 환경은 충분히 만족스러웠어요. 하지만 비용 부담이 컸습니다. GPU 서버 비용이 다른 서버에 비해 압도적으로 높아요. 전체 비용의 70~80%를 차지할 때도 있습니다. 오픈AI가 챗GPT를 운영하는데 하루 70만 달러(약 9억 2771만 원)가 든다는 기사도 있죠. 대부분의 기업이 솔루션 개발 이후 최적화, 경량화하는 이유 중의 하나가 GPU 서버 비용을 줄이기 위함이에요.

특히 저희는 보다 많은 고객에게 서비스를 제공하는 것이 목표이다 보니 아무래도 GPU 서버 비용 절감이 절실한 상황이었어요. 그래서 고민하고 있었는데 AWS의 저희 전담 어카운트 매니저가 성능은 비슷한데 GPU 서버 비용을 줄일 수 있다면서 인퍼런시아를 추천하더라고요. 그래서 도입을 결정했습니다.


기업의 GPU 서버 비용 부담을 줄이는 AWS 인퍼런시아 / 출처=AWS



IT동아: 실제로 도입해 보니 어떤가요? 비용 절감 효과를 보셨나요?

조대양 팀장: 지난해 9월부터 시작해 약 두 달간 작업했습니다. 사실 한 달이면 될 줄 알았는데 다른 업무와 병행하기도 했고 예기치 못한 오류들이 좀 있어서 예상보다 오래 걸렸어요. 물론 다른 기업의 솔루션을 적용했다면 더 오래 걸렸을 거에요. AWS의 경우 문서화도 잘 되어 있고 질문을 올리면 AWS 본사나 한국의 솔루션 아키텍처(SA)가 빠르게 대응해서 좀 수월했습니다.

성능 부분에서는 기존 환경과 유사합니다. 설계 방식이 다르긴 하지만 사양이나 최대 성능은 거의 동일하거든요. 실무자 입장에서는 별다른 차이를 못 느끼고 있습니다. 그럼에도 GPU 서버 비용은 거의 절반 수준으로 낮아졌어요. 사실 GPU 서버 비용은 워낙 액수가 크다 보니 10~20%만 줄여도 굉장한 혜택이거든요.

저희가 계산해 보니 인퍼런시아 Inf1.xlarge 사용 시 g4dn.xlarge 대비 39.32%, Inf1.6xlarge 사용 시 g4dn.12xlarge 대비 59.78%의 비용 절감 효과가 있더라고요. 회사 입장에서는 엄청난 장점이죠.


클레온은 AWS 인퍼런시아 도입 후 GPU 서버 비용 부담을 약 50% 줄였다 / 출처=클레온



IT동아: 비용 절감 효과는 확실하네요. 그런데 도입 과정에서 오류가 좀 있었다고 하셨는데요. 어떤 오류였나요?

조대양 팀장: 사실 저는 그전부터 인퍼런시아에 대해 알고 있었어요. 비용을 획기적으로 줄인다는 장점도 들었고요. 그런데 정작 실제 적용 사례는 많지 않더라고요. 도입을 검토하면서 기존 사례들을 좀 찾아봤는데 도입 과정보다는 결과에 대한 이야기가 많았어요. 그래서 도입 과정이 간단할 거라고 예상했죠.

그런데 실제로 해보니 오류가 좀 나오더라고요. 그런데 에러 메시지가 명확하지 않았어요. 에러 위치가 ‘unknown(알 수 없음)’으로 나오기도 했고요. 해결하고 보니 그렇게 어려운 문제는 아닌데 에러 메시지가 정확하지 않아서 조금 더 세밀하게 살펴보고 이런저런 시도를 해야 하죠. 아무래도 딥러닝 분야의 발전 속도가 너무 빠르고 사용 사례가 천차만별이라 세세한 부분까지 구현되지 않은 것 같더라고요.

물론 AWS의 도움도 받았습니다. AWS와 소통하는 채널이 있는데, 그곳을 통해 증상이나 오류에 대해 문의하면 AWS 인퍼런시아 개발팀이나 국내 SA팀이 실제 내부에서 테스트해 보고 빠르게 회신을 주더라고요. 덕분에 수월하게 해결책을 찾기도 했습니다. 그리고 저희가 먼저 문의하지 않아도 국내 SA팀이 수시로 연락해 좀 더 잘 활용할 수 있는 팁이나 조언을 주기도 했어요. 많은 도움이 되었습니다.

IT동아: 말씀을 들어보니 인퍼런시아에 대해 전반적으로 만족하고 있는 것 같습니다. 그러면 다른 스타트업에도 추천할 만한가요?

조대양 팀장: GPU 서버 비용 이슈는 AI를 활용하는 모든 기업이 공통으로 느끼는 부분입니다. 저는 인퍼런시아가 그 기업 모두에게 적합한 솔루션이라고 생각합니다. 특히 AWS G4dn을 사용하는 기업에게 추천하고 싶어요. 물론 저희처럼 도입 과정에서 오류가 나올 수도 있어요. 하지만 그것을 잘 풀어가면 그 이후에는 엄청난 비용 절감 효과를 경험할 수 있을 것입니다. 저희도 새로 개발하는 추론 서버에 인퍼런시아를 적극 사용할 계획입니다. 이를 통해 비용을 절감하고 고객에게 보다 합리적인 가격으로 서비스를 제공하도록 노력할 것입니다.


AWS 유니콘데이 2024에서 AWS 인퍼런시아 도입 사례를 공유하는 조대양 팀장 / 출처=IT동아



IT동아: 마지막으로 클레온의 향후 계획 및 목표에 대해 말씀 부탁드립니다.

조대양 팀장: 우선 몇 가지 새로운 서비스를 준비하고 있어요. 우선 연예인 디지털 휴먼과 다양한 언어로 대화하는 서비스 ‘크리챗’을 내년 상반기에 선보일 예정입니다. 또한 웃음, 화, 슬픔 등 감정을 표현할 수 있는 3D 메시 기반 디지털 휴먼도 제작하고 있습니다.

글로벌 시장도 적극적으로 준비하고 있습니다. 특히 미국의 경우 챗봇 시장이 활성화되어 있는데, 그만큼 디지털 휴먼에 대한 니즈도 강합니다. 저희는 3월 18일부터 진행된 엔비디아 GPU 테크놀로지 콘퍼런스(GTC) 2024에 참여하고 있는데 이를 통해 다양한 챗봇 기업과 협업 포인트를 만들고자 합니다.

이와 함께 지속적인 서비스 기획, 모델 고도화 및 경량화 등을 통해 다양한 분야에서 활용되고 편의성을 제공하는 섬세한 디지털 휴먼을 만들기 위해 노력할 것입니다.

글 / IT동아 한만혁 기자 (mh@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ 스타트업 혁신 지원하는 AWS ’AWS 유니콘데이’▶ AI 혁신의 중심 된 '엔비디아 GTC 2024', 국내 주요 참여 스타트업은?▶ [IT강의실] 생성형 AI와 클라우드의 상관관계는?



추천 비추천

0

고정닉 0

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 손해 보기 싫어서 피해 입으면 반드시 되갚아 줄 것 같은 스타는? 운영자 24/11/18 - -
3605 [스타트업 법률실무] 기고를 마치며 IT동아갤로그로 이동합니다. 03.25 135 0
3604 [주간투자동향] 알고케어, 150억 원 규모 시리즈A 투자 유치 IT동아갤로그로 이동합니다. 03.25 203 0
3603 스마트폰으로 봄 꽃 사진 잘 찍으려면? [이럴땐 이렇게!] IT동아갤로그로 이동합니다. 03.25 1008 8
3602 [생성 AI 길라잡이] 갤럭시 AI 활용하기 - '노트 어시스트' [5] IT동아갤로그로 이동합니다. 03.23 6072 6
3601 [2024 고려대 초창패] 이민우 퀀텀유니버스 대표 “확장형 콘텐츠를 넘어 새로운 가치를 만들 것” IT동아갤로그로 이동합니다. 03.22 149 0
3600 차트분석 도구 ‘트레이딩뷰’ 파고들기 - 3 IT동아갤로그로 이동합니다. 03.22 164 0
3599 [농업이 IT(잇)다] '드론·자동농약배합기'로 농작물 관리 효율 높이는 ‘아쎄따’ IT동아갤로그로 이동합니다. 03.22 145 0
3598 [뉴스줌인] 미니 각 티슈 크기의 ‘LG 시네빔 큐브’ 프로젝터, 쓸 만할까? IT동아갤로그로 이동합니다. 03.22 164 0
3597 [2024 고려대 초창패] 아이젠텍 “40분 만에 결과 나오는 PCR 검사, 국내 기술로 가능합니다” IT동아갤로그로 이동합니다. 03.22 1009 0
3596 클라우드 입지 구축한 오라클, 다음은 목표는 AI IT동아갤로그로 이동합니다. 03.21 147 0
3595 ‘기존 제품의 특징을 다듬어 확대했다’ 한미마이크로닉스 2024년 신제품 발표 IT동아갤로그로 이동합니다. 03.21 313 0
3594 [자동차 디자人] 폭스바겐 브랜드 디자인 총괄 ‘안드레아스 민트’ [1] IT동아갤로그로 이동합니다. 03.21 612 1
3593 스마트 상권으로 거듭나는 춘천 원도심, ‘봄나들거리 축제’ 눈길 IT동아갤로그로 이동합니다. 03.21 143 0
3592 [리뷰] 13세대 코어 i5-1340P와 비교한 '인텔 코어 울트라 5 125H' IT동아갤로그로 이동합니다. 03.21 1381 0
[스타트업-ing] 클레온 “AWS 인퍼런시아로 GPU 서버 비용 50% 줄였어요” IT동아갤로그로 이동합니다. 03.21 144 0
3590 식량위기 극복할 대체식품 산업, 지자체와 푸드테크 기업이 손잡고 키운다 [7] IT동아갤로그로 이동합니다. 03.21 1084 0
3589 ‘어디서든 인공지능 가속 지원’ AMD 코리아, 인공지능 시장 청사진 제시 IT동아갤로그로 이동합니다. 03.20 137 0
3588 카카오벤처스 "비만 치료제 열풍, 스타트업에 새로운 기회" [1] IT동아갤로그로 이동합니다. 03.20 483 0
3587 스타트업 혁신 지원하는 AWS ’AWS 유니콘데이’ IT동아갤로그로 이동합니다. 03.20 132 0
3586 [월간자동차] 24년 2월, 판매 1위 모델 국산 ‘쏘렌토’·수입 ‘BMW 5시리즈’ IT동아갤로그로 이동합니다. 03.20 901 2
3585 "AI로 고객 응대하고, 광고 문구 쓰세요"…SKT, AI 기반 B2B 사업 확대 박차 IT동아갤로그로 이동합니다. 03.20 123 0
3584 퀄컴, 경제성·효율 높인 '스냅드래곤 8s 3세대' 출시 IT동아갤로그로 이동합니다. 03.20 157 0
3583 [자동차와 法] 교통사고 과실비율에 대한 고찰 IT동아갤로그로 이동합니다. 03.19 129 0
3582 ‘하드웨어+소프트웨어’ 플랫폼으로 인공지능 생태계 장악 노리는 엔비디아의 속내는? [1] IT동아갤로그로 이동합니다. 03.19 498 0
3581 엔비디아 GTC 2024 개최, ‘블랙웰’과 ‘NIMS’로 인공지능 생태계 강화 나선다 IT동아갤로그로 이동합니다. 03.19 114 0
3580 '맞춤형 지원 패키지와 함께하는 창업' 엠디글로벌넷, 경기 신사업창업사관학교 참가자 모집 IT동아갤로그로 이동합니다. 03.19 121 0
3579 [2024 고려대 초창패] 번거로운 매출·배달 관리를 하나로 ‘올인원 포스’ IT동아갤로그로 이동합니다. 03.19 109 0
3578 [뉴스줌인] 최신 보급형폰, 6년 전 고급형폰, 뭐가 더 좋을까? [10] IT동아갤로그로 이동합니다. 03.19 1229 2
3577 [IT신상공개] 거리 맞춰 온도 조절하는 '다이슨 슈퍼소닉 뉴럴 헤어드라이어' IT동아갤로그로 이동합니다. 03.19 427 0
3576 [IT강의실] 실물 자산을 가상자산으로 ‘RWA’ [2] IT동아갤로그로 이동합니다. 03.19 836 0
3575 [KESIA 시드팁스] "멀지만 가까운 왕진, 똑똑의사로 모두가 누리게 할 것" [1] IT동아갤로그로 이동합니다. 03.19 192 0
3574 가격대별 출시 예정 전기 SUV 살펴보니 IT동아갤로그로 이동합니다. 03.18 136 0
3573 AI 혁신의 중심 된 '엔비디아 GTC 2024', 국내 주요 참여 스타트업은? IT동아갤로그로 이동합니다. 03.18 467 0
3572 [스타트업 법률실무 마스터링] 투자유치 법률실무 (4) - 계약 위반과 분쟁 방지 IT동아갤로그로 이동합니다. 03.18 765 0
3571 ‘엔비디아ㆍAMD’ 인공지능 생태계 경쟁, 이제 시작이다 IT동아갤로그로 이동합니다. 03.15 209 0
3570 [시승기] 브랜드 첫 1만대 클럽 가입 이끈 ‘포르쉐 카이엔’ IT동아갤로그로 이동합니다. 03.15 213 0
3569 [2024 고려대 초창패] 라르크 인터내셔널 “인플루언서 이름 건 제품, 기획∙제조∙유통까지 책임진다” IT동아갤로그로 이동합니다. 03.15 177 0
3568 [생성 AI 길라잡이] 윈도우 11에 내장된 생성형 AI, '코파일럿' IT동아갤로그로 이동합니다. 03.15 290 0
3567 [IT애정남] 스마트폰으로 별 사진 찍으려면 어떻게 해야 하나요? [2] IT동아갤로그로 이동합니다. 03.15 3855 7
3566 [KESIA 시드팁스] 세일즈맵 “한국 기업의 일하는 방식에 맞는 CRM은 따로 있습니다” IT동아갤로그로 이동합니다. 03.15 173 0
3565 전기차 안전·주행거리 지키는 배터리 열관리 시스템 IT동아갤로그로 이동합니다. 03.14 388 0
3564 [KESIA 시드팁스] 메텔 “해외 고객이 제 발로 찾아오게 하는 AI 마케터” IT동아갤로그로 이동합니다. 03.14 172 0
3563 도시가스·콘택트렌즈 등 6건 ICT 규제 샌드박스 지정 [1] IT동아갤로그로 이동합니다. 03.14 882 0
3562 차트분석 도구 ‘트레이딩뷰’ 파고들기 - 2 IT동아갤로그로 이동합니다. 03.13 247 0
3561 [뉴스줌인] 2024년형 ‘AI TV’ 출시한 삼성전자, 핵심은 AI 기반 업스케일링 [3] IT동아갤로그로 이동합니다. 03.13 2034 1
3560 미세먼지·이물질 흡입하는 ‘노면 청소차’ 작동 원리 살펴보니 IT동아갤로그로 이동합니다. 03.13 168 0
3559 펀블, 신규 STO 플랫폼 및 투자 상품 출시 “STO 시장 선점할 것” IT동아갤로그로 이동합니다. 03.13 161 0
3558 벤큐코리아 ‘2024 디자인뷰 어워드’ 디자인 공모전 개최 IT동아갤로그로 이동합니다. 03.12 174 0
3557 인공지능 아니었으면... 코세라 한국어 번역 강좌로 한국 시장 진출 [2] IT동아갤로그로 이동합니다. 03.12 1237 1
3556 다시 걷는 춘천 원도심, ‘상권르네상스 사업’ [1] IT동아갤로그로 이동합니다. 03.12 1913 2
뉴스 데이식스, 12월 고척돔 콘서트 3만8천석 전석 매진 디시트렌드 14:00
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2