디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

"소프트웨어·모델 효율이 NPU 성능 좌우···" 퓨리오사AI가 펼칠 전략은?

IT동아갤로그로 이동합니다. 2023.09.01 13:15:06
조회 107 추천 0 댓글 0
[IT동아 남시현 기자]

“대다수의 인공신경망 반도체(NPU)가 모델 컴프레션을 지원하지만, 기업에서 직접 시간과 인력을 투입해 개별 모델을 구축해야 해 활용도가 떨어진다. 퓨리오사AI는 이 문제를 제조사의 과제로 보고 직접 수백에서 수천 개의 모델을 최적화하고 매뉴얼처럼 배포할 계획이다. 이것이 퓨리오사AI가 알고리즘 팀을 운용하는 이유다”


고병건 퓨리오사 AI 알고리즘 팀 파트 리더가 1세대 반도체 ‘워보이(WARBOY)’를 들고 있다 / 출처=IT동아



AI 가속기, 인공지능 반도체에서 중요한 것은 하드웨어 성능이다. 인공지능을 설계하고 개발하기 위해서는 하드웨어의 성능이 좋아야 하고, 소프트웨어는 이를 활용하기 위한 도구에 가깝다. 하지만 효율이 좋고 뛰어난 하드웨어도 소프트웨어 지원이 미비하면 제성능을 낼 수 없다. 인텔 조차 ‘하드웨어는 25%, 소프트웨어가 75%’라는 기조로 인공지능 생태계를 구축하고 있다.

퓨리오사AI(FuriosaAI) 알고리즘 팀의 모델 컴프레션 파트를 이끄는 고병건 파트 리더도 인터뷰 내내 소프트웨어의 중요성을 강조했다. 왜 퓨리오사AI는 직접 소프트웨어 생태계를 만드는지, 또 모델 컴프레션 팀이 별도로 구성된 이유와 의미는 무엇인지에 들어볼 시간을 가졌다.

알고리즘 공학과 모델 압축, 인공지능 개발 효율 높이는 절차



퓨리오사AI의 알고리즘 팀은 애플리케이션 파트와 모델 컴프레션 파트로 나뉜다. 고 파트 리더의 경우 모델 컴프레션과 양자화 모델링 업무를 맡고 있다 / 출처=IT동아



고병건 파트 리더는 알고리즘 팀 소속으로 모델 컴프레션(압축), 양자화 모델링 업무를 맡고 있다. 올해로 10년차인 그는 증강현실 장치의 초소형 디스플레이 모듈을 만드는 팀으로 경력을 시작했고, 이후로 칩스앤미디어에서 심화학습을 활용해 초고화질을 개선하는 알고리즘 개발 업무를 맡았다. 알고리즘은 어떤 문제를 해결할 때 원하는 결과로의 출력을 유도하는 규칙의 집합인데, 인공지능 분야에서는 학습 및 처리 과정을 최적화하기 위해 사용된다.

이후 고병건 파트 리더는 성장하는 시장에 뛰어들겠다는 생각으로 이직을 결정했고, 낯설지만 성장 가능성이 충분한 인공신경망 반도체 업계에 알고리즘 엔지니어라는 직함으로 뛰어들었다. 현재 그는 알고리즘 제작은 물론 이를 효율적으로 압축하는 모델 컴프레션을 다루며, 더욱 미세한 단위로 알고리즘을 조정하는 양자화 모델링까지 진행하고 있다.


퓨리오사AI 알고리즘 팀 / 출처=퓨리오사AI



알고리즘 팀의 구성과 역할을 물어봤다. 고병건 파트 리더는 “퓨리오사AI의 알고리즘 팀은 NPU 위에서 동작하는 심화학습의 알고리즘을 최적화하는 엔지니어다. 팀은 크게 애플리케이션 파트와 모델 컴프레션 파트로 나뉜다. 애플리케이션 파트는 모델 알고리즘을 레퍼런스 키트로 구축하는 팀으로, 쉽게 말해 인공지능이 쓰이는 다양한 환경에서 바로 활용할 수 있는 기본 도구를 만드는 팀이다. 모델 컴프레션 파트는 모델을 말 그대로 압축하는 일을 하는데, 연산 자체는 그대로 두면서 알고리즘은 경량화해 연산 효율은 올리고 소비전력은 낮추는 역할을 한다”라고 대답했다.

“엔비디아와 비슷한 전략 추구··· 소프트웨어 제공에 방점”


현재 전 세계 인공지능 반도체 수요는 엔비디아가 80% 이상 독점하고 있다. 엔비디아의 그래픽 처리 유닛(GPU)이 단순 연산에 최적화된 장점도 있지만, 레퍼런스 키트와 모델 컴프레션 도구 등을 제공해 생태계를 닦아왔기에 가능한 결과였다. 덕분에 연구자들이 직접 모델을 만들고, 압축하는 과정까지 가능하다고 한다. 동종의 NPU 업계에서 잘 갖추지 않는 모델 컴프레션 팀을 구축한 이유도 퓨리오사AI가 엔비디아와 비슷한 전략을 추구하기 때문이다.

예를 들어 컴퓨터를 구매했으면, 이를 어떻게 활용할지는 구매자의 몫이다. 구매자가 특정 조건에 맞춰서 쓰려면 본인이 관련 기술을 습득하고 찾아야 한다. NPU를 활용하는 것, 그리고 이를 압축해서 효율화하는 과정도 모두 구매자의 역할이다. 엔비디아는 이 과정이 쉽도록 도구를 제공하는 수준인데, 퓨리오사AI는 한발 더 나아가 자주 쓰는 도구를 직접 개량해서 내놓겠다는 입장이다. 이미 퓨리오사AI는 국내 NPU 업계로는 유일하게 소프트웨어 개발 도구(SDK)를 제공하고 있고, 그다음 절차가 모델 컴프레션 킷이다.


퓨리오사AI가 제공하고 있는 NPU용 SDK 문서, 이용자 누구나 활용할 수 있다 / 출처=퓨리오사AI



고병건 파트 리더는 “인공지능 추론용 NPU 업계에서 모델 컴프레션 툴킷을 제공하는 경우는 거의 없고, 그마저도 초기 단계다. 엔비디아가 제공하긴 하나 진척도가 높진 않고, 퀄컴이나 인텔 정도가 압축용 툴킷을 제공하고 있다. 아마도 퓨리오사AI의 모델 컴프레션 진척도는 세 개 기업 다음 수준이라 보고 있다”라고 덧붙였다.

이 대목에서 퓨리오사AI의 철학을 엿볼 수 있다. 퓨리오사AI가 레퍼런스 키트나 모델 컴프레션 키트를 제공해도 그 자체로는 수익을 낼 수 없다. 그럼에도 불구하고 최적화된 모델을 제공하면 타사에 비해 유리한 고지를 차지할 수 있고, 연구자나 개발자가 관련 생태계에 쉽게 진입할 수 있다는 장점이 있다.

개별 기업의 경우 모델 개발과 모델 압축에 필요한 비용을 절감할 수 있고, 또 NPU를 효율적으로 운용할 수 있다는 장점이 있다. 특히나 하드웨어를 설계하는 쪽에서 직접 모델 컴프레션에 관여하다 보니 개별 기업이 진행하는 결과보다 훨씬 효율적이고 고차원적으로 추진할 수 있다는 점도 빼놓을 수 없다.

2세대 반도체 ‘레니게이드’에서 모델 컴프레션 진가 발휘



고병건 파트 리더는 2세대 반도체부터 본격적으로 모델 컴프레션 킷이 배포되고, 제대로된 성능을 제공할 것이라 말했다 / 출처=IT동아



고병건 파트 리더는 내년 초 공개될 2세대 반도체, 레니게이드를 위한 모델 컴프레션 키트 개발에 한창이다. 고병건 파트 리더는 “1세대 NPU 워보이의 가장 큰 강점은 SDK 제공이다. SDK가 있으면 컴퓨터 언어를 변환하는 컴파일 과정이 손쉽게 자동화된다. 또한 실질적으로 제공되는 값이 홍보용 수치가 아닌 실제 결괏값이기 때문에 고객이 원하는 결과를 그대로 받을 수 있다. 사용자가 맞춤형 개발을 할 수 있고, 스펙 경쟁이 아닌 효용성 관점에서 이득이다”라면서 “K-클라우드 프로젝트의 AI 바우처 사업에서 48%의 기업이 워보이를 선택한 이유에도 영향을 미쳤을 것”이라고 말했다.

이어서 “SDK가 준비돼있는 만큼, 2세대 NPU 레니게이드는 더욱 상위 계층의 소프트웨어를 활용할 수 있을 것이고, 또 모델 컴프레션 툴킷까지 완성돼 배포되면 활용도는 한층 높아질 것이다. 특히 레니게이드는 5nm 공정 기반의 빅칩이 탑재되고, 또 초고대역폭의 HBM3 메모리가 탑재돼 대형언어 모델은 물론 다양한 인공지능 연구에 높은 효율을 보일 것”이라고 덧붙였다.


고병건 파트 리더는 NPU 개발 과정을 다양한 악기 연주가 하나의 화음을 이루는 오케스트라와 같다고 말했다 / 출처=IT동아



레니게이드를 만들어가는 과정도 알고리즘 개발 측면에서 강점이라고 말한다. 고병건 파트 리더는 “알고리즘의 효율을 높이려면 개발 과정 전반에 개입하고 최적화해야 한다. 퓨리오사AI는 프로덕트, 디자인, 하드웨어, 소프트웨어, 데이터 등 서로 다른 개발팀이 긴밀하고 정밀하게 조율하며 NPU를 설계하고 있어서 알고리즘 팀이 개입하기가 수월하다. 물론 알고리즘 자체가 시스템 설계보다 추상적이므로 모든 절차에서 적절하게 소통해야 하는데, 팀 자체가 유기적으로 개입할 수 있어서 효율적으로 작업에 임하고 있다”라고 말했다.

“인공지능 상용화할수록 NPU가 친환경 기술로 떠오를 것”



고병건 파트 리더는 개인적으로도, 회사 입장에서도 NPU가 인공지능 대중화 시대에 친환경 기술이 될 것이라고 말한다 / 출처=IT동아



마지막으로 고병건 파트 리더는 인공지능 업계 엔지니어로서의 역할과 사명감에 대해 말했다. 고병건 파트 리더는 “내가 퓨리오사AI를 선택한 이유는 기후위기, 그리고 탄소중립과 관련돼 있다. 인공지능이 발전하면 심화학습에 대한 수요는 늘 수밖에 없고, 전력이나 자원 소모량도 커질 것이다. 심화학습 알고리즘의 규모도 매년 커지고 있고, 이를 효율적으로 구동하는 게 점점 더 중요해지는 상황”이라면서, “머지않아 NPU와 최적화된 모델이 GPU와 비효율적 모델을 대신하는 친환경, 지속가능한 기술로 인식될 것이다. 지금 이 길이 새로운 시장과 기후 위기를 극복하는 길이라는 확신을 갖고 이 일을 해 나갈 것”이라며 대화를 마무리했다.

글 / IT동아 남시현 (sh@itdonga.com)

사용자 중심의 IT 저널 - IT동아 (it.donga.com)



▶ 챗GPT로 쏘아올린 생성형 AI 경쟁, 기업용 업무 시장에서 맞붙는다▶ [뉴스줌인] 딥러닝 시장 겨냥한 PNY 그래픽카드, 일반 제품과의 차이점은?▶ 글로벌 IT 리더 절반이 'AI 인프라 부족' 지적··· 노트북부터 AI 탑재 시작



추천 비추천

0

고정닉 0

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 손해 보기 싫어서 피해 입으면 반드시 되갚아 줄 것 같은 스타는? 운영자 24/11/18 - -
4556 전문가가 제시하는 스타트업 ESG 경영 전략…’2024 서울 스타트업 ESG 포럼’ IT동아갤로그로 이동합니다. 11.21 38 0
4555 수원대학교 'WoW 스타트업 브랜치 오픈이노베이션' 개최 IT동아갤로그로 이동합니다. 11.21 39 0
4554 [스타트업리뷰] 로닉 “인공지능 맞춤형 음식 도우미, AI 로봇셰프 큐브” IT동아갤로그로 이동합니다. 11.21 3882 0
4553 [IT기획자의 탄생] 3. IT기획자에게 필요한 상상력과 글로벌 전략 IT동아갤로그로 이동합니다. 11.21 52 0
4552 [IT’s 가성비] 삼성 크리스탈 UHD TV, 2024년형/85인치 모델에 눈길? IT동아갤로그로 이동합니다. 11.21 1812 0
4551 [스케일업] 클리카 [3] 피터 노빅과의 대담으로 살펴본 'AI 스타트업'의 방향성 IT동아갤로그로 이동합니다. 11.21 50 0
4550 [생활 속 IT] LG 가전 활용도 넓히는 'LG ThinQ' 연결 및 사용법 IT동아갤로그로 이동합니다. 11.21 48 0
4549 [생활 속 IT] 소프트웨어 활용 습관 바꿔줄 윈도 11 ‘가상 데스크톱’ [1] IT동아갤로그로 이동합니다. 11.20 110 0
4548 [부산창경 BEF 2024] 기술로 문제 풀이와 오답 노트 작성 효율 높인 ‘프라이머스’ IT동아갤로그로 이동합니다. 11.20 64 0
4547 IBM-연세대, 슈퍼컴 능가하는 127 큐비트 양자컴퓨터 국내 첫 도입 [3] IT동아갤로그로 이동합니다. 11.20 4796 4
4546 [주간스타트업동향] 휴머닉스, 위플로 CES 2025 혁신상 수상 外 IT동아갤로그로 이동합니다. 11.20 123 0
4545 [부산창경 BEF 2024] 만만한녀석들 “모듈형 집기로 친환경 MICE 산업 선도한다” IT동아갤로그로 이동합니다. 11.20 62 0
4544 [부산창경 BEF 2024] 나누기월드 “외국인 유학생, 장애인 문제 해결에 기여” [4] IT동아갤로그로 이동합니다. 11.20 280 0
4543 선박 제조업의 디지털 전환 이끄는 ‘버추얼 트윈’ 기술 IT동아갤로그로 이동합니다. 11.19 91 0
4542 에릭슨엘지 “네트워크도 API로 제공…개발자 참여 독려해야” IT동아갤로그로 이동합니다. 11.19 91 0
4541 [IT애정남] 노트북 SSD의 OEM 파티션, 삭제해도 되나요? IT동아갤로그로 이동합니다. 11.19 95 0
4540 [부산창경 BEF 2024] 그린에너지(주) “산업 현장 악취·유해물질 플라즈마로 해결” IT동아갤로그로 이동합니다. 11.19 95 0
4539 [자동차와 法] 행락철 교통사고 책임과 법적 대처 방안 IT동아갤로그로 이동합니다. 11.19 683 0
4538 아이작 컨셉츠 김태영 대표, "반도체·열유체 공학의 산학협력 교두보 만들겠다" IT동아갤로그로 이동합니다. 11.19 91 0
4537 [시승기] 돋보이는 디자인과 안전 사양 ‘KGM 액티언’ [1] IT동아갤로그로 이동합니다. 11.18 380 0
4536 +불필요한 PC 앱, 지우려면 이렇게! [이럴땐 이렇게!] [1] IT동아갤로그로 이동합니다. 11.18 5117 5
4535 [스케일업] 반프 [3] 정예솔 전략총괄 “반프의 가치, 글로벌 시장에서도 매력적” IT동아갤로그로 이동합니다. 11.18 121 0
4534 [주간투자동향] 숨빗AI, 50억 원 규모 시드 투자 유치 外 IT동아갤로그로 이동합니다. 11.18 112 0
4533 [투자를IT다] 2024년 11월 2주차 IT기업 주요 소식과 주가 흐름 IT동아갤로그로 이동합니다. 11.16 213 0
4532 [스케일업] 보라웨어 [2] 전영복ㆍ이효주 “구성원 복지ㆍ기업 성장이 공존하는 곳” IT동아갤로그로 이동합니다. 11.15 207 0
4531 [생성 AI 길라잡이] 8종의 AI 모델 골라 쓰는 ‘SKT 에이닷’ 웹 버전 IT동아갤로그로 이동합니다. 11.15 194 0
4530 디지포레, “제조산업의 디지털 전환, ‘팩토리얼 프로’로 앞당길 것" IT동아갤로그로 이동합니다. 11.15 188 0
4529 [리뷰] 모니터링 헤드폰의 새로운 기준점 제시, 소니 MDR-M1 [5] IT동아갤로그로 이동합니다. 11.15 6229 1
4528 [2024 고려대] 스페이스점프 “자영업·소상공인 기자재의 모든 것, 소상공간” IT동아갤로그로 이동합니다. 11.15 177 0
4527 퀄컴, 온디바이스 AI·차량 전동화에 초점 맞춘 최신 솔루션 선보여 IT동아갤로그로 이동합니다. 11.15 199 0
4526 [창업도약+경북대] 비빔블 “비커스ㆍ버튜디오로 상상 이상의 가상경험 제공할 것” IT동아갤로그로 이동합니다. 11.15 156 0
4525 [AI와 미래] 기존 저작물은 AI 학습에 어디까지 활용할 수 있을까? IT동아갤로그로 이동합니다. 11.15 1377 0
4524 [월간자동차] 24년 10월, 신차 등록 두 달 연속 증가…싼타페 판매 1위 IT동아갤로그로 이동합니다. 11.15 150 0
4523 [리뷰] 10G 업링크 지원 네트워크 스위치, 넷기어 GS108MX IT동아갤로그로 이동합니다. 11.14 180 0
4522 데이터 주권 강조하는 소버린 AI, 진정한 의미는? [1] IT동아갤로그로 이동합니다. 11.14 723 0
4521 [스케일업] 스쿨버스 [3] 통학버스 전문 플랫폼 개발자 인터뷰 IT동아갤로그로 이동합니다. 11.14 179 0
4520 [UDC 2024] 다양한 산업을 변화시키는 블록체인의 힘 IT동아갤로그로 이동합니다. 11.14 171 0
4519 로봇과 문화예술의 만남, 브이디컴퍼니x장 줄리앙의 종이세상 IT동아갤로그로 이동합니다. 11.14 328 0
4518 [IT애정남] 갤럭시워치를 아이폰과 연결해서 쓸 수 있나요? IT동아갤로그로 이동합니다. 11.13 4664 0
4517 [신차공개] BMW ‘뉴 4시리즈 그란 쿠페’·로터스 ‘에메야’ 공식 출시 [3] IT동아갤로그로 이동합니다. 11.13 4776 1
4516 [스타트업-ing] 오아시스 스튜디오 “OVP·오닉스·디보틀로 콘텐츠 에코시스템 구축” IT동아갤로그로 이동합니다. 11.13 183 0
4515 [생활 속 IT] 취업 서류, 정부24에서 내려받는 법 IT동아갤로그로 이동합니다. 11.12 216 0
4514 기한 지나면 과태료…운전면허 적성검사 및 갱신 방법 살펴보니 IT동아갤로그로 이동합니다. 11.12 2397 3
4513 [창업도약+경북대] 준컴퍼니 “자동차 구매부터 판매까지 아우르는 모빌리티 통합 플랫폼 꿈꾼다” IT동아갤로그로 이동합니다. 11.12 207 0
4512 [스케일업] 모넷코리아 [2] HDC랩스와 협업 통해 AIoT 기반 부동산 관리 플랫폼 고도화 IT동아갤로그로 이동합니다. 11.12 239 0
4511 [2024 고려대] R2C컴퍼니 “데이터 수요·공급자 만족 이끄는 플랫폼” IT동아갤로그로 이동합니다. 11.12 657 0
4510 갤럭시 스마트폰의 위젯 기능, 제대로 쓰려면? IT동아갤로그로 이동합니다. 11.12 264 1
4509 [AWS 인더스트리 위크 2024] 국내 금융/핀테크 기업에 AWS 솔루션은 이렇게 적용됐다 [1] IT동아갤로그로 이동합니다. 11.11 2057 1
4508 '제조 스타트업 대상으로 소싱디렉팅·제품 제작까지'··· 서울과기대의 실질적 지원 들여다보니 IT동아갤로그로 이동합니다. 11.11 228 0
4507 [AWS 인더스트리 위크 2024] AWS가 실현하고 있는 인공지능 기술의 현재 IT동아갤로그로 이동합니다. 11.11 285 0
뉴스 김장훈, 12월 AI 콘서트 '토닥토닥' 개최....신비한 영상체험 '커밍순' 디시트렌드 11.21
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2