갤러리 이슈박스, 최근방문 갤러리
연관 갤러리
2020 도쿄 올림픽 갤러리 타 갤러리(0)
이 갤러리가 연관 갤러리로 추가한 갤러리
추가한 갤러리가 없습니다.
0/0
타 갤러리 2020 도쿄 올림픽 갤러리(0)
이 갤러리를 연관 갤러리로 추가한 갤러리
0/0
개념글 리스트
1/3
- 싱글벙글 미국 실제 형량 Whi-Rin
- [제보완] 백종원과 예산상설시장, 그리고 상표권 출원 감사원게이
- 싱글벙글 특이점이 와버린 사이비 ㅇㅇ
- "많이 사주세요"…1030 아이폰 사랑에 '슬림폰' 승부수 띄운 삼성 ㅇㅇ
- 싱글벙글 주호민 아들 학대 혐의 무죄 !! 표절왕아이유
- 민주당 유세차 타이어 훼손에 현수막 훼손까지ㅋㅋㅋㅋㄹㅈㄷ ㅇㅇ
- 옥탑방에 사는 한일커플.jpg ㅇㅇ
- 이재명 "한·미·일 동맹 중요...대구 유세 엄마부대
- 고발완)지방자치단체 행정의 허위 근거 판단 및 기업의 사실 오도 농약통백셰프
- 판) 엄마가 바람핍니다 도와주세요.... ㅇㅇ
- "놀랍게도 전부 립싱크"…한 걸그룹 쇼케이스에 분노한 평론가들 엳붕이
- 민주당, 정치자금법 위반 혐의로 김문수 고발 ㄷㄷㄷ 종각역비둘기
- 37살에 승무원 합격한 유튜버 썰 ㅇㅇ
- 안드로이드(박사) 만화가좋아♡시
- 싱글벙글 우주 망원경은 타임머신이다 수인갤러리
(사카나AI) 연속 사고 기계(CTM) 소개
연속 사고 기계(Continuous Thought Machines) 소개
2025년 5월 12일
Sakana AI에서는 인지의 핵심에 있는 중요한 특징, 바로 시간에 대해 재고하기로 했습니다. 연속 사고 기계는 뉴런 역동성 간의 동기화를 사용하여 작업을 해결하는 새로운 종류의 인공 신경망입니다.
요약
Sakana AI는 생물학적 신경망에서 영감을 받아 뉴런 활동의 동기화를 핵심 추론 메커니즘으로 독특하게 활용하는 AI 모델인 연속 사고 기계(CTM)를 자랑스럽게 발표합니다. 기존의 인공 신경망과 달리, CTM은 뉴런 수준에서 타이밍 정보를 사용하여 더 복잡한 신경 행동과 의사결정 프로세스를 가능하게 합니다. 이러한 혁신으로 모델이 문제를 단계별로 "사고"할 수 있으며, 추론 과정을 해석 가능하고 인간과 유사하게 만듭니다. 우리의 연구는 다양한 작업에서 문제 해결 능력과 효율성이 모두 향상됨을 보여줍니다. CTM은 인공 신경망과 생물학적 신경망 간의 간극을 메우는 의미 있는 진전을 나타내며, AI 능력의 새로운 지평을 열 수 있습니다.
자세한 내용은 대화형 보고서, 기술 논문 및 공개 코드를 참조하시기 바랍니다.
CTM이 미로를 해결하고 실제 사진에 대해 사고하는 시각화 (사진 제공: Alon Cassidy). 놀랍게도, 명시적으로 설계되지 않았음에도 불구하고, 미로에서 학습한 해결책은 매우 해석 가능하고 인간과 유사하여 해결책을 '사고'하면서 미로를 통과하는 경로를 추적하는 것을 볼 수 있습니다. 실제 이미지의 경우, 명시적인 인센티브가 없음에도 직관적인 방식으로 주변을 둘러봅니다.
소개
우리의 뇌는 가장 정교한 현대 AI조차도 어려워하는 영역에서 종종 훨씬 더 효율적으로 뛰어난 성능을 발휘합니다. Sakana AI에서는 AI의 발전을 위해 자연에서 영감을 찾곤 합니다. 예를 들어 진화를 사용한 모델 병합, 더 효율적인 언어 모델용 메모리 진화, 또는 인공 생명의 공간 탐색 등이 있습니다. 인공 신경망은 최근 몇 년간 AI가 놀라운 성과를 달성할 수 있게 했지만, 여전히 생물학적 대응물의 단순화된 표현에 머물러 있습니다. 생물학적 뇌에서 발견되는 특징들을 통합함으로써 AI의 새로운 수준의 능력과 효율성을 달성할 수 있을까요?
우리는 인지의 핵심에 있는 중요한 특징인 시간에 대해 재고하기로 했습니다. 2012년 딥러닝의 등장으로 AI 능력이 크게 도약했음에도 불구하고, AI 모델에 사용되는 인공 뉴런의 기본 모델은 1980년대 이후 크게 변하지 않았습니다. 연구자들은 여전히 뉴런이 얼마나 활성화되는지를 나타내는 단일 출력을 주로 사용하지만, 다른 뉴런과 비교하여 뉴런이 언제 활성화되는지의 정확한 타이밍은 무시합니다. 그러나 강력한 증거는 이러한 타이밍 정보가 생물학적 뇌에서 매우 중요하며, 예를 들어 스파이크 타이밍 의존 가소성에서 생물학적 뇌 기능의 기초가 됨을 시사합니다.
우리가 새로운 모델에서 이 정보를 표현하기 위해 사용한 방법은 단순히 뉴런이 자신의 행동 이력에 접근할 수 있게 하고, 단지 현재 상태만 아는 것이 아니라 이 정보를 사용하여 다음 출력을 계산하는 방법을 학습하는 것입니다. 이를 통해 과거의 다른 시점의 정보를 기반으로 행동을 변경할 수 있습니다. 또한, 새로운 모델의 주요 행동은 이러한 뉴런 간의 동기화에 기반하며, 이는 작업을 해결하기 위해 함께 조정하기 위해 이 타이밍 정보를 활용하는 방법을 학습해야 함을 의미합니다. 우리는 이것이 현대 모델에서 관찰되는 것보다 훨씬 더 풍부한 역동성의 공간과 다른 작업 해결 행동을 만들어낸다고 주장합니다.
이 타이밍 정보를 추가한 후, 우리는 여러 작업에서 광범위한 비자명한 행동을 관찰했습니다. 아래에 몇 가지 결과를 강조합니다. 우리는 매우 해석 가능한 행동을 봅니다: 이미지를 관찰할 때, CTM은 장면 주위를 주의 깊게 시선을 이동시키며, 존재하는 가장 두드러진 특징에 집중하기로 선택하고 일부 작업에서 성능이 향상됩니다. 우리는 특히 뉴런 활동의 역동성에서 보여지는 행동의 다양성에 놀랐습니다.
CTM에서 관찰된 뉴런 역동성 샘플로, 다른 입력에 따라 어떻게 변화하는지 보여줍니다. CTM은 명확하게 매우 다양한 뉴런 행동 세트를 학습합니다. 각 뉴런(임의의 색상)이 다른 뉴런과 함께 활성화되는 방식을 우리는 동기화라고 부릅니다. 우리는 이를 측정하고 CTM의 표현으로 사용합니다.
새로운 모델의 행동은 새로운 종류의 표현에 기반합니다: 시간에 따른 뉴런 간의 동기화입니다. 우리는 이것이 엄격한 에뮬레이션은 아니지만 생물학적 뇌를 훨씬 더 연상시킨다고 믿습니다. 우리는 결과적인 AI 모델을 연속 사고 기계(CTM)라고 부르며, 이는 이 새로운 시간 차원, 풍부한 뉴런 역동성 및 동기화 정보를 사용하여 작업에 대해 '사고'하고 답을 제공하기 전에 계획을 세울 수 있는 모델입니다. 우리는 이름에 '연속'이라는 용어를 사용하는데, 이는 CTM이 추론할 때 전적으로 내부 '사고 차원'에서 작동하기 때문입니다. 소비하는 데이터에 대해 비동기적입니다: 정적 데이터(예: 이미지) 또는 순차적 데이터에 대해 동일한 방식으로 추론할 수 있습니다. 우리는 이 새로운 모델을 광범위한 작업에서 테스트했으며 다양한 문제를 해결할 수 있고 종종 매우 해석 가능한 방식으로 해결할 수 있음을 발견했습니다.
우리가 관찰한 뉴런 역동성은 훨씬 덜 다양한 행동을 보이는 더 전통적인 인공 신경망과 달리 실제 뇌에서 측정된 역동성을 다소 더 연상시킵니다. 아래에서 클래식 AI 모델인 LSTM과의 비교를 참조하세요. CTM은 다른 주파수와 진폭으로 진동하는 뉴런을 보여줍니다. 때로는 단일 뉴런에서 다른 주파수를 볼 수 있고 다른 뉴런은 작업을 해결할 때만 활동을 보입니다. 이러한 모든 행동은 완전히 창발적이며, 모델에 설계되지 않았고, 타이밍 정보를 추가하고 다른 작업을 해결하는 방법을 학습하는 부작용으로 나타난다는 점을 강조할 가치가 있습니다.
CTM의 신경 역동성과 현재 인기 있는 인공 신경망에서 관찰된 역동성의 비교.
새로운 CTM 모델 아키텍처 테스트
새로운 시간 차원이 있기 때문에 CTM의 주요 장점 중 하나는 시간이 지남에 따라 문제를 해결하는 방법을 관찰하고 시각화할 수 있다는 것입니다. 신경망을 통한 단일 패스로 이미지를 분류할 수 있는 기존 AI 시스템과 달리, CTM은 작업을 해결하는 방법에 대해 '사고'하기 위해 여러 단계를 수행할 수 있습니다. CTM의 능력과 해석 가능성을 보여주기 위해 아래에서 두 가지 작업을 소개합니다: 미로 해결과 사진 속 객체 분류. 더 많은 작업에 대한 데모는 대화형 보고서와 학술 논문에서 확인할 수 있습니다.
미로 해결
이 작업에서 CTM은 2D 탑다운 미로를 제시받고 이를 해결하는 데 필요한 단계를 출력하도록 요청받습니다. 이 형식은 모델이 단순히 경로의 시각적 표현을 출력하는 것이 아니라 미로 구조에 대한 이해를 구축하고 해결책을 계획해야 하므로 특히 어렵습니다. CTM의 내부 연속 '사고 단계'를 통해 계획을 개발할 수 있으며, 각 사고 단계 동안 미로의 어느 부분에 집중하는지 시각화할 수 있습니다. 놀랍게도, CTM은 미로를 해결하는 매우 인간적인 접근 방식을 학습합니다—실제로 주의 패턴에서 미로를 통과하는 경로를 따라가는 것을 볼 수 있습니다.
CTM은 관찰(주의 사용)하고 단계(예: 왼쪽으로 이동, 오른쪽으로 이동 등)를 직접 생성하여 미로를 해결합니다. 이는 직접적으로 신경 역동성의 동기화(즉, 동기화 자체에서 선형 프로브 사용)를 사용하여 수행됩니다. 주의 패턴이 미로를 통과하는 경로를 따라가는 것에 주목하세요: 매우 해석 가능한 접근 방식입니다. 대화형 보고서에서 미로 해결 시각화의 대화형 버전을 탐색해 보세요.
이 행동에서 특히 인상적인 점은 모델의 아키텍처에서 자연스럽게 나타난다는 것입니다. 우리는 CTM이 미로를 통과하는 경로를 추적하도록 명시적으로 설계하지 않았습니다—학습을 통해 이 접근 방식을 스스로 개발합니다. 또한, 더 많은 사고 단계가 허용될 때 CTM이 훈련된 지점을 넘어서도 계속해서 경로를 따라가며, 실제로 이 문제에 대한 일반적인 해결책을 학습했음을 보여준다는 것을 발견했습니다.
이미지 인식
ImageNet은 2012년 딥러닝 혁명을 촉발시킨 클래식 이미지 분류 벤치마크입니다. 기존 이미지 인식 시스템은 단일 단계로 분류 결정을 내리지만, CTM은 결정을 내리기 전에 이미지의 다른 부분을 검토하는 여러 단계를 수행합니다. 이러한 단계별 접근 방식은 AI의 행동을 더 해석 가능하게 만들 뿐만 아니라 정확도도 향상시킵니다: 더 오래 "사고"할수록 답변이 더 정확해집니다. 또한 이를 통해 CTM이 더 간단한 이미지에서는 더 적은 시간을 사고하도록 결정할 수 있어 에너지를 절약할 수 있음을 발견했습니다. 예를 들어, 고릴라를 식별할 때 CTM의 주의는 눈에서 코, 입으로 이동하며 인간의 시각적 주의와 현저하게 유사한 패턴을 보입니다.
여기서 우리는 이미지를 분류할 때 CTM의 행동 예를 봅니다 (사진 제공: Alon Cassidy). 히트맵은 이미지를 처리할 때 CTM이 주의를 집중하는 위치를 보여주며, 화살표는 주의의 중심을 나타냅니다. 대화형 보고서에서 더 많은 예시를 볼 수 있습니다.
이러한 주의 패턴은 모델의 추론 과정에 대한 창을 제공하여 분류에 가장 관련성이 있다고 판단하는 특징을 보여줍니다. 이러한 해석 가능성은 모델의 결정을 이해하는 데 가치가 있을 뿐만 아니라 잠재적으로 편향이나 실패 모드를 식별하고 해결하는 데도 유용합니다.
결론
현대 AI가 '인공 신경망'으로서 뇌에 기반을 두고 있음에도 불구하고, AI 연구와 신경과학 간의 겹침은 오늘날에도 놀랍도록 얇습니다. AI 연구자들은 단순성, 효율적인 훈련 및 AI 발전을 이끄는 지속적인 성공으로 인해 80년대에 개발된 매우 단순한 모델을 고수하기로 선택합니다. 반면 신경과학은 지능의 우수한 모델을 만들려고 시도하기보다는 주로 뇌를 이해하는 목적으로 뇌의 훨씬 더 정확한 모델을 만들 것입니다(물론 하나가 다른 하나로 이어질 수 있지만). 이러한 신경과학 모델은 복잡성이 추가되었음에도 불구하고 일반적으로 여전히 현재의 최첨단 AI 모델보다 성능이 떨어지므로 AI 응용 분야를 위해 더 조사할 만큼 특히 매력적이지 않을 수 있습니다.
그럼에도 불구하고, 현대 AI를 어떤 측면에서 뇌의 작동 방식에 더 가깝게 만들지 않는 것은 놓친 기회라고 믿으며, 이런 방식으로 훨씬 더 능력 있고 효율적인 모델을 찾을 수 있을 것입니다. 2012년 능력의 대규모 도약, 이른바 "딥러닝 혁명"은 뇌에서 영감을 받은 모델인 신경망 때문에 발생했습니다. 이러한 진전을 계속하기 위해 계속해서 뇌에서 영감을 받아야 하지 않을까요? CTM은 여전히 중요한 문제를 해결하기 위한 실용적인 AI 모델이면서도 뇌와 더 유사한 행동의 초기 힌트를 보여주는 방식으로 이 두 분야 간의 격차를 좁히려는 우리의 첫 번째 시도입니다.
우리는 이러한 자연에서 영감을 받은 방향으로 모델을 계속 발전시키고 어떤 새로운 능력이 나타날 수 있는지 탐색하게 되어 매우 기쁩니다. 다른 작업에서 CTM의 행동에 대한 더 자세한 예는 대화형 보고서를 방문하시기 바랍니다. CTM의 아키텍처 및 구현에 대한 전체 세부 사항은 기술 논문 및 코드에서 찾을 수 있습니다.
우리가 앞으로 나아가면서, AI 및 신경과학 커뮤니티가 생물학과 계산의 이 유망한 교차점을 탐색하는 데 함께 참여하기를 초대합니다. 함께 인공 신경망의 실용적인 이점을 유지하면서 생물학적 지능의 놀라운 능력을 더 잘 포착하는 AI 시스템을 개발할 수 있습니다.
Sakana AI
함께하는 것에 관심이 있으신가요?
자세한 내용은 채용 기회를 참조하시기 바랍니다.
© Sakana AI 株式会社
원본 출처: https://sakana.ai/ctm/
번역: 특이점이온다 갤러리의 초존도초
작성자 : 초존도초고정닉
너무 방대해져버린 마블, 드라마 속 지나간 인물들 이야기
1. 어벤저스 1에서 치타우리의 침공을 저지하기 위해 뉴욕에 핵을 떨구라던 세계안전보장이사회의 아재(기디언 맬릭)는 사실 하이드라였음*MCU 드라마 에이전트 오브 쉴드 시즌 3에서 하이드라의 리더 중 한명이었다는 게 드러남2. 마리아 힐은 죽었음*MCU 드라마 시크릿 인베이전에서 사망3. 시빌 워 당시 캡틴 아메리카를 도와줬던 샤론 카터는 흑화하여 빌런이 됨(캡틴 아메리카의 연인인 페기 카터가 샤론 카터의 고모할머니)*MCU 드라마 팔콘과 윈터솔져에 등장하는 빌런들을 조종하는 숨겨진 흑막4. 닉 퓨리는 사실 유부남임*MCU 드라마 시크릿 인베이전에서 드러나는 사실5. 아이언맨 1, 2에 등장했고 아이언맨1 마지막 장면에서 토니의 정체를 추궁한 이 기자는 소코비아 협정 찬성파였음*WHiH 뉴스프런트라는 마블 바이럴 유튜브 채널에서 소코비아 협정 찬성파로 나옴6. 로키는 아버지 오딘조차도 아득하게 뛰어넘을 전지전능한 신이 됐음(어벤져스 - 엔드게임에서 아이언맨, 캡틴 아메리카, 앤트맨이 시간여행을 했던 2012년 뉴욕에서 태서랙트를 가지고 탈출하는 그 로키임)*태서랙트를 가지고 탈출한 로키가 우여곡절 끝에 시간선의 지배자가 되는 게 MCU 드라마 로키의 줄거리7. 비전은 죽었다가 살아났다가 두명이 됐다가 다시 오른쪽 화이트 비전만 남음*MCU 드라마 완다비전에서 나옴8. 핑거 스냅으로 영구장애를 입었던 헐크의 오른쪽 팔은 완치되었음그리고 헐크는 대략 10살 정도의 아들이 있음*MCU 드라마 쉬헐크에서 나옴9. 호크아이는 귀가 많이 안좋아져서 보청기를 끼게 됨*MCU 드라마 호크아이에서 나옴10. 그리고 현재 지구인들중에는 타노스 지지자들이 있음*역시 MCU 드라마 호크아이에서 나옴11. 킹핀(빌런)이 뉴욕 시장이 되어 비상계엄을 선포함*MCU 드라마 데어데블 : 본 어게인 시즌 1에 나오는 내용+) 추가 정보시크릿 인베이전에서는 마리아 힐은 닉퓨리인척 가장한 스크럴한테 총 맞고 죽었음샤론이 흑화한 이유는 시빌워 이후 도망자 신세가 됐지만 아무도 도와주지 않아서임 팔윈에서 샘과 버키를 도운 대가로 다시 미국에 돌아가서 명예 회복까지 받았지만 쿠키에서 여전히 파워브로커 일을 하고 있는걸로 나옴 참고로 샤론이 파워브로커인건 샘 버키 지모 다 모름 화이트비전은 소드라는 정부 기관이 비전 시체를 다시 조합해서 만든건데 헥스 안에 있던 비전과 대화 후 깨달음을 얻고 어디론가 사라짐 이 화이트 비전이 주연으로 나오는 드라마 비전 퀘스트가 나올 예정배너가 누구랑 아들을 낳았는지는 안밝혀짐- 의외의외 옛날에 사겼었던 마블 출연배우.jpg 캡아 시리즈에 샤론 카터로 나온 에밀리 반캠프 가오갤 시리즈에 스타 로드로 나온 크리스 프랫 놀랍게도 20여년전에 실제로 사겼었던 적있음ㅋㅋㅋ 같이 드라마 찍으면서 눈맞았는데 여기서 문제는 에밀리 반캠프가 이 드라마찍을 당시에 15~17살이였고 크리스 프랫은 20~23살이였다는 점ㅋㅋㅋ 요새였으면 미성년자 그루밍 어쩌구로 욕먹을테지만 당시에 둘다 유명배우가 아니라 유야무야 넘어감 ㅋㅋ 아마 이거때문에 샤론 카터 비중 확 줄지않았나 싶기도 함
작성자 : ㅇㅇ고정닉
차단하기
설정을 통해 게시물을 걸러서 볼 수 있습니다.
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.