디시인사이드 갤러리

갤러리 이슈박스, 최근방문 갤러리

갤러리 본문 영역

최근 해외 AI 와 CoT 프롬프팅에 대한 내 생각

ㅆㅇㅆ(124.216) 2024.10.23 15:39:12
조회 78 추천 2 댓글 8
														


3db4c821abc236a14e81d2b628f1716f725724


얼마전 가트너 사에서 보고서에 따르면 프로그래머 80%가 기술 향상이 필요하다고 함


2027년까지 현존하는 80% 이상이 사실상 AI보다 뒤쳐진다고 내다봤다고 말할 수 있음.


반대로 말하자면 프갤정도되면 대수의 법칙으로따져서 8할이 AI보다 코딩을 못한다 할 수 있음.


근데 나는 오히려 좀 생각을 바꿔서 서비스하는 제품 생산에 주력해서 AI를 적극 활용해서 생산성을 올리자고 방향성을 잡음


그래서 AI 프롬프팅 기법을 찾아보는 중에 최근에 CoT라는게 유행이더라.


26a8d935abc236a14e81d2b628f1726f2cff36

CoT(Chain of Thought)에서 파생됨


https://arxiv.org/abs/2201.11903

Chain-of-Thought Prompting Elicits Reasoning in Large Language Models


이 논문의 효과가 뭐냐
사고 체인-> 복잡한 문제를 잘게 쪼개서 단계로 분해->점진적 솔루션을 찾는다는거
인간 사고 체계에서 따왔다고, 인간 사고를 시뮬레이션함

최근에 CoT 논문은 이 CoT로 얼마나 더 큰 효율을 발생시키는가에 대한 논문이던데

기본적인 대전제는 다음과 같음

1. 첫째, 원칙적으로 CoT(사고사슬)을 통해 모델은 다단계 문제를 중간 단계로 분해할 수 있음. 즉 문제를 쪼갤 수 있음.
즉, 더 많은 추론 단계가 필요한 문제에 추가 계산을 할당할 수 있다고 말할 수 있음.

2. 둘째, 사고 사슬은 모델의 행동에 대한 해석 가능한 창을 제공하여 모델이 특정 답변에 어떻게 도달했는지 표시하고 추론 경로가 어디에서 잘못되었는지 디버깅할 수 있는 기회를 제공.

3. 셋째, 사슬 사슬은 수학적 단어 문제, 상식 추론, 상징적 조작 등의 작업에 사용될 수 있으며, 인간이 언어를 통해 해결할 수 있는 모든 작업에 (적어도 원칙적으로) 적용될 수 있음.

4. 마지막으로, 사고 사슬 시퀀스의 예를 소수 단서의 예에 간단히 포함시킴으로써 충분히 큰 기성 언어 모델(LLM)에서 사고 사슬 추론을 쉽게 유도할 수 있음.

여기서 CoT 즉 사고 사슬의 작동방식은 다음의 3가지를 띔

1.2 CoT 작동 방식

CoT 프롬프트의 핵심 아이디어는 소수의 예시에 중간 추론 단계를 추가하는 것
특히 프롬프트의 각 예시에는 세 부분이 포함되어 있음

1. 입력: 문제 설명

2. 사고 사슬: 문제 해결을 위한 중간 추론 단계

3. 출력: 최종 답변

즉 입력->출력에서
입력->사고 사슬->출력 이라는 중간과정을 추가함

22a8c830e79c28a8699fe8b115ef046bf423aa51

CoT는 실험결과는 놀라웠고, GSM8K 수학 문제에서 이전보다 절대 정확도가 57% 향상됨


실제로 이에 대한 이론에 대한 정리는 있는데 내가 이해를 하지 못해서 가져오지 않겠음. 나는 이해 못한 것을 쓰지 않는 주의기때문에


CoT는 정확히 말하자면


올바른 답을 출력할 확률과 연관되어있는데, 정답 확률이 높은 단어와 연관될 경우 CoT의 성능이 크게 향상됨. 따라서 사전 훈련단계에서 학습된 확률 분포에 큰 영향을 받음.


1. 중간 추론 단계가 있을때, 올바른 답을 출력할 확률이 낮을 경우,모델은 더 높은 답변을 생성하기 위해 자체수정함(다만 여전히 불완전함)(


2. 중간 추론 단계가 있을때, 올바른 답을 출력할 확률이 높을 경우, 설정에서는 중간 추론 단계에 오류가 있어도 모델이 올바른 최종답에 도달할 가능성이 더 높음


3. 중간 추론 단계가 있다고 하더라도, 올바른 답을 출력할 확률이 낮을 경우, 여전히 잘못된 최종답변을 생성할 가능성이 더 높음


즉 CoT는 즉 확률의 영향을 받은 일종의 추론 프로세스임.


그리고 이런 CoT의 이론적 프레임 워크는 결국


1.문제 분해-> CoT를 사용하여 복잡한 문제를 일련의 간단한 하위 문제로 분해


2. 재귀 계산: 추론 단계를 반복적으로 생성한 후, 조건을 지정하여 재귀 계산 프로세스를 구현함.


3. 동적 프로그래밍 시뮬레이션: 즉 CoT를 사용하면 모델이 동적 프로그래밍 알고리즘을 시뮬레이션 하고, 하위문제가 겹치는 복잡한 작업을 효과적으로 처리할 수 있음.


즉 CoT 프레임 워크는


1. 모델이 해야할 설명을 좀 더 강화해서 설명하기


2. 다양한 샘플을 제시하기


3. 동적 추론 경로(문제를 쪼개기)


4. 자체 점검 메커니즘을 요구하기


라고 할 수 있음


결국 질문을 할때,


과정을 쪼개고, 예시 샘플을 주고, 문제를 얼마나 잘게 쪼개서 주느냐에 따라서 답변의 질이 달라진다고 하더라.


그래서 요즘은 코드 생성을 하기전에 Git에서 별점 높은 코드를 주면서 샘플을 주면서 요구 사항을 순서로 정해서주는데 이게 상당히 많은 도움이 되는듯.


내가 느끼는게 이제 프로그래밍 연차가 쌓인다는 것은


즉 좋은 데이터들을 '얼마나' 많이 저장해서 GPT에게 샘플을 먹여서 질좋은 답변을 생성시키느냐가 핵심인거 같음.


나는 이때문에 최근에 해외 유수의 알고리즘들 다 저장해두는 중임.


일단 기본적으로 각 언어마다 유명한 알고리즘은 저장해두고 자신만의 깃에 저장해두는게 주요하다는 생각을 많이함.


이제 시대는 개인의 저장소에 얼마나 질좋은 데이터가 들어있느냐로 결과물이 달라지는 시대가 될테니까.





추천 비추천

2

고정닉 0

0

댓글 영역

전체 댓글 0
등록순정렬 기준선택
본문 보기

하단 갤러리 리스트 영역

왼쪽 컨텐츠 영역

갤러리 리스트 영역

갤러리 리스트
번호 제목 글쓴이 작성일 조회 추천
설문 주위의 유혹에 쉽게 마음이 흔들릴 것 같은 스타는? 운영자 24/10/21 - -
2765316 쿄우노 프비시엔오 오에루. 망국의간웅(58.236) 10.23 20 0
2765315 고한오타베마쇼 망국의간웅(58.236) 10.23 14 0
2765314 23살 고졸 질문... [7] ㅇㅇ(211.250) 10.23 101 1
2765313 다시태어나고 싶어서 엉엉 울었어 ㅠㅠㅠㅜ ㅇㅇ(118.235) 10.23 25 0
2765312 vite 컨테이너 올려보신 분? 프갤러(121.135) 10.23 24 0
2765311 최고의 섹스를 하고 싶다 [4] 아스카영원히사랑해갤로그로 이동합니다. 10.23 81 0
2765310 한국전자전 봤는데 발명도둑잡기갤로그로 이동합니다. 10.23 23 0
2765309 전직장 퇴사사유 국룰은 이거아님?? [3] 프갤러(59.18) 10.23 94 0
2765308 나님 최소치가 프갤수준으로는 존나 높나보네 ♥ひさしみぶり냥덩♥갤로그로 이동합니다. 10.23 30 0
2765307 누가 나대신 구현좀 대신 해줬음 좋겠네 ㅆㅇㅆ(118.235) 10.23 23 0
2765306 vscode claude dev가 파일 생성도함? 프갤러(119.200) 10.23 18 0
2765304 이런게 포트폴리오가 됨니까 [1] 뒷통수한방(1.213) 10.23 78 0
2765303 ㅈ소 퇴사할 때 인수인계 내던지고 튀었는데 [1] 4ㅈㅇ(106.246) 10.23 60 0
2765302 프비시엔노 니지칸메오 오에마스. 망국의간웅(58.236) 10.23 12 0
2765301 금연 해야하는데 왤캐 어렵냐.. 어디하나 ㅂㅅ되야 끊을래나 [2] ㅇㅇ(223.62) 10.23 52 0
2765300 안녕하세요. 질문 받습니다 [1] 미쿠쟝마지스키갤로그로 이동합니다. 10.23 31 0
2765299 윈도우 서버 질문점 ㅈㄷ(106.246) 10.23 19 0
2765298 게임사 저격 개발자 포폴 같은거 있음? [1] 프갤러(223.39) 10.23 44 0
2765297 진짜 프갤 수준 왤케 좃밥됫냐 정처기 [1] ♥ひさしみぶり냥덩♥갤로그로 이동합니다. 10.23 48 0
2765296 소레데와 프비시엔오 사이카이시마스. 망국의간웅(58.236) 10.23 17 0
2765295 퇴사 하려고 인수 인계 중인데 어이 터지네 [7] ㄱㅌ(106.246) 10.23 111 2
2765294 혹시 IPFS 관해서 잘 아는 게이있? [4] 프갤러(59.13) 10.23 45 1
2765293 쿄우와 고진테키나 다이쇼오사오 이치단라쿠시마스. 망국의간웅(58.236) 10.23 14 0
2765292 더 나은 인생을 위한 노력이 정말 힘든것같다. ㅇㅇ(123.213) 10.23 53 0
2765291 근데 쇼요롤<<얘 닉네임 뜻이 뭐임? [5] ㅆㅇㅆ(124.216) 10.23 61 0
2765290 개발자 연봉이 낮은 이유 ㅇㅇ [2] 프갤러(14.34) 10.23 107 0
2765289 git 다시 만들어야하는데 시간이 없다. [1] ㅆㅇㅆ(124.216) 10.23 39 0
2765288 씽크패드 팔고 m4 맥미니 사는거 어떻게 생각해? [1] 프갤러(14.39) 10.23 34 0
최근 해외 AI 와 CoT 프롬프팅에 대한 내 생각 [8] ㅆㅇㅆ(124.216) 10.23 78 2
2765284 ㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋㅋ 망국의간웅(58.236) 10.23 32 0
2765283 왕복 두시간 거리 출퇴근하기 [5] cvs.갤로그로 이동합니다. 10.23 69 0
2765282 프로외노자야 프갤에 글쓸시간에 개인 블로그에 글올려라 뒷통수한방(1.213) 10.23 39 1
2765281 챗지피티보다 20% 저렴하게 gpt, claude, gemini를 [3] 프갤러(115.139) 10.23 65 0
2765280 너네 마리오파티 처럼 가벼운 미니게임들 할수있는 웹사이트 만들수있음? [4] 프갤러(14.39) 10.23 44 0
2765279 보통 윈도우 환경에 서버는 리눅스 아니농 [1] 프갤러(14.37) 10.23 35 0
2765278 금연 시도중인데 안피면 피고싶고 피면 후회하고 ㅈ같은 순환고리다... ㅇㅇ(123.213) 10.23 26 0
2765277 회사 전체에 내 하드코딩 박제된 썰 [4] 창업게이(106.101) 10.23 110 0
2765276 CoT프롬프팅 논문 서울대 애들이 리뷰한거 봤냐 [3] ㅆㅇㅆ(124.216) 10.23 68 0
2765275 본인 에어팟 끼고 2시간째 열일 중 [6] 아스카영원히사랑해갤로그로 이동합니다. 10.23 62 0
2765274 농담아니고 알고리즘 같은거 일일이 템플릿 다 외우는거보다 ㅆㅇㅆ(124.216) 10.23 46 1
2765273 혼지쯔노 고진테키나 다이쇼지노 프로셋신구오 카이시다. 망국의간웅(58.236) 10.23 10 0
2765272 초보개발자vs 고수개발자 쉽게 구별하는방법ㅋㅋㅋㅋㅋㅋㅋㅋㅋ [1] 프갤러(175.215) 10.23 83 0
2765271 윤석열씨 사진 매우 웃기네 [2] 헬마스터갤로그로 이동합니다. 10.23 66 0
2765270 전제를 참으로 만드는 변수값을 찾는 프로그램 [2] NEMO갤로그로 이동합니다. 10.23 47 0
2765269 프붕이들아 머리통을 굴리려몀 커피가 필요해 [5] 40대프린이(118.235) 10.23 53 0
2765268 고추모찌덴뿌라 이타메를 다 먹었어요. 망국의간웅(58.236) 10.23 16 0
2765267 공짜 동글이갤로그로 이동합니다. 10.23 29 0
2765266 보통 회사가면 OS 뭐 사용해? [8] 프갤러(14.39) 10.23 86 0
2765265 잠실세뇌역 [3] 발명도둑잡기갤로그로 이동합니다. 10.23 50 0
2765264 그럼 간식으로 커피와 고추모찌덴뿌라 이타메모노를 먹겠어요. 망국의간웅(58.236) 10.23 16 0
갤러리 내부 검색
제목+내용게시물 정렬 옵션

오른쪽 컨텐츠 영역

실시간 베스트

1/8

뉴스

디시미디어

디시이슈

1/2