갤러리 이슈박스, 최근방문 갤러리
개념글 리스트
1/3
- 싱글벙글 다음주 목요일에 출시예정인 고티 후보게임 언성을높이지마
- 꺼억꺼억 트위터 페미렉카 길티아카 근황 ㅇㅇ
- 추워도 얇고 예쁘게 입는 미미가 현역 아이돌임을 실감하는 유재석 감돌
- 오늘자 위구르족 40명 중국에 추방해버린 태국 ㅇㅇ
- 싱글벙글 그 시절 LG 스마트폰의 재미있었던 기능 머쉬룸와퍼
gpt-4.5 종합적 요약
grok3한테 GPQA, AIME 벤치 10~30% 격차정도로 따임. (심지어 AIME 벤치는 grok3 mini한테 밀리는 모습) 에이전트 코딩 벤치도 sonnet 3.7한테 따이고, 몇달전에 출시된 sonnet 3.6이라고 놀림받는 sonnet 3.5(new) 랑 비비는 모습arc-agi 벤치 또한 sonnet 3.7과 점수는 거의 동일한데 비해 cost per task(가격 대비) 측면에서 압도적으로 뒤떨어짐 가격은.....10~30배 이상 상승 억까없이 담백하게 팩트만 말하자면 1. 기존의 모델 크기(파라미터 수, 층 쌓기)와 컴퓨팅 파워만을 늘리는 스케일 법칙은 더 이상 유효하지 않을 가능성이 굉장히 높다. 2. openai는 더 이상 "베이스모델" 에서의 성능 이점을 잡고 있다고 보기 힘들다. 물론 여기서 말하는 베이스모델은 test time compute 추론모델을 제외한 것이며, 추론모델은 아직까지 지표상으로는 o3가 가장 높지만, 이 또한 deepseek r2, grok3 big brain, gemini 2 pro thinking 등 타사 기업의 모델에 추월당할 가능성이 굉장히 높다고 생각한다. openai는 더욱 분발해야 함. - dc official App- 그동안의 GPT-4.5(오리온) 찌라시 떡밥 모음- 트위터에서 좋아요 7k받은 GPT-4.5 짤....jpg
작성자 : MoonS고정닉
댓글 영역
획득법
① NFT 발행
작성한 게시물을 NFT로 발행하면 일주일 동안 사용할 수 있습니다. (최초 1회)
② NFT 구매
다른 이용자의 NFT를 구매하면 한 달 동안 사용할 수 있습니다. (구매 시마다 갱신)
사용법
디시콘에서지갑연결시 바로 사용 가능합니다.