갤러리 이슈박스, 최근방문 갤러리
개념글 리스트
1/3
- 훌쩍훌쩍 취업이 안 된다는 디씨인 묘냥이
- 한국과 일본의 OECD 평균 임금(+반박) ㅇㅇ
- "학생이 때렸다" 신고 두배 늘어…선생님 얼굴로 딥페이크까지 ㅇㅇ
- 싱글벙글 ??? : 그게 뭔데 씹덕아 ㅋㅋ 조미김
- 선수 뒤에 숨어버린 이정효 ㅋㅋㅋㅋㅋgisa ㅇㅇ
'돈 내면 성능평가 1위?'…'벤치마크 무용론'에 자금논란까지
AI 성능 평가의 허와 실• 오픈AI, 메타, xAI 등 빅테크 기업들이 자사 AI 모델의 벤치마크 점수를 부풀리기 위해 맞춤형 사전 훈련이나 특수 테스트 버전을 사용하는 등의 의혹이 제기되고 있다.• 메타의 라마4, 머스크의 그록3, 오픈AI의 GPT-3 등이 벤치마크 조건에 맞춰 훈련된 모델을 사용하여 실제 성능보다 높은 점수를 기록한 사례가 드러났다.• 스탠퍼드대 HAI 연구소는 벤치마크 발표 사례 150개 이상을 검토한 결과 데이터 조건 통제 및 재현성 문제를 지적하며 벤치마크의 신뢰성에 의문을 제기했다.• 벤치마크 기관에 대한 빅테크 기업들의 자금 지원으로 인해 평가 결과에 대한 공정성 논란이 일고 있으며, 현재 AI 성능 평가 방식은 마케팅 도구에 가깝다는 비판이 제기되고 있다.https://n.news.naver.com/mnews/article/421/0008236494
작성자 : ㅇㅇ고정닉