양자화로 LLM 모델의 경량화 방법 - Quantization #1

양자화로 LLM 모델의 경량화 방법 – Quantization #1

이번에는 양자화(Quantization) 기술에 대해 정리해 보겠습니다. 오픈 소스로 공개되는 인공지능 언어 모델이 점점 더 많이 등장하고 있지만, 이러한 모델들은 상당히 고사양일 수록 그 모델 사이즈도 상당히 거대한 경우가 많습니다. 이러한 …