최근 AI 기술이 빠르게 발전하며 딥러닝 모델의 규모와 성능이 폭발적으로 증가하고 있습니다. 그러나 모델이 커질수록 메모리 사용량, 추론 시간, 에너지 소모가 급격히 증가하기 때문에, 효율적인 경량화 기법과 추론 최적화에 대한 수요도 높아지고 있습니다.
가지치기(Pruning), 양자화(Quantization), 지식 증류(Knowledge Distillation), 네트워크 구조 검색(NAS) 등을 통해 모델을 가볍게 만들고, 하드웨어 제약이 있는 환경에서도 충분한 성능을 낼 수 있게 하는 기술은 앞으로 더욱 중요해질 것입니다.
- Pruning: 모델 파라미터를 부분적으로 제거해 모델 크기를 줄이면서 성능은 최대한 유지하는 기법
- Quantization: 파라미터를 낮은 정밀도로 표현해 계산량과 메모리 사용량을 절감하는 기법
- Knowledge Distillation: 큰 모델의 지식을 작은 모델에 전이하여 경량화하면서도 높은 성능을 유지하는 기법
- Neural Architecture Search: 다양한 아키텍처를 자동으로 탐색해 최적의 모델 구조를 찾는 기법
본 스터디에서는 이론적 지식뿐만 아니라, 실제 모델을 경량화하고 추론 효율을 개선하는 일련의 실습 프로젝트를 통해 실전 감각을 키우려고 합니다.
- 기업들의 효율적인 모델 서빙을 통해 클라우드 비용 절감과 엣지 디바이스 적용 필요성 증가
- 대용량 데이터를 다루는 스타트업부터 대기업까지, AI 응용 분야 전반에서 모델 최적화 역량 요구 증가
- LLM(대형 언어 모델), 컴퓨터 비전, 음성 인식 등 적용 범위가 넓고 활용 가치가 높음
- AI 연구원, ML 엔지니어, Mobile/Edge device Developer, MLOps 등 다양한 직무에 적용할 수 있는 스킬셋을 갖출 수 있습니다.
- 인프라 비용 최적화, on-device AI, IoT 솔루션 개발 등과 연계되어 국내외 주요 기업에 진출 가능성을 높일 수 있습니다.
- 직접 경량화 프로젝트를 수행하면서, 현업에 필요한 실무 역량을 쌓을 수 있습니다.
- 이론 학습: Pruning, Quantization, Knowledge Distillation, Network Architecture Search 등의 핵심 개념과 기법 학습
- 실전 프로젝트 수행: 실제 모델을 경량화하고 추론 최적화를 적용화해 경량화 전후 성능을 비교하는 프로젝트 수행 예정
- 개인 또는 팀 단위로 프로젝트 제안 및 진행
날짜 | 내용 | Link |
---|---|---|
2025/3/4 | OT | |
2025/3/11 | Basics of Deep Learning | 미정 |
2025/3/18 | Pruning and Sparsity (Part I) | 미정 |
2025/3/25 | ⭐ Magical Week 휴일 ⭐ | 미정 |
2025/4/1 | Pruning and Sparsity (Part II) | 미정 |
2025/4/8 | Quantization (Part I) | 미정 |
2025/4/15 | Quantization (Part II) | 미정 |
2025/4/22 | Neural Architecture Search (Part I) | 미정 |
2025/4/29 | ⭐ Magical Week 휴일 ⭐ | 미정 |
2025/5/6 | Neural Architecture Search (Part II) | 미정 |
2025/5/13 | Knowledge Distillation | 미정 |
2025/5/20 | MCUNet: TinyML on Microcontrollers | 미정 |
2025/5/27 | TinyEngine and Parallel Processing | 미정 |
매주 일정:
- 스터디 전, 할당된 강의를 사전에 학습 (영어 자막 강의 + PPT 등)
- 스터디 시간에 강의 내용 토의 및 질의응답
- 개인 혹은 팀별 프로젝트 진행 상황 공유 및 피드백
- 3/2에 러너 발표 예정이므로, 해당 날짜에 이메일(스팸 게시판 포함)과 Discord를 꼭 확인해 카톡방에 입장해, 3/4의 첫 모임에 지장이 가지 않도록 해야 함
- 온라인: 매주 화요일 오후 9시, Discord
- 일부 주간은 오프라인(강남) 모임 예정, 화요일 저녁
- 첫 모임(3/4)은 오프라인 진행, 오후 7시 예정
- 3개월 동안 꾸준히 참여할 수 있는 의지
- 주 4시간 정도의 학습 및 실습 시간 확보해야 함
- 딥러닝 기본 이론 지식 (CNN, Transformer 등) 보유, PyTorch 기초 사용 가능
- 영어 자막 강의를 수강하고, 영어 PPT를 이해할 수 있어야 함
- 이번에 다룰 4개의 경량화 기술 중 가장 관심있는 기술
Pseudo-Lab is a non-profit organization focused on advancing machine learning and AI technologies. Our core values of Sharing, Motivation, and Collaborative Joy drive us to create impactful open-source projects. With over 5k+ researchers, we are committed to advancing machine learning and AI technologies.