엣지 AI기술을 위한 딥러닝 모델의 1bit 양자화
네패스 김정훈
본 세션에서는 Neural Network의 Model Compression 주요 기술 중 하나인 Neural Network Quantization의 Binarized Neural Networks를 소개합니다. MATLAB®의 Deep Learning Toolbox™ Source Code 수정을 통해 직접적으로 Network training 단계에서의 weight와 gradient에 접근하고, 새로운 학습 룰을 가진 Layer를 정의함으로써 Training rule을 직관적으로, 그리고 직접적으로 수정할 수 있는 MATLAB 의 장점에 대해 소개하고, 그 결과물로 논문과 동일하게 MATLAB에서 구현된 Binarized Neural Network Trainer를 소개합니다.
발행: 2020년 7월 14일