You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
잘 만들어진 DL 모델을 NPU에서 잘 사용하기 위해서는 각 레이어를 하드웨어의 구조에 맞춰 나눠주는 과정이 필요합니다.
이러한 기능은 Compiler를 통해 Processor에서 동작하는 Binary를 만드는 과정에 해당되며, 이를 DL Compiler가 수행합니다.
DL Compiler에서 NPU에서 최적의 성능을 얻도록 하는 "DL 모델 최적화" 과정은 탐색에 많은 시간이 소요되는 문제가 존재합니다.
논문에서는 NPU 내부에 DL Compiler의 기능을 수행하는 하드웨어를 포함하여 실행시간을 개선하고자 합니다.
(상용화 관점에서는 어렵지만, 재미있는 주제로 들어주시면 감사하겠습니다.)
Preliminary
AI 가속기에서 연산 장치로 많이 사용되고 있는 Systolic arrary와 관련된 연구를 살펴볼 예정입니다.
각 논문을 읽는 것도 좋지만, Vivienne Sze 교수님 동영상을 보고 오는 것을 권해드립니다.
Power는 실제 RTL 코드를 설계하고 이를 Design Compiler에서 합성해서 얻은 결과에 해당됩니다. Power Consumption은 Chip에 Power가 인가되었을 때 Chip에서 소모되는 전력, Energy는 Power와 어떤 알고리즘을 수행하는데 소모되는 시간을 곱한 Power delay product (PDP)로 계산하였습니다.
Date
Who :
박상수 ([email protected])
What:
Title: Self-Adaptive Reconfigurable Arrays (SARA): Using ML to Assist Scaling GEMM Acceleration
Links: https://arxiv.org/pdf/2101.04799.pdf
Keywords:
NPU, Hardware Accelerator, DL Compiler
Abstract:
잘 만들어진 DL 모델을 NPU에서 잘 사용하기 위해서는 각 레이어를 하드웨어의 구조에 맞춰 나눠주는 과정이 필요합니다.
이러한 기능은 Compiler를 통해 Processor에서 동작하는 Binary를 만드는 과정에 해당되며, 이를 DL Compiler가 수행합니다.
DL Compiler에서 NPU에서 최적의 성능을 얻도록 하는 "DL 모델 최적화" 과정은 탐색에 많은 시간이 소요되는 문제가 존재합니다.
논문에서는 NPU 내부에 DL Compiler의 기능을 수행하는 하드웨어를 포함하여 실행시간을 개선하고자 합니다.
(상용화 관점에서는 어렵지만, 재미있는 주제로 들어주시면 감사하겠습니다.)
Preliminary
AI 가속기에서 연산 장치로 많이 사용되고 있는 Systolic arrary와 관련된 연구를 살펴볼 예정입니다.
각 논문을 읽는 것도 좋지만, Vivienne Sze 교수님 동영상을 보고 오는 것을 권해드립니다.
The text was updated successfully, but these errors were encountered: