이재, 컨볼루션 신경망(CNN) 알고리듬은 인공지능 분야에서 상당한 이점을 가지고 있는 것으로 입증되었습니다. 그러나 임베디드 플랫폼의 많은 실용적인 애플리케이션은 대기 시간 및 전력 소비 요구사항을 고려해야 합니다. 이 문제를 해결하고 병렬 컴퓨팅에서 FPGA(필드 프로그래밍 가능한 게이트 어레이)의 장점을 활용하기 위해 Yolov7-Tiny 객체 감지 알고리듬을 예로 들어 FPGA 기반 범용 컨볼루션 신경망 가속기를 설계하고 구현했습니다. FPGA의 계산 속도를 향상시키기 위해 대형 피쳐 맵 판독 전략이 개선되었습니다. 또한 액셀러레이터의 입출력 모듈을 개선하여 버스 대역폭의 실제 활용도를 효과적으로 향상시켰습니다. 실험 결과 Xilinx ZCU104 개발 플랫폼에서는 작동 클럭 주파수가 300MHz에 도달할 수 있고 가속기의 GOP/s가 Intel I7-8700 CPU보다 12배 빠른 131.6에 도달할 수 있으며 단일 이미지 프로세스의 대기 시간이 CPU보다 6배 빠른 0.19초에 도달할 수 있습니다.