b__ono__ng
YOLOv8 batch/input size/precision/model size 별 속도 비교 기록 본문
YOLO26이 나오는 이 시대에 무슨,, 이겠지만 정리할 일이 있어서 YOLOv8 ONNX 모델 조합별로 속도만 기록함
환경은 ONNX, CUDA, 8GB GPU(RTX 3070) 기준이다.
| 모델 | Batch | Input | Precision | FPS |
| m | 1 | 640 | FP32 | 55.1 |
| m | 1 | 960 | FP32 | 25.3 |
| m | 1 | 1280 | FP32 | 13.9 |
| m | 4 | 1280 | FP32 | 18.1 |
| m | 8 | 1280 | FP32 | 18.6 |
| m | 1 | 1280 | FP16 | 15.5 |
| m | 1 | 1280 | INT8 | 14.5 |
| x | 1 | 640 | FP32 | 28.8 |
| x | 1 | 960 | FP32 | 13.8 |
| x | 1 | 1280 | FP32 | 7.9 |
'IT > AI' 카테고리의 다른 글
| 정밀도 FP16 다음이 FP8이 아니라 INT8인 이유 (0) | 2026.06.09 |
|---|---|
| Opus 4.8 왜 CLAUDE.md 안 따르나요 (2) | 2026.05.31 |
| [Skills] Smart File Organizer: 파일 내용 기반 Rename&Sorting Skill (1) | 2026.03.09 |
| OpenClaw Agent 커스텀이 안 먹힐 때 (4) | 2026.03.04 |
| Onnxruntime-DirectML 정확도 유지하며 추론 성능 개선 시도 (2) | 2026.03.04 |