추론 가속기
TensorRT, ONNX의 차이
훈련과정에서 GPU Resource를 효율적으로 사용하기 위한 mixed Precision
- FP32 (Single Precision,)
- FP64 (Double Precision)
- FP128 (Quadruple Precision)
- FP16 (Half Precision)
FP32와 FP16을 함께 사용
'공부' 카테고리의 다른 글
Titans: Learning to Memorize at Test Time (1) | 2025.01.21 |
---|---|
Express와 NestJS의 차이? (1) | 2024.09.01 |
서버 스케줄링이란 (0) | 2024.08.31 |
시스템 설계란 (0) | 2024.08.31 |
Spring과 Node.js (1) | 2024.08.30 |