본문 바로가기

공부

추후 공부 할 것 기록

추론 가속기

TensorRT, ONNX의 차이

 

훈련과정에서 GPU Resource를 효율적으로 사용하기 위한 mixed Precision

  • FP32 (Single Precision,)
  • FP64 (Double Precision)
  • FP128 (Quadruple Precision)
  • FP16 (Half Precision)

FP32와 FP16을 함께 사용

 

 

'공부' 카테고리의 다른 글

Titans: Learning to Memorize at Test Time  (1) 2025.01.21
Express와 NestJS의 차이?  (1) 2024.09.01
서버 스케줄링이란  (0) 2024.08.31
시스템 설계란  (0) 2024.08.31
Spring과 Node.js  (1) 2024.08.30