세션 28 상세
동영상
세션 정보
TensorFlow Serving보다 10배 빠르게 서빙하기
- 하광성 jesse카카오추천팀
텐서플로우로 만든 딥러닝 모델을 서비스에서 사용하기 위해 인퍼런스 서버를 구축하는 과정에서 코드 레벨/도메인 레벨/Layer Fusion/구현 레벨 등 다양한 관점에서의 최적화를 통해 TensorFlow Serving보다 10배 빠르게 만든 과정을 공유합니다.
#텐서플로우서빙 #CPU인퍼런스 #inference
목록보기