if(kakao) 2021

세션 28 상세

TensorFlow Serving보다 10배 빠르게 서빙하기

텐서플로우로 만든 딥러닝 모델을 서비스에서 사용하기 위해 인퍼런스 서버를 구축하는 과정에서 코드 레벨/도메인 레벨/Layer Fusion/구현 레벨 등 다양한 관점에서의 최적화를 통해 TensorFlow Serving보다 10배 빠르게 만든 과정을 공유합니다.

#텐서플로우서빙 #CPU인퍼런스 #inference

연관 세션이 없습니다.