職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
職位描述
1、負責智能算法在硬件平臺上的工程化設計、實現和優化,打造高吞吐、低延時推理系統
2、優化大模型推理性能,提升吞吐并控制成本
3、優化大模型推理框架,提升框架易用性和可調試行
4、調研業界硬件平臺設計、計算優化的發展趨勢,進行技術分析與開發實現;
職位要求
1、碩士及以上學歷;計算機、光電、生儀、通信、自控等相關專業;
2、熟練掌握C、C 、Python至少一種編程語言,編程基礎扎實;
3、具備以下開發經驗之一者優先:
1)熟悉計算機體系架構、編譯原理、操作系統;
2)有tensorRT/fasterTransformer/vllm/TensorRT-llm /sglang等深度學習推理框架使用經驗,了解常用AI算法網絡;
3)熟悉異構并行加速瓶頸分析方法,有主流GPGPU、DSA架構優化經驗;
4)熟悉分布式推理常用加速方法,有大模型分布式部署經驗者;
4、具備較強的全局觀,能夠系統的分析問題,良好的溝通協作能力。
截止日期:2026年08月19日
工作地點
地址:杭州濱江區杭州-濱江區海康威視數字技術股份有限公司(總部西區)


職位發布者
人事部HR
杭州海康威視數字技術股份有限公司

-
其他
-
1000人以上
-
國有企業
-
杭州市濱江區阡陌路555號