職位描述
該職位已進行加V認證,請放心投遞
崗位職責
1、負責深度學習在線推理引擎的設計與開發,打造低延時,高吞吐的推理引擎;
2、參與神經網絡加速技術的調研、探索和落地;
3、負責nlp大模型在實際業務場景中落地。
任職要求
1、本科及以上學歷,具備豐富的模型推理加速算法經驗,熟悉各類主流加速庫,如:tensorrt / cudnn / mkl / xla等;熟悉各類ir,包括不限于onnx;
2、熟悉主流深度學習框架:tensorflow / pytorch,熟悉主流推理引擎:triton / openvino;
3、有算子開發經驗,具備深度學習模型性能分析和優化能力;
4、熟悉圖優化、混合精度、剪枝、編譯優化技術,有實操業務落地經驗的優先;
5、熟悉模型部署優化,如模型量化、模型壓縮,模型轉換,模型稀疏化等;
6、熟練掌握c/c++/python編程,有大模型端到端落地經驗者優先;
7、熟悉pytorch源碼者優先。
工作地點
地址:杭州杭州市 | 研發類 | 若干人
??
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業證等),均涉嫌違法,請求職者務必提高警惕。
職位發布者
HR
維沃移動通信有限公司
-
通信/電信
-
1000人以上
-
私營·民營企業
-
東莞市長安鎮烏沙步步高大道283號

應屆畢業生
學歷不限
2026-03-25 09:15:33
4060人關注
注:聯系我時,請說是在江蘇人才網上看到的。
