職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
職責描述:
一.戰略規劃與架構設計
(1)制定算?中?中?期發展戰略,匹配公司業務(如AI訓練、科學計算、云服務等)的 算?需求。
(2)設計?可?、可擴展的算?架構,包括硬件選型、?絡拓撲、存儲與能源?案。
二.基礎設施建設與運維
(1)主導算?中?的建設(?建或合作),管理從選址、電?、制冷到硬件部署的全流程。
(2)建?運維體系,保障算?資源的穩定性、安全性(物理/?絡隔離)與能效優化。
三.資源調度與成本管控
(1)設計資源調度策略,平衡?性能計算、批處理任務與實時服務的需求。
(2)制定預算并優化TCO(總擁有成本),通過精細化監控降低能耗與運維成本。
四.技術前瞻與創新
(1)跟蹤算?技術趨勢(如液冷、Chiplet、異構計算),推動技術迭代與架構升級。
(2)探索綠?算??案,應對碳減排要求。
五.團隊管理與協同
(1)領導跨職能團隊(?程師、運維、安全專家),建?on-call應急機制與知識庫。
(2)協同業務部?、云?商、芯?供應商及科研機構,構建算??態合作。
六.?險管理與合規
(1)制定災難恢復(DR)與數據安全?案,滿?等保、GDPR等合規要求。
(2)應對供應鏈?險(如芯?禁運),設計國產化替代或多元供應?案。
任職要求:
1.10年以上數據中?/HPC領域經驗,主導過超千卡集群建設項?;計算機/電??程專業碩?以上學歷。
2.有?型互聯?公司或國家超算中?從業經歷;參與過國產算?國產化項?。
3.硬技能
(1)技術深度:精通?性能計算(HPC)/分布式系統架構,熟悉主芯?(NVIDIA/AMD/ 華為昇騰等)、?速?絡與存儲技術。
(2)運維能?:掌握運維?動化?具(Ansible/K8s)、監控體系(Prometheus/Zabbix)及故障根因分析。
(3)能效管理:具備數據中?能源效率優化經驗,熟悉PUE、WUE等指標。
4.軟技能
(1)戰略思維:能將業務需求轉化為技術路線圖,平衡短期投?與?期技術債。
(2)成本敏銳度:擅?CAPEX/OPEX分析,能通過混部、削峰填?等?式提升資源利?。
(3)領導?:具備跨團隊協作能?,能在?壓下決策(如?規模故障應急)。
5.?業認知
(1)了解全球算?競爭格局(如中美芯?政策)、國內外主流云服務商定價策略。
(2)熟悉AI?模型訓練對算?的特殊需求(如萬卡集群通信優化)。
工作地點
地址:蘇州吳江區蘇州-吳江區國家先進功能纖維創新中心
??
點擊查看地圖
詳細位置,可以參考上方地址信息
求職提示:用人單位發布虛假招聘信息,或以任何名義向求職者收取財物(如體檢費、置裝費、押金、服裝費、培訓費、身份證、畢業證等),均涉嫌違法,請求職者務必提高警惕。

蘇州
應屆畢業生
碩士
2026-03-11 10:22:30
163人關注
注:聯系我時,請說是在江蘇人才網上看到的。
