職位描述
該職位還未進行加V認證,請仔細了解后再進行投遞!
工作內容:
1.負責京東信息安全大模型的應用研發工作,涵蓋模型的持續預訓練與優化、監督微調(SFT)以及強化學習等關鍵環節;
2.深入調研并積極探索大模型領域的前沿技術,包括先進的預訓練方法、創新的 post-training 技術以及大模型強化學習技術;
3.參與大模型服務的部署實施,著力于模型量化處理和推理過程的加速優化,提升模型應用的性能和效率;
4.參與大模型在agent應用算法優化工作,提升agent任務執行效果;
任職資格:
1.有計算機科學、數學、統計學或相關領域的碩士或博士學位;
2. 熟悉Python與深度學習框架,具有良好的編程能力和扎實的數學理論基礎;
3.熟悉掌握大模型相關技術,有實際主導或參與過大模型訓練工作,包括不限于:預訓練、SFT、強化對齊等;
4. 關注行業前沿進展,對技術開發及應用有熱情,有自己的想法并樂于挑戰自我;
5. 良好的溝通能力,跨團隊協作能力,具備出色的規劃、執行力,強烈的責任感,以及優秀的學習能力和自我驅動力。
加分項:
1. 有相關領域的開源項目、競賽獲獎、頂會論文發表/在投;
2. 熟悉DeepSpeed、Megatron-LM 、VeRL 、Unsloth 等LLM開源工具,具備大模型訓練推理框架的優化以及開發能力。
3.熟悉大模型應用框架如Langchain等,工程能力較強;
符合京東價值觀:客戶為先、創新、拼搏、擔當、感恩、誠信。
工作地點
地址:北京通州區北京-通州區京東總部


職位發布者
息女士HR
北京京東世紀貿易有限公司

-
互聯網·電子商務
-
1000人以上
-
股份制企業
-
北京市海淀區蘇州街20號院銀豐大廈2號樓