公司福利:周末雙休、五險一金、帶薪年假、餐補、出差補貼、團建
崗位職責:
1、負責億級參數(shù)規(guī)模大模型(LLM/CV 多模態(tài))的預訓練、指令微調及 RLHF 全流程開發(fā)
2、設計高效的分布式訓練方案(數(shù)據(jù)/模型/流水線并行),優(yōu)化 GPU 集群利用率
3、開發(fā)模型壓縮技術(量化/蒸餾/剪枝)實現(xiàn)大模型輕量化部署
4、跟蹤 Diffusion/Transformer 等前沿架構,推動業(yè)務場景創(chuàng)新應用
崗位要求:
1、計算機/數(shù)學本科及以上學歷,2 年以上大模型研發(fā)經(jīng)驗
2、精通 PyTorch 框架及 DeepSpeed/ColossalAI 等分布式訓練工具
3、掌握 Megatron-LM/LLaMA 等開源架構的二次開發(fā)
4、熟悉 CUDA 優(yōu)化及 TRT/TensorRT-LLM 部署方案
5、參與過開源大模型項目(如 ChatGLM/Baichuan 開發(fā))優(yōu)先