(一)崗位職責(zé)
1、負(fù)責(zé)大語言模型(LLM)相關(guān)前沿技術(shù)的研發(fā)以及落地工作,包括模型部署、優(yōu)化和應(yīng)用開發(fā);
2、負(fù)責(zé)制定企業(yè)級AI大模型應(yīng)用解決方案,建立相應(yīng)的模型管理和監(jiān)控機(jī)制,開展模型性能監(jiān)控及優(yōu)化,確保模型服務(wù)的穩(wěn)定性和高可用性;
3、負(fù)責(zé)大模型推理框架(vLLM、TGI、Triton等)的部署和優(yōu)化,負(fù)責(zé)AI應(yīng)用架構(gòu)、API接口、模型調(diào)用方式的設(shè)計(jì)和實(shí)現(xiàn);
4、負(fù)責(zé)RAG(檢索增強(qiáng)生成)應(yīng)用的自主研發(fā)和建設(shè),包括向量數(shù)據(jù)庫選型、知識庫構(gòu)建、檢索策略優(yōu)化及prompt工程等;
5、負(fù)責(zé)識別和解決模型應(yīng)用中的潛在問題,包括但不限于性能瓶頸、準(zhǔn)確率優(yōu)化、成本控制等,并推動(dòng)相關(guān)技術(shù)手段建設(shè);
6、熟悉AI應(yīng)用全生命周期管理相關(guān)要求,建設(shè)和優(yōu)化模型訓(xùn)練、部署、監(jiān)控、迭代的能力體系。
 (二)任職資格 
1、本科及以上學(xué)歷,計(jì)算機(jī)、人工智能、機(jī)器學(xué)習(xí)、數(shù)據(jù)科學(xué)等相關(guān)專業(yè),3年以上工作經(jīng)驗(yàn); 
2、熟悉vLLM、LangChain、LlamaIndex等大模型推理和應(yīng)用開發(fā)框架,有大規(guī)模模型部署或應(yīng)用開發(fā)經(jīng)驗(yàn); 
3、熟悉RAG技術(shù)棧,包括向量數(shù)據(jù)庫(Milvus、Qdrant、Chroma等)、Embedding模型、文檔解析等; 
4、掌握Python、Java等常見開發(fā)語言,熟練掌握PyTorch,熟悉FastAPI、Flask等Web框架; 
5、熟悉主流大語言模型(ChatGPT、Claude、Deepseek、Qwen等),有AI Agent、prompt工程、模型微調(diào)、模型量化(GPTQ、AWQ)經(jīng)驗(yàn)者優(yōu)先; 
6、有GPU服務(wù)器管理、CUDA優(yōu)化、模型性能調(diào)優(yōu)、分布式推理等相關(guān)的實(shí)踐經(jīng)驗(yàn)者優(yōu)先; 
7、有責(zé)任心和職業(yè)道德,良好的邏輯思維能力和團(tuán)隊(duì)合作精神。 
職位福利 
六險(xiǎn)一金、員工食堂、帶薪年假、工會(huì)福利、定期體檢、周末雙休、年度獎(jiǎng)金