工作職責(zé)??: 
1.負(fù)責(zé)大模型測評數(shù)據(jù)的整理、分類、結(jié)構(gòu)化標(biāo)注。 
2.根據(jù)測評和測試方案,執(zhí)行模型效果測評和系統(tǒng)端對端測試。 
3.記錄測試異常并復(fù)現(xiàn)用戶問題場景,分析定位問題。 
4.統(tǒng)計分析用戶真實數(shù)據(jù),不斷完善用例庫。 
5.??測評系統(tǒng)建設(shè)支持??。 
任職要求: 
1.計算機相關(guān)專業(yè)本科及以上學(xué)歷,經(jīng)驗?zāi)晗薏幌蕖?
2.能快速理解NLP任務(wù)需求,有AI輔助編程工具或類似產(chǎn)品的使用或測試經(jīng)驗。 
3.務(wù)必熟練使用Excel/Python進行基礎(chǔ)數(shù)據(jù)處理,具備一定的編寫測試腳本能力。 
4.熟悉常用的測試開發(fā)工具,如Git、Postman、Jmeter等。 
5.具備良好的溝通能力、執(zhí)行力強、具備跨團隊協(xié)作意識和問題解決能力。 
6.加分項:NLP基本知識和原理,模型測評經(jīng)驗,prompt工程能力。