我想看免费的a片|人人操屄去人人操|日本免费三级片网站|羞羞资源久久在线|亚洲一二三四区久久久日韩|高清无码精品视频在线观看|日韩一级不卡视频|黄色三级电影片一一区|日本三级片小说在线|日韩成人三级片免费播放

該職位已失效,看看其他機(jī)會(huì)吧

大模型訓(xùn)練專家 / 高級(jí)工程師

4-5.5萬(wàn)
  • 上海徐匯區(qū)
  • 虹梅路
  • 5-10年
  • 碩士
  • 全職
  • 招1人

職位描述

大模型訓(xùn)練專家 / 高級(jí)工程師
職位概述:
作為我們團(tuán)隊(duì)的大模型訓(xùn)練專家,需要深入探索模型架構(gòu)、優(yōu)化超大規(guī)模分布式訓(xùn)練、處理海量數(shù)據(jù)并保障訓(xùn)練穩(wěn)定,致力于解決業(yè)界前沿的AI工程挑戰(zhàn),推動(dòng)技術(shù)進(jìn)步。
主要職責(zé):
1. 模型架構(gòu)與訓(xùn)練策略:負(fù)責(zé)主導(dǎo)和深度參與大模型的分布式訓(xùn)練工程化落地、訓(xùn)練方案制定及關(guān)鍵技術(shù)選型。
2. 分布式訓(xùn)練優(yōu)化:構(gòu)建、優(yōu)化與維護(hù)基于PyTorch、Megatron-LM、MindSpeed等框架的大規(guī)模分布式訓(xùn)練流程,持續(xù)提升白卡級(jí)、千卡級(jí)以上集群的計(jì)算效率。
3. 數(shù)據(jù)工程體系建設(shè):主導(dǎo)從原始互聯(lián)網(wǎng)數(shù)據(jù)到高質(zhì)量訓(xùn)練語(yǔ)料的全流程開發(fā),包括海量數(shù)據(jù)獲取、清洗、去重、安全過(guò)濾及多模態(tài)數(shù)據(jù)混合策略制定。
4. 訓(xùn)練穩(wěn)定性保障:監(jiān)控、診斷并攻克預(yù)訓(xùn)練過(guò)程中出現(xiàn)的損失尖峰、數(shù)值溢出等各類疑難問(wèn)題,確保萬(wàn)億Token級(jí)別訓(xùn)練任務(wù)的穩(wěn)定收斂。
5. 性能瓶頸分析:運(yùn)用Profiling工具對(duì)訓(xùn)練全鏈路進(jìn)行深度性能分析,定位系統(tǒng)瓶頸,并進(jìn)行內(nèi)核級(jí)或系統(tǒng)級(jí)優(yōu)化。
6. 技術(shù)前瞻與研究:跟蹤學(xué)術(shù)界與工業(yè)界最新進(jìn)展,將先進(jìn)的預(yù)訓(xùn)練技術(shù)、優(yōu)化策略應(yīng)用于實(shí)際項(xiàng)目,驅(qū)動(dòng)模型性能持續(xù)提升。
任職要求 (必備技能與經(jīng)驗(yàn)):
· 學(xué)歷與專業(yè): 計(jì)算機(jī)科學(xué)、人工智能、數(shù)學(xué)等相關(guān)專業(yè)碩士及以上學(xué)歷。
· 工作經(jīng)驗(yàn):
o 具備5年以上機(jī)器學(xué)習(xí)/深度學(xué)習(xí)研發(fā)經(jīng)驗(yàn),至少3年專注于大模型預(yù)訓(xùn)練領(lǐng)域。
o 擁有完整參與并成功交付一個(gè)百億參數(shù)以上大模型預(yù)訓(xùn)練項(xiàng)目的全流程經(jīng)驗(yàn)。
· 核心技術(shù)能力:
o 深度學(xué)習(xí)基礎(chǔ):精通Transformer架構(gòu)及各類變體,對(duì)大模型的核心技術(shù)(如注意力機(jī)制、歸一化、位置編碼)有深刻理解。
o 分布式訓(xùn)練:具備豐富的Megatron-LM、MindSpeed等框架使用經(jīng)驗(yàn),深刻理解數(shù)據(jù)并行、張量并行、流水線并行等并行策略。
o 數(shù)據(jù)處理:熟練掌握TB/PB級(jí)別數(shù)據(jù)的處理流程和工具,精通數(shù)據(jù)質(zhì)量過(guò)濾、去重及Tokenizer訓(xùn)練。
o 編程與工具:精通Python、PyTorch、Transformers等大模型開發(fā)框架,熟悉Linux開發(fā)環(huán)境。具備在大型GPU/NPU集群上進(jìn)行代碼調(diào)試和性能調(diào)優(yōu)的實(shí)戰(zhàn)能力。
· 個(gè)人素質(zhì):
o 具備卓越的系統(tǒng)分析能力和解決復(fù)雜問(wèn)題的熱情。
o 擁有強(qiáng)大的責(zé)任心和團(tuán)隊(duì)協(xié)作精神,善于溝通。
o 對(duì)人工智能技術(shù)充滿好奇心,具備強(qiáng)大的自驅(qū)力和持續(xù)學(xué)習(xí)能力。
優(yōu)先考慮條件 (加分項(xiàng)):
· 有重要的開源大模型項(xiàng)目貢獻(xiàn)經(jīng)歷。
· 具備跨模態(tài)大模型預(yù)訓(xùn)練經(jīng)驗(yàn)。
查看全部

工作地點(diǎn)

上海徐匯區(qū)漕河涇科匯大廈-9號(hào)樓

職位發(fā)布者

包曉亮/招聘部長(zhǎng)

立即溝通
公司Logo深圳數(shù)字人才科技有限公司
深圳數(shù)字人才科技有限公司(簡(jiǎn)稱:人才數(shù)科)成立于2021年,系由深圳市人才集團(tuán)與深圳市龍華投資控股(集團(tuán))合資成立:深圳市人才大市場(chǎng)有限公司。2024年11月,企業(yè)完成升級(jí)并啟用現(xiàn)名稱,與龍華區(qū)政府及深圳開鴻數(shù)字產(chǎn)業(yè)發(fā)展有限公司共同打造開源鴻蒙開發(fā)者培訓(xùn)基地,聚焦數(shù)字經(jīng)濟(jì)蓬勃發(fā)展的大趨勢(shì),以打造高質(zhì)量數(shù)字人才生態(tài)為核心使命,依托專業(yè)的團(tuán)隊(duì)、深厚的行業(yè)資源以及前沿的數(shù)字化運(yùn)營(yíng)理念,致力于為各類企業(yè)、機(jī)構(gòu)提供全方位、一站式的數(shù)字人才解決方案。公司以“深耕深圳、服務(wù)灣區(qū)、輻射全國(guó)”為導(dǎo)向,以“政府引導(dǎo),公益先行,市場(chǎng)運(yùn)作,專業(yè)服務(wù)”為路徑,在全市率先探索市區(qū)聯(lián)動(dòng)、政企合作的人力資源服務(wù)新模式,持有人力資源服務(wù)許可、勞務(wù)派遣經(jīng)營(yíng)許可、檔案中介服務(wù)等業(yè)務(wù)資質(zhì),獲得IS09001質(zhì)量管理體系、ISO14001環(huán)境管理體系、ISO45001職業(yè)安全健康管理體系、信息安全管理體系、風(fēng)險(xiǎn)管理體系等多項(xiàng)認(rèn)證。公司為龍華區(qū)人力資源協(xié)會(huì)會(huì)長(zhǎng)單位,曾獲得龍華區(qū)五星人力資源服務(wù)機(jī)構(gòu)等榮譽(yù),可提供高層次人才引進(jìn)、人才培養(yǎng)、科技外包、人力資源外包、園區(qū)運(yùn)營(yíng)、產(chǎn)業(yè)服務(wù)、雙招雙引、勞務(wù)派遣等人才全鏈條服務(wù)。
公司主頁(yè)