崗位描述
該崗位負責基于公司生產的 AI 硬件開發(fā)和部署 AI 模型,進行模型量化和加速,提升模型的推理性能。
工作內容
- 結合 AI 硬件,編寫典型場景全流程 Demo,包括模型訓練、量化、編譯、部署、推理等;
- 使用 TPU-MLIR 等編譯器,將深度學習模型高效地映射到 TPU 中運行;
- 移植主流或客戶的算法模型,為客戶提供典型場景通用技術解決方案;
- 支持客戶完成算法移植工作,收集反饋問題和需求,并提出改進意見。
任職要求
- 2 年以上工作經驗,扎實的編程基礎,良好的編程風格;
- 熟悉 Python 的常用庫和工具,如 NumPy、Pandas、Scikit-learn 等;
- 熟悉 Caffe/TensorFlow/MxNet/PyTorch 等至少一種深度學習框架;
- 熟悉圖像分類、目標檢測及跟蹤、圖像分割、自然語言處理等常見深度學習算法;
- 有主流 LLM GPT 開源衍生模型(Alpaca, LLaMA, Vicuna, Lora 等)的使用經驗;
- 有 NPU/TPU 等硬件加速器的使用經驗,有模型量化和加速的經驗;
- 有 TPU-MLIR 等編譯器的使用經驗,有移植模型到 TPU 的經驗;
- 有基本的英文文檔讀寫能力;
- 有良好的工作習慣和職業(yè)素養(yǎng)。
加分項
- 熟悉編譯器基本知識,了解至少一種通用或者專用的編譯器,如 GCC、LLVM、TVM、MLIR 或者自研編譯器等;
- 熟悉圖像和音視頻相關基本知識,有 FFmpeg、OpenCV、gstreamer 等開發(fā)經驗;
- 有開源社區(qū)貢獻或者開源項目。