
工作职责:
1、负责将深度学习模型从训练框架转换并部署到硬件设备端;
2、负责模型推理性能优化,优化包括模型结构、量化、稀疏化、剪枝,算子融合、自定义算子、任务调度等,解决带宽、资源占用、资源竞争等问题;
3、负责模型量化、推理、部署工具链的研发 ;
4、负责芯片算力资源使用评测及性能优化;
5、与模型工程师合作进行模型优化。
任职资格:
1、硕士及以上学历,计算机/数学方面相关专业;
2、熟悉 python、C 等编程语言,熟悉 TensorRT、ONNXRuntime、TorchScript 等部署优化工具;
3、精通 TensorFlow/Pytorch 深度学习框架及工具链,有2年及以上模型在端侧AI芯片的部署经验,比如瑞星微、高通、联发科的SOC;
4、具备模型运算性能分析、确定芯片算力瓶颈等能力;
5、良好的沟通能力,较强的责任心和团队意识,追求卓越的心态,较强的工作积极性。