职位详情
职责描述:
1.利用深度学习编译技术,结合专家级经验(算法/系统/硬件),解决搜广推、CV、NLP,以及多模态、大模型的训练和推理场景挑战。
2.系统化分析模型,提炼/抽象优化方法,寻求解空间(包括算子调度,融合,Schedule,异构调度等)。
3. multi-framework(例如Tensorflow、Pytorch等)计算图优化Pass开发,手段包括不限于编译 IR优化,专家经验模板化等。
4. multi-device(例如GPU,CPU,NPU)专项 SIMT、SIMD 计算加速,包括核心Gemm 算子,Reduce算子,以及复杂融合算子等。
任职要求:
有扎实的计算机理论基础,熟练掌握C++和 Python语言具备以下优先:
1.熟悉PyTorch 或TensorFlow等引擎的架构和运行原理,有深度定制经验优先;
2.熟悉TVM/MLIR/XLA等DL编译器,有Cutlass技术经验,具备计算图翻译至IR并优化的经验优先;
3.在深度学习领域有丰富的模型优化经验,熟悉 GPU或NPU架构,有CUDA或NPU编程经验优先;
4.学习能力和好奇心强,具备良好的问题分析和解决能力,有团队合作精神和沟通能力。
以下四个城市同时招聘:
苏州:虎丘区悦峰大厦
上海:浦东新区盛夏路399弄亚芯科技园
成都:武侯区天府三街新希望国际
杭州:萧山区利一路天人大厦
其他信息
行业要求:全部行业