职位详情
岗位职责:1、负责将大模型及其他AI技术应用于实际领域,推动AI技术发挥业务价值,并提供有效的技术解决方案。
2、解决大模型及其他AI技术产业落地过程中的算法及工程难题。
3、从事生成式语言大模型及多模态模型的预训练、微调,算法精度提升,模型性能提升等工作。
4、负责大模型定制化下游任务开发,如检索模型、对话系统,结构化文本生成等。
任职要求:
1、全日制硕士及以上学历(人工智能,计算机科学与技术等相关专业),1年以上大模型开发经验,5年算法相关开发经验;
2、在NLP,CV,大语言模型,多模态,强化学习等领域具有相关工作和项目落地经验,具有扎实的研究能力及工程应用能力。
3、掌握Pytorch、PaddlePaddle、Mindspore等相关工具,具备较高水平的工程设计能力及一定的实践经验。
4、熟悉DeepSpeed框架,了解各种并行策略,具备大模型分布式训练及高效推理部署经验。
5、具备大模型的预训练,全量微调,Lora微调等技术应用经验。
6、自驱力强,具有良好的协作能力和沟通能力。
加分项:
1、具有CVPR,ICLR,EMNLP等顶会paper者优先。
2、在NLP及大模型领域竞赛取得较高名次者优先。
其他信息
行业要求:全部行业