职位详情
职位描述
负责智能体的质量评估工作,包括但不限于模型、插件、知识库等能力的评测,确保端到端的质量。
参与搭建质量评估体系,对优质内容有判断力,制定并持续优化不同类目下的质量评估标准。
执行并落地质量评估工作,协同多团队进行问题收集、评估集构建,人工/自动化评测结果产出。
基于质量评估结果,提炼有价值的产品建议,推动模型优化,智能体生态策略调整等。
职位要求
计算机、数学、统计学等相关专业本科及以上学历,了解大模型及相关应用的实现原理,能识别关键节点并进行质量评估。
有产品质量评估经验,掌握常见的评估方法,例如数据标注、GSB评估、其他自动化评估等能力。
较强的分析和沟通能力,擅长从评估数据中发现有价值的产品改善建议,并能推动落地
行业热情,对大模型、AI技术知识有强烈兴趣和敏锐嗅觉,及时了解大模型业界发展动态,辅助判断未来发展趋势。
其他信息
行业要求:全部行业