岗位职责:
1、负责大模型优化算法的研究与设计,针对模型训练效率、准确性、稳定性等方面进行深度优化,提升模型性能。
2、探索前沿的优化算法和技术,如自适应学习率策略、正则化方法等,并将其应用于大模型开发中,解决模型训练中的梯度消失、过拟合等问题。
3、与数据团队紧密合作,对大规模数据集进行分析和预处理,根据数据特点优化模型算法,确保模型对数据的有效利用。
4、参与模型架构的优化与调整,结合优化算法对模型结构进行改进,提高模型的可扩展性和泛化能力。
5、搭建和维护模型训练与优化的实验环境,通过实验对比不同优化算法的效果,为算法选择和改进提供数据支持。
6、跟踪大模型领域的最新研究成果和技术趋势,及时将有价值的优化思路引入到实际工作中,优化OA产品的智能化功能。
相关要求:
1、2025届,本科及以上学历,计算机或者相关专业,参与过大模型相关开发工作,包括但不限于:数据清洗、开源模型实际微调、训练框架开发、评测、推理部署等;
2、精通Python编程语言,熟悉Java等其他编程语言,熟悉常用框架如PyTorch,TensorFlow等深度学习框架;
3、熟悉大语言模型的增量预训练、指令微调、偏好微调等多种训练方法 ,有全场景训练实战落地经验;
4、熟悉全参数、LoRA 、QLoRA 等微调方法, 有微调场景落地经验;
5、熟悉DeepSpeed、flash-attn、vllm等大模型训练及推理加速方法;
6、熟悉数据收集、清洗和预处理的流程。有训练数据构造落地经验;
7、熟悉Docker、Kubernetes等容器化技术。
8、有成功优化模型训练算法、提升模型性能的项目经验,能够独立承担算法设计和开发任务。
9、出色的问题分析和解决能力。