大模型算法工程师

泛微网络科技股份有限公司 发布于2025-02-28 二维码

岗位职责:

1、负责大模型优化算法的研究与设计,针对模型训练效率、准确性、稳定性等方面进行深度优化,提升模型性能。

2、探索前沿的优化算法和技术,如自适应学习率策略、正则化方法等,并将其应用于大模型开发中,解决模型训练中的梯度消失、过拟合等问题。

3、与数据团队紧密合作,对大规模数据集进行分析和预处理,根据数据特点优化模型算法,确保模型对数据的有效利用。

4、参与模型架构的优化与调整,结合优化算法对模型结构进行改进,提高模型的可扩展性和泛化能力。

5、搭建和维护模型训练与优化的实验环境,通过实验对比不同优化算法的效果,为算法选择和改进提供数据支持。

6、跟踪大模型领域的最新研究成果和技术趋势,及时将有价值的优化思路引入到实际工作中,优化OA产品的智能化功能。


相关要求:

1、2025届,本科及以上学历,计算机或者相关专业,参与过大模型相关开发工作,包括但不限于:数据清洗、开源模型实际微调、训练框架开发、评测、推理部署等;

2、精通Python编程语言,熟悉Java等其他编程语言,熟悉常用框架如PyTorch,TensorFlow等深度学习框架;

3、熟悉大语言模型的增量预训练、指令微调、偏好微调等多种训练方法 ,有全场景训练实战落地经验;

4、熟悉全参数、LoRA 、QLoRA 等微调方法, 有微调场景落地经验;

5、熟悉DeepSpeed、flash-attn、vllm等大模型训练及推理加速方法;

6、熟悉数据收集、清洗和预处理的流程。有训练数据构造落地经验;

7、熟悉Docker、Kubernetes等容器化技术。

8、有成功优化模型训练算法、提升模型性能的项目经验,能够独立承担算法设计和开发任务。

9、出色的问题分析和解决能力。

职位详情

学历要求:

工作地点:上海市闵行区

每月薪水:10000以上

招聘人数:5 人

行业:信息传输、软件和信息技术服务业

性质:其他企业

所在地:上海市

网申网址: https://www.e-cology.com.cn/sp/ebdfpage/distribute

其他在招职位