岗位职责:
技术沟通:定期与乙方技术团队交流,跟踪技术需求的实现,深入理解其使用的预训练模型(如GPT、BERT、Transformer)及应用领域,以确保信息传递的准确性和技术对接的顺畅性。
模型评估与测试:构建并管理高质量的测试数据集。
技术评审与建议:参与技术评审,审查乙方的技术方案,并提供基于预训练模型的优化和应用建议。
模型优化与改进:依据测试结果调整模型超参数,优化训练流程和性能,结合项目需求探索迁移学习、模型蒸馏等技术,利用框架调试工具提升训练速度和推理效率。
技术文档撰写:撰写全面的技术文档,包括模型设计、测试方案、测试报告和优化计划等。
岗位要求:
本科及以上学历,硕士优先,计算机科学、人工智能、数据科学或相关领域,具备3年以上AI开发经验;
扎实的数学基础,深刻理解机器学习和深度学习原理,熟悉常用预训练模型(如GPT、BERT等);
精通主流深度学习框架,如TensorFlow、PyTorch、盘古等;
扎实的计算机基础,具备较强的编程能力,至少熟悉一门编程语言(如C/C++、Java、Python、Golang等);
具备实际AI项目开发和实施经验,能够独立完成模型训练与部署全过程。