AIGC算法专家(相册领域)
6-9万元/月
更新 2025-12-24 14:25:19
浏览 972
职位详情
算法工程师
10年以上
多模态 · 图像算法 · 强化学习 · 文生图
岗位职责:
作为核心算法成员,参与AI图像相关技术的研发工作,主要支撑新一代智能相册系统的建设。主要职责包括:
一、图像理解方向:
1)研发基于多模态语义的图像理解技术:涵盖人物识别、事件归类、情绪判断、场景分类等任务;建立个性化的图像标签系统;
2)构建图像内容质量评估机制(如重复性、清晰度、人脸状态等),优化用户使用体验;
3)探索RAG架构与多模态大模型、文本大模型协同下的agent能力开发与实现路径。
二、图像AIGC方向(内容生成与编辑):
1)开展图像生成与编辑技术研究,包括背景更换、人像增强、风格转换、文本到图像、图像到图像等应用;
2)参与基于Diffusion架构的基础模型训练工作;
3)推进ControlNet、Inpainting、aigc编辑大模型等前沿模型在业务场景中的开发与落地。
任职要求:
一、基本条件:
1)计算机、人工智能、图像处理等相关专业硕士及以上学位;
2)具备扎实的深度学习理论基础,熟练使用PyTorch/TensorFlow等主流框架;
3)具有良好的编程能力,精通python和c++语言;
4)掌握图像分类、检测、分割、生成等典型任务及其常用网络结构;
5)能够独立完成算法设计、模型训练及上线优化全流程工作。
二、优先考虑:
1)具备多模态大模型、CLIP、BLIP、SAM、Diffusion、ControlNet等相关项目经验;
2)有移动端或端侧模型部署优化经验(如CoreML,ONNX,TensorRT等);
3)有实际产品化经验,例如智能图库、美颜功能、图像创作类工具等;
4)了解大模型(如GPT-4V,Gemini,Claude)在视觉任务中的融合应用。
作为核心算法成员,参与AI图像相关技术的研发工作,主要支撑新一代智能相册系统的建设。主要职责包括:
一、图像理解方向:
1)研发基于多模态语义的图像理解技术:涵盖人物识别、事件归类、情绪判断、场景分类等任务;建立个性化的图像标签系统;
2)构建图像内容质量评估机制(如重复性、清晰度、人脸状态等),优化用户使用体验;
3)探索RAG架构与多模态大模型、文本大模型协同下的agent能力开发与实现路径。
二、图像AIGC方向(内容生成与编辑):
1)开展图像生成与编辑技术研究,包括背景更换、人像增强、风格转换、文本到图像、图像到图像等应用;
2)参与基于Diffusion架构的基础模型训练工作;
3)推进ControlNet、Inpainting、aigc编辑大模型等前沿模型在业务场景中的开发与落地。
任职要求:
一、基本条件:
1)计算机、人工智能、图像处理等相关专业硕士及以上学位;
2)具备扎实的深度学习理论基础,熟练使用PyTorch/TensorFlow等主流框架;
3)具有良好的编程能力,精通python和c++语言;
4)掌握图像分类、检测、分割、生成等典型任务及其常用网络结构;
5)能够独立完成算法设计、模型训练及上线优化全流程工作。
二、优先考虑:
1)具备多模态大模型、CLIP、BLIP、SAM、Diffusion、ControlNet等相关项目经验;
2)有移动端或端侧模型部署优化经验(如CoreML,ONNX,TensorRT等);
3)有实际产品化经验,例如智能图库、美颜功能、图像创作类工具等;
4)了解大模型(如GPT-4V,Gemini,Claude)在视觉任务中的融合应用。
相似职位
很抱歉,暂无相似职位!