一、工作内容
AI大模型开发工程师专注于大语言模型(LLM)及生成式AI技术的应用开发与落地,具体工作包括:
大模型应用开发:基于主流大模型(如文心一言、通义千问、智谱AI、GPT等)的API或开源模型(如ChatGLM、Qwen、LLaMA),开发智能客服、知识库问答、内容生成、代码辅助等企业级应用。
Prompt工程优化:设计并迭代高质量的提示词模板,提升模型输出内容的准确性、相关性与稳定性,降低幻觉率。
RAG与Agent构建:搭建检索增强生成(RAG)系统,结合向量数据库(如Chroma、Milvus)实现私有知识库问答;开发具备工具调用、多轮对话能力的智能体(Agent)。
模型微调与部署:基于垂直领域数据对开源大模型进行微调(LoRA、Q-LoRA等),并完成模型的压缩、量化与云端/边缘端部署。
效果评估与迭代:建立模型输出评测体系,持续优化响应质量、延迟与成本。
二、任职要求
专业基础:计算机、人工智能、软件工程等相关专业本科及以上学历,熟悉机器学习基础及Transformer架构原理。
编程能力:精通Python,熟悉FastAPI、Flask等后端框架,具备良好的代码规范意识。
大模型实践:熟悉至少一种主流大模型的API调用或开源模型的使用,了解LangChain、LlamaIndex等开发框架。
加分项:有完整的大模型应用项目落地经验;熟悉向量数据库、Prompt调优或模型微调技术;有AI竞赛、开源贡献或技术博客者优先。
软素质:具备快速学习能力、逻辑思维清晰,善于跨团队协作解决实际问题。