建议学习路线
从基础到进阶,每个阶段都以产出一个可运行的项目为完成标准。
1-2周
阶段零:AI驱动开发与效能跃迁
掌握Cursor/Windsurf等AI IDE与指令驱动开发模式,实现10倍开发提效。
关键知识点
- AI IDE 实战 (Cursor/Windsurf)
- 指令驱动开发 (PDD)
- 自动化工作流 (n8n)
✅ 验收标准
不写一行代码,仅通过Prompt和Cursor完成一个包含数据库的Todo List全栈应用开发与部署。
2-3周
阶段一:工程基础与NLP入门
夯实Python工程能力,理解现代NLP的基本概念。
关键知识点
- Python 进阶 (Type Hinting & Pydantic)
- API 开发 (FastAPI)
- NLP 基础 (Tokenization & Embedding)
✅ 验收标准
使用FastAPI写一个简单的文本分类API,输入文本,调用Hugging Face的小模型进行情感分析,返回JSON结果,并包含Swagger文档。
3-4周
阶段二:LLM应用与RAG实战
掌握Prompt Engineering,学会使用向量数据库解决大模型幻觉问题。
关键知识点
- Prompt Engineering (CoT & Structured)
- RAG Pipeline (Chunking & Retrieval)
- 向量数据库 (Milvus/Weaviate)
✅ 验收标准
搭建一个“个人知识库助手”。用户上传PDF,系统自动切分存入向量库,用户提问后基于文档内容回答,并标注引用的段落来源。
4-5周
阶段三:Agent智能体与工具编排
让LLM具备“手”和“脚”,能够与外部世界交互,处理复杂任务。
关键知识点
- Agent Patterns (ReAct)
- 工具调用 (Function Calling)
- MCP 标准 (Model Context Protocol)
✅ 验收标准
开发一个“旅行策划Agent”。它能根据用户模糊需求,调用“天气查询”、“航班搜索”、“酒店预订”三个不同的工具,最终生成一份包含价格预算的行程单。
3-4周
阶段四:知识图谱与GraphRAG
引入结构化知识,解决复杂关系推理问题。
关键知识点
- 图数据库 (Neo4j & Cypher)
- GraphRAG 实现
✅ 验收标准
构建一个简单的“企业股权穿透图谱”。输入多份企业财报文本,自动抽取“股东-持股-公司”关系存入Neo4j,并能回答“A公司的实际控制人是谁?”这类问题。
3周
阶段五:模型微调与训练
掌握定制化模型的能力,不仅限于Prompt调优。
关键知识点
- 高效微调 (PEFT/LoRA)
- 指令微调数据构建
✅ 验收标准
基于Llama3或Qwen模型,使用LoRA微调一个“法律文书助手”。输入案情描述,微调后的模型能按标准法律格式输出起诉状草稿。
持续进行
阶段六:企业级集成、部署与可观测性
将Demo转化为高可用、可监控的生产服务。
关键知识点
- 高并发推理 (vLLM)
- 可观测性 (LangSmith/Phoenix)
✅ 验收标准
将之前的“旅行策划Agent”容器化,部署到K8s中,配置Grafana监控面板显示QPS与Token使用量,并接入LangSmith查看完整的调用Trace。