建议学习路线

从基础到进阶,每个阶段都以产出一个可运行的项目为完成标准。

1-2周
阶段零:AI驱动开发与效能跃迁
掌握Cursor/Windsurf等AI IDE与指令驱动开发模式,实现10倍开发提效。

关键知识点

  • AI IDE 实战 (Cursor/Windsurf)
  • 指令驱动开发 (PDD)
  • 自动化工作流 (n8n)

✅ 验收标准

不写一行代码,仅通过Prompt和Cursor完成一个包含数据库的Todo List全栈应用开发与部署。

2-3周
阶段一:工程基础与NLP入门
夯实Python工程能力,理解现代NLP的基本概念。

关键知识点

  • Python 进阶 (Type Hinting & Pydantic)
  • API 开发 (FastAPI)
  • NLP 基础 (Tokenization & Embedding)

✅ 验收标准

使用FastAPI写一个简单的文本分类API,输入文本,调用Hugging Face的小模型进行情感分析,返回JSON结果,并包含Swagger文档。

3-4周
阶段二:LLM应用与RAG实战
掌握Prompt Engineering,学会使用向量数据库解决大模型幻觉问题。

关键知识点

  • Prompt Engineering (CoT & Structured)
  • RAG Pipeline (Chunking & Retrieval)
  • 向量数据库 (Milvus/Weaviate)

✅ 验收标准

搭建一个“个人知识库助手”。用户上传PDF,系统自动切分存入向量库,用户提问后基于文档内容回答,并标注引用的段落来源。

4-5周
阶段三:Agent智能体与工具编排
让LLM具备“手”和“脚”,能够与外部世界交互,处理复杂任务。

关键知识点

  • Agent Patterns (ReAct)
  • 工具调用 (Function Calling)
  • MCP 标准 (Model Context Protocol)

✅ 验收标准

开发一个“旅行策划Agent”。它能根据用户模糊需求,调用“天气查询”、“航班搜索”、“酒店预订”三个不同的工具,最终生成一份包含价格预算的行程单。

3-4周
阶段四:知识图谱与GraphRAG
引入结构化知识,解决复杂关系推理问题。

关键知识点

  • 图数据库 (Neo4j & Cypher)
  • GraphRAG 实现

✅ 验收标准

构建一个简单的“企业股权穿透图谱”。输入多份企业财报文本,自动抽取“股东-持股-公司”关系存入Neo4j,并能回答“A公司的实际控制人是谁?”这类问题。

3周
阶段五:模型微调与训练
掌握定制化模型的能力,不仅限于Prompt调优。

关键知识点

  • 高效微调 (PEFT/LoRA)
  • 指令微调数据构建

✅ 验收标准

基于Llama3或Qwen模型,使用LoRA微调一个“法律文书助手”。输入案情描述,微调后的模型能按标准法律格式输出起诉状草稿。

持续进行
阶段六:企业级集成、部署与可观测性
将Demo转化为高可用、可监控的生产服务。

关键知识点

  • 高并发推理 (vLLM)
  • 可观测性 (LangSmith/Phoenix)

✅ 验收标准

将之前的“旅行策划Agent”容器化,部署到K8s中,配置Grafana监控面板显示QPS与Token使用量,并接入LangSmith查看完整的调用Trace。