建议学习路线

从基础到进阶，每个阶段都以产出一个可运行的项目为完成标准。

1-2周

阶段零：AI驱动开发与效能跃迁

掌握Cursor/Windsurf等AI IDE与指令驱动开发模式，实现10倍开发提效。

标记为已完成

关键知识点

AI IDE 实战 (Cursor/Windsurf)
指令驱动开发 (PDD)
自动化工作流 (n8n)

✅ 验收标准

不写一行代码，仅通过Prompt和Cursor完成一个包含数据库的Todo List全栈应用开发与部署。

2-3周

阶段一：工程基础与NLP入门

夯实Python工程能力，理解现代NLP的基本概念。

标记为已完成

关键知识点

Python 进阶 (Type Hinting & Pydantic)
API 开发 (FastAPI)
NLP 基础 (Tokenization & Embedding)

✅ 验收标准

使用FastAPI写一个简单的文本分类API，输入文本，调用Hugging Face的小模型进行情感分析，返回JSON结果，并包含Swagger文档。

3-4周

阶段二：LLM应用与RAG实战

掌握Prompt Engineering，学会使用向量数据库解决大模型幻觉问题。

标记为已完成

关键知识点

Prompt Engineering (CoT & Structured)
RAG Pipeline (Chunking & Retrieval)
向量数据库 (Milvus/Weaviate)

✅ 验收标准

搭建一个“个人知识库助手”。用户上传PDF，系统自动切分存入向量库，用户提问后基于文档内容回答，并标注引用的段落来源。

4-5周

阶段三：Agent智能体与工具编排

让LLM具备“手”和“脚”，能够与外部世界交互，处理复杂任务。

标记为已完成

关键知识点

Agent Patterns (ReAct)
工具调用 (Function Calling)
MCP 标准 (Model Context Protocol)

✅ 验收标准

开发一个“旅行策划Agent”。它能根据用户模糊需求，调用“天气查询”、“航班搜索”、“酒店预订”三个不同的工具，最终生成一份包含价格预算的行程单。

3-4周

阶段四：知识图谱与GraphRAG

引入结构化知识，解决复杂关系推理问题。

标记为已完成

关键知识点

图数据库 (Neo4j & Cypher)
GraphRAG 实现

✅ 验收标准

构建一个简单的“企业股权穿透图谱”。输入多份企业财报文本，自动抽取“股东-持股-公司”关系存入Neo4j，并能回答“A公司的实际控制人是谁？”这类问题。

3周

阶段五：模型微调与训练

掌握定制化模型的能力，不仅限于Prompt调优。

标记为已完成

关键知识点

高效微调 (PEFT/LoRA)
指令微调数据构建

✅ 验收标准

基于Llama3或Qwen模型，使用LoRA微调一个“法律文书助手”。输入案情描述，微调后的模型能按标准法律格式输出起诉状草稿。

持续进行

阶段六：企业级集成、部署与可观测性

将Demo转化为高可用、可监控的生产服务。

标记为已完成

关键知识点

高并发推理 (vLLM)
可观测性 (LangSmith/Phoenix)

✅ 验收标准

将之前的“旅行策划Agent”容器化，部署到K8s中，配置Grafana监控面板显示QPS与Token使用量，并接入LangSmith查看完整的调用Trace。