大模型 LLM 与 AI Coding — 知识详解
更新: 5/15/2026 字数: 0 字 时长: 0 分钟
内容较多,已拆分为独立文件:
- llm-fundamentals.md — Transformer 架构、注意力机制、Token 与分词、训练三阶段(预训练/SFT/RLHF)、推理过程、上下文窗口
- ai-coding-deep.md — AI Coding 原理(代码补全/对话式编程/Agent)、RAG 与代码检索、Prompt Engineering、Function Calling 与 MCP、AI Coding 工具架构
1. 为什么 Android 开发者需要了解 LLM
- AI Coding 工具(Cursor、Claude Code、GitHub Copilot)已成为日常开发工具
- 理解 LLM 原理有助于更好地使用这些工具(写出更好的 Prompt、理解工具的局限性)
- 越来越多的 App 需要集成 AI 能力(端侧模型、API 调用)
- 面试中 AI 相关问题越来越常见
2. 核心概念速览
LLM(Large Language Model):大语言模型,通过海量文本训练,能理解和生成自然语言/代码
Transformer:LLM 的核心架构,基于注意力机制
Token:模型处理文本的最小单位(不是字,不是词,是子词片段)
Prompt:你给模型的输入(提示词)
Context Window:模型一次能处理的最大 Token 数
Inference:推理,模型根据输入生成输出的过程
Fine-tuning:微调,在预训练模型基础上用特定数据继续训练
RAG:检索增强生成,先检索相关文档再让模型生成回答
Agent:让模型使用工具、执行多步任务的框架
Function Calling:模型调用外部函数/API 的能力
MCP:Model Context Protocol,标准化的模型-工具交互协议