编程相关 LLM 概念速查
Token
代码 token 示例:"def hello_world():" → ["def", " hello", "_world", "()", ":"]
简洁注释 + 类型注解比冗长描述更省 token。
上下文窗口
| 模型 | 上下文 | ~代码行数 |
|---|---|---|
| Claude Sonnet 4 | 200K | ~50K 行 |
| GPT-4o | 128K | ~30K 行 |
| Gemini 1.5 Pro | 1M | ~250K 行 |
超出部分 AI 无法感知。用 .claudeignore 排除无关文件。
Temperature
0— 确定性,代码生成推荐0.7— 适度创造性,文档编写1.0— 高随机,头脑风暴
幻觉(Hallucination)
常见表现:调用不存在的 API、错误的参数类型、虚构配置项。
避免:提供具体库版本,要求标注不确定部分,始终测试。
Tool Use / Function Calling
AI 编程代理的核心能力:判断需要什么工具 → 调用 → 获取结果 → 继续推理。
模型选择
| 任务 | 推荐 |
|---|---|
| 日常编程 | Sonnet 4 |
| 复杂架构 | Opus 4 |
| 代码补全 | Haiku 3.5 |
| 大型项目 | Claude (200K) |