技术分享:LLM 工程实践清单(2025)

·
技术技术分享AILLM

文章摘要

暂无摘要

背景

2025 年,LLM 技术在产品化中逐渐稳定,但工程挑战仍然存在:数据准备、检索增强(RAG)、结构化输出、评估与观测、成本治理与安全合规。本清单旨在帮助工程团队快速校验关键环节。

清单

  • 数据
    • 选择可用的知识来源与更新策略
    • 切分策略(按语义/结构/任务)
    • 向量化维度、阈值与归一
  • 检索
    • 多路召回(BM25 + 向量 + 规则)
    • 重排序(小模型/交叉编码器)
    • 约束(来源、时间、权限)
  • 提示
    • 输入/输出契约(JSON Schema)
    • 模板版本管理(SemVer)
    • 少样本/偏差控制/抗越狱
  • 工具
    • 工具边界与可见性(只读/只写/资金、消息)
    • 幂等与 dry-run
    • 重试/超时/熔断
  • 评估
    • 任务集(真实任务及变体)
    • 质量:目标达成与引用率
    • 性能:P95 延迟、Token 成本
  • 观测
    • Trace:步骤、提示、工具输入输出
    • 红线与告警:越权、未引用、成本突增
    • 回放:金路径持续回放
  • 成本与安全
    • 成本预算与限额
    • 模型分级:路由/提取/规划用小模型
    • 安全:层级策略与人工升级

参考

  • 多篇近期 Medium 文章与社区实践(均作思想参考)

结语

这份清单可作为迭代中的“最低保障”,结合团队的数据/业务进行裁剪。

评论

暂时还没有评论