一场面向核心管理者的 AI 技术分享:保留关键技术术语,但用可以被业务领导理解的方式解释它们。
AI 的本质不是“机器会思考”,而是用数据训练出可泛化的函数,再把这个函数接入工具、知识和流程。
理解这条主线,就能判断什么是泡沫,什么会真正改变组织。
传统程序是 rules + data → answer。机器学习反过来:给它大量 data + answer,让它学习一组可复用的 parameters。
有标注的历史样本。
模型先给一个预测。
衡量预测和真实答案差多远。
沿着让错误变小的方向更新参数。
在新样本上也能做对。
所谓“深”,不是神秘,而是网络有很多层。底层学简单模式,中层组合模式,高层学习抽象概念。
“退款”“退钱”“refund”在向量空间里距离更近。
不同语言表达可以被映射到相似位置。
RAG 和语义搜索都依赖 embedding 做相似度匹配。
关键词:embedding、vector space、cosine similarity
Self-Attention 会为上下文中的每个 token 分配权重:哪些词重要,哪些词之间有关联。
LLM 的训练目标通常很简单:给定上下文,预测下一个 token。但为了预测得好,它必须学习语法、知识、推理模式和表达风格。
模型输出的是概率分布,不是确定真理。
从互联网、书籍、代码等大规模语料中学习通用能力。
用问答、任务指令和示范答案,让模型学会“按要求做事”。
通过人类或 AI 偏好反馈,让输出更有帮助、更安全、更符合预期。
参数量、数据量、算力共同推动能力提升;但模型越大,不代表每个业务场景都越划算。
模型在生成“高概率文本”,不是直接查事实库。
编造来源、混淆政策、过度自信、忽略边界条件。
RAG、引用、验证器、权限控制、人审和日志。
所以 AI 系统设计的重点不是“让模型永远不犯错”,而是让错误可发现、可纠正、可追责。
Retrieval-Augmented Generation 的核心是:先从可信知识库检索,再把检索结果放进上下文,让模型基于证据回答。
用户问题
向量/关键词检索
排序与过滤
带引用生成
质量反馈
我们给模型的任务说明、背景和约束。
模型当前能看到的材料,包括历史对话、文档、工具结果。
上下文越长,不代表注意力越均匀;关键信息仍要结构化。
LLM 本身只会生成文本;Agent 把它接到工具、记忆、权限和任务状态上,让它能多步完成工作。
查最新信息。
读取结构化事实。
执行真实动作。
检查输出是否达标。
关键原则:高风险工具必须有权限、审批、dry-run、日志和回滚。
它更像一个可审计的工作流系统:任务、状态、工具调用、证据、失败原因都要留下来。
从“写每一段内容”转向定义目标、审查结果、补充上下文。
从经验分散在个人脑中,转向知识库、评测集和流程沉淀。
从盯执行进度,转向设计目标函数、风险边界和质量闭环。
总结、翻译、知识问答、会议纪要、培训材料。
方案建议、异常归因、运营复盘、客服分流。
涉及钱、用户权益、规则处罚、预算动作时,需要审批和回滚。
这里可以自然带到 Keeta:跨语言、跨时区、跨规则的业务,会优先受益于“知识一致性”和“任务自动化”。
真正重要的不是“哪个模型最强”,而是我们能不能把模型能力接入知识、工具、流程和治理,变成可靠的组织能力。