AI词典
AI 领域的百科全书。每个术语都有通俗解释、类比和实际应用。按 A-Z 排列。
A
Agent(智能体)
能自主思考、规划和行动的AI系统。不只是回答问题,还能使用工具、记住信息、完成复杂任务。详见 Agent学院。
AGI(Artificial General Intelligence,通用人工智能)
像人一样什么都能做的AI。目前还不存在,是 AI 研究的终极目标。现在的 AI 都属于"窄AI"(只能做特定任务)。
AIGC(AI Generated Content,AI生成内容)
用 AI 生成的文字、图片、视频、音乐、代码等内容。ChatGPT 生成文字、Midjourney 生成图片,都属于 AIGC。
API(Application Programming Interface,应用程序编程接口)
程序和程序之间的"对话规则"。详见 API学院。
Attention(注意力机制)
Transformer 的核心创新。让 AI 能判断句子中哪些词之间有关系。比如"小明把书放在桌上,因为它太重了",注意力机制能让 AI 知道"它"指的是"书"。
B
Benchmark(基准测试)
用来衡量 AI 模型能力的标准化测试。就像学生的考试,不同的 benchmark 测试不同能力(语言理解、数学、编程等)。常见的有 MMLU、HumanEval、GSM8K。
Bot(机器人)
能自动执行任务的程序。聊天机器人(Chatbot)是最常见的类型。
C
ChatGPT
OpenAI 开发的 AI 聊天产品,基于 GPT 模型。2022 年 11 月发布后迅速走红,让 AI 走向大众。
Context(上下文)
AI 在对话中能"看到"的所有内容。上下文越大,AI 能参考的信息越多。
Context Window(上下文窗口)
模型一次能处理的最大 Token 数。GPT-4o 有 128K,Claude 3.5 有 200K,Gemini 1.5 Pro 有 200万。
CoT(Chain-of-Thought,思维链)
让 AI 一步步思考的 Prompt 技巧。加上"请一步一步思考"就能激活。详见 Prompt学院。
D
Deep Learning(深度学习)
使用多层神经网络的机器学习方法。"深度"指网络层数多。是现代 AI 的基础。
DeepSeek(深度求索)
中国的 AI 公司,以极低成本达到接近 GPT-4 的水平。详见 模型大全。
Dify
最流行的开源 LLM 应用开发平台。可视化搭建 AI 工作流和知识库。详见 Agent学院。
E
Embedding(嵌入/向量化)
把文字转换成一串数字(向量)的技术。意思相近的文字,向量距离近。用于搜索、推荐、RAG。详见 AI基础。
Epoch(训练轮次)
模型把所有训练数据完整学习一遍叫一个 Epoch。通常训练多个 Epoch 效果更好,但太多会过拟合。
F
Fine-tuning(微调)
在预训练模型的基础上,用特定领域数据进一步训练。比如用法律文书微调,让模型更懂法律。比从零训练便宜得多。
Few-shot(少样本提示)
在 Prompt 中给 AI 几个例子,让它学会你想要的格式。详见 Prompt学院。
Function Calling(函数调用)
让 LLM 能调用外部函数的能力。AI 不直接执行函数,而是输出函数调用的 JSON,由你的程序执行。详见 AI基础。
G
GPT(Generative Pre-trained Transformer)
OpenAI 的模型系列。核心思想:先用海量数据预训练,再用于各种任务。GPT 的本质是"预测下一个词"。
GPU(Graphics Processing Unit,图形处理器)
显卡的核心芯片。AI 训练和推理都需要大量 GPU 计算。一张 NVIDIA H100 显卡约 25 万元。
H — L
Hallucination(幻觉)
AI 一本正经地编造不存在的信息。比如编造不存在的论文、虚构数据。这是 LLM 最大的问题之一。
Inference(推理)
用训练好的模型处理新数据、生成回答的过程。和 Training(训练)相对。你用 ChatGPT 聊天就是在做 Inference。
Latency(延迟)
从发送请求到收到回答的时间。延迟越低体验越好。Streaming 可以降低感知延迟。
LLM(Large Language Model,大语言模型)
参数量很大、专门处理语言的 AI 模型。GPT、Claude、DeepSeek 都是 LLM。详见 AI基础。
M
MCP(Model Context Protocol,模型上下文协议)
Anthropic 提出的开放标准,让 AI 能统一连接各种工具和数据源。就像 USB 接口。详见 Agent学院。
Memory(记忆)
AI 记住信息的能力。短期记忆 = 当前对话上下文;长期记忆 = 持久化存储的信息。
Multi-modal(多模态)
能同时处理文字、图片、音频、视频等多种类型数据的 AI 模型。GPT-4o、Gemini 都是多模态模型。
N — O
Neural Network(神经网络)
模仿人脑结构的计算模型,由多层"神经元"组成。每一层处理一部分信息,传给下一层。
OpenAI
ChatGPT 和 GPT 系列的开发公司。由 Sam Altman 领导,是 AI 浪潮的引领者。
Open Source(开源)
代码公开,任何人可以免费使用和修改。Llama、Qwen、DeepSeek 都有开源版本。
P
Prompt(提示词)
给 AI 的指令。Prompt 的质量直接决定 AI 输出的质量。详见 Prompt学院。
Pre-training(预训练)
用海量数据训练模型的基础能力。GPT 的"PT"中的"T"就是 Transformer,"P"就是 Pre-trained。
Python
AI 领域最流行的编程语言。几乎所有 AI 框架和 SDK 都优先支持 Python。
R
RAG(Retrieval-Augmented Generation,检索增强生成)
先搜资料,再回答问题。解决 LLM 知识截止和幻觉问题的核心技术。详见 AI基础。
Reinforcement Learning(强化学习)
通过试错学习的方法。做对给奖励,做错给惩罚。AlphaGo 就是用强化学习训练的。
RLHF(Reinforcement Learning from Human Feedback)
用人类反馈来训练 AI 的方法。人类标注员对 AI 的回答打分,AI 学会生成人类更喜欢的回答。ChatGPT 就用了 RLHF。
S
SDK(Software Development Kit,软件开发工具包)
帮你更方便地调用 API 的工具包。详见 API学院。
Streaming(流式输出)
AI 边生成边返回,而不是等全部生成完。你用 ChatGPT 时文字一个字蹦出来就是 Streaming。
SSE(Server-Sent Events)
实现流式输出的技术。服务器不断推送数据,客户端只管接收。
T
Token
LLM 处理文字的最小单位。1 个中文字 ≈ 1-2 Token,1 个英文单词 ≈ 1-1.5 Token。详见 AI基础。
Temperature(温度)
控制 AI 回答随机性的参数。0 = 最确定,1 = 最随机。编程用低温度,创作用高温度。
Training(训练)
用数据教会 AI 模型的过程。需要大量 GPU 和数据,花费几百万到几千万美元。
Transformer
2017 年 Google 提出的神经网络架构。基于注意力机制,是几乎所有现代 AI 模型的基础。详见 AI基础。
V — Z
Vector Database(向量数据库)
专门存储和检索向量的数据库。RAG 系统用它来快速找到最相关的文档。常见的有 Pinecone、Milvus、Chroma。
Vibe Coding(氛围编程)
用自然语言描述需求,让 AI 写代码的编程方式。不关心代码细节,只关心结果。Cursor、Bolt.new 是典型工具。
Workflow(工作流)
多个 AI 步骤串联的自动化流程。详见 Agent学院。
Zero-shot(零样本提示)
不给任何例子,直接让 AI 做任务。现代大模型的 Zero-shot 能力已经很强。