AI Dictionary

AI词典

AI 领域的百科全书。每个术语都有通俗解释、类比和实际应用。按 A-Z 排列。

A

Agent（智能体）

能自主思考、规划和行动的AI系统。不只是回答问题，还能使用工具、记住信息、完成复杂任务。详见 Agent学院。

AGI（Artificial General Intelligence，通用人工智能）

像人一样什么都能做的AI。目前还不存在，是 AI 研究的终极目标。现在的 AI 都属于"窄AI"（只能做特定任务）。

AIGC（AI Generated Content，AI生成内容）

用 AI 生成的文字、图片、视频、音乐、代码等内容。ChatGPT 生成文字、Midjourney 生成图片，都属于 AIGC。

API（Application Programming Interface，应用程序编程接口）

程序和程序之间的"对话规则"。详见 API学院。

Attention（注意力机制）

Transformer 的核心创新。让 AI 能判断句子中哪些词之间有关系。比如"小明把书放在桌上，因为它太重了"，注意力机制能让 AI 知道"它"指的是"书"。

B

Benchmark（基准测试）

用来衡量 AI 模型能力的标准化测试。就像学生的考试，不同的 benchmark 测试不同能力（语言理解、数学、编程等）。常见的有 MMLU、HumanEval、GSM8K。

Bot（机器人）

能自动执行任务的程序。聊天机器人（Chatbot）是最常见的类型。

C

ChatGPT

OpenAI 开发的 AI 聊天产品，基于 GPT 模型。2022 年 11 月发布后迅速走红，让 AI 走向大众。

Context（上下文）

AI 在对话中能"看到"的所有内容。上下文越大，AI 能参考的信息越多。

Context Window（上下文窗口）

模型一次能处理的最大 Token 数。GPT-4o 有 128K，Claude 3.5 有 200K，Gemini 1.5 Pro 有 200万。

CoT（Chain-of-Thought，思维链）

让 AI 一步步思考的 Prompt 技巧。加上"请一步一步思考"就能激活。详见 Prompt学院。

D

Deep Learning（深度学习）

使用多层神经网络的机器学习方法。"深度"指网络层数多。是现代 AI 的基础。

DeepSeek（深度求索）

中国的 AI 公司，以极低成本达到接近 GPT-4 的水平。详见模型大全。

Dify

最流行的开源 LLM 应用开发平台。可视化搭建 AI 工作流和知识库。详见 Agent学院。

E

Embedding（嵌入/向量化）

把文字转换成一串数字（向量）的技术。意思相近的文字，向量距离近。用于搜索、推荐、RAG。详见 AI基础。

Epoch（训练轮次）

模型把所有训练数据完整学习一遍叫一个 Epoch。通常训练多个 Epoch 效果更好，但太多会过拟合。

F

Fine-tuning（微调）

在预训练模型的基础上，用特定领域数据进一步训练。比如用法律文书微调，让模型更懂法律。比从零训练便宜得多。

Few-shot（少样本提示）

在 Prompt 中给 AI 几个例子，让它学会你想要的格式。详见 Prompt学院。

Function Calling（函数调用）

让 LLM 能调用外部函数的能力。AI 不直接执行函数，而是输出函数调用的 JSON，由你的程序执行。详见 AI基础。

G

GPT（Generative Pre-trained Transformer）

OpenAI 的模型系列。核心思想：先用海量数据预训练，再用于各种任务。GPT 的本质是"预测下一个词"。

GPU（Graphics Processing Unit，图形处理器）

显卡的核心芯片。AI 训练和推理都需要大量 GPU 计算。一张 NVIDIA H100 显卡约 25 万元。

H — L

Hallucination（幻觉）

AI 一本正经地编造不存在的信息。比如编造不存在的论文、虚构数据。这是 LLM 最大的问题之一。

Inference（推理）

用训练好的模型处理新数据、生成回答的过程。和 Training（训练）相对。你用 ChatGPT 聊天就是在做 Inference。

Latency（延迟）

从发送请求到收到回答的时间。延迟越低体验越好。Streaming 可以降低感知延迟。

LLM（Large Language Model，大语言模型）

参数量很大、专门处理语言的 AI 模型。GPT、Claude、DeepSeek 都是 LLM。详见 AI基础。

M

MCP（Model Context Protocol，模型上下文协议）

Anthropic 提出的开放标准，让 AI 能统一连接各种工具和数据源。就像 USB 接口。详见 Agent学院。

Memory（记忆）

AI 记住信息的能力。短期记忆 = 当前对话上下文；长期记忆 = 持久化存储的信息。

Multi-modal（多模态）

能同时处理文字、图片、音频、视频等多种类型数据的 AI 模型。GPT-4o、Gemini 都是多模态模型。

N — O

Neural Network（神经网络）

模仿人脑结构的计算模型，由多层"神经元"组成。每一层处理一部分信息，传给下一层。

OpenAI

ChatGPT 和 GPT 系列的开发公司。由 Sam Altman 领导，是 AI 浪潮的引领者。

Open Source（开源）

代码公开，任何人可以免费使用和修改。Llama、Qwen、DeepSeek 都有开源版本。

P

Prompt（提示词）

给 AI 的指令。Prompt 的质量直接决定 AI 输出的质量。详见 Prompt学院。

Pre-training（预训练）

用海量数据训练模型的基础能力。GPT 的"PT"中的"T"就是 Transformer，"P"就是 Pre-trained。

Python

AI 领域最流行的编程语言。几乎所有 AI 框架和 SDK 都优先支持 Python。

R

RAG（Retrieval-Augmented Generation，检索增强生成）

先搜资料，再回答问题。解决 LLM 知识截止和幻觉问题的核心技术。详见 AI基础。

Reinforcement Learning（强化学习）

通过试错学习的方法。做对给奖励，做错给惩罚。AlphaGo 就是用强化学习训练的。

RLHF（Reinforcement Learning from Human Feedback）

用人类反馈来训练 AI 的方法。人类标注员对 AI 的回答打分，AI 学会生成人类更喜欢的回答。ChatGPT 就用了 RLHF。

S

SDK（Software Development Kit，软件开发工具包）

帮你更方便地调用 API 的工具包。详见 API学院。

Streaming（流式输出）

AI 边生成边返回，而不是等全部生成完。你用 ChatGPT 时文字一个字蹦出来就是 Streaming。

SSE（Server-Sent Events）

实现流式输出的技术。服务器不断推送数据，客户端只管接收。

T

Token

LLM 处理文字的最小单位。1 个中文字 ≈ 1-2 Token，1 个英文单词 ≈ 1-1.5 Token。详见 AI基础。

Temperature（温度）

控制 AI 回答随机性的参数。0 = 最确定，1 = 最随机。编程用低温度，创作用高温度。

Training（训练）

用数据教会 AI 模型的过程。需要大量 GPU 和数据，花费几百万到几千万美元。

Transformer

2017 年 Google 提出的神经网络架构。基于注意力机制，是几乎所有现代 AI 模型的基础。详见 AI基础。

V — Z

Vector Database（向量数据库）

专门存储和检索向量的数据库。RAG 系统用它来快速找到最相关的文档。常见的有 Pinecone、Milvus、Chroma。

Vibe Coding（氛围编程）

用自然语言描述需求，让 AI 写代码的编程方式。不关心代码细节，只关心结果。Cursor、Bolt.new 是典型工具。

Workflow（工作流）

多个 AI 步骤串联的自动化流程。详见 Agent学院。

Zero-shot（零样本提示）

不给任何例子，直接让 AI 做任务。现代大模型的 Zero-shot 能力已经很强。

← 上一节

AI案例库

AI新闻中心