AI Dictionary

AI词典

AI 领域的百科全书。每个术语都有通俗解释、类比和实际应用。按 A-Z 排列。

A

Agent(智能体)

能自主思考、规划和行动的AI系统。不只是回答问题,还能使用工具、记住信息、完成复杂任务。详见 Agent学院

AGI(Artificial General Intelligence,通用人工智能)

像人一样什么都能做的AI。目前还不存在,是 AI 研究的终极目标。现在的 AI 都属于"窄AI"(只能做特定任务)。

AIGC(AI Generated Content,AI生成内容)

用 AI 生成的文字、图片、视频、音乐、代码等内容。ChatGPT 生成文字、Midjourney 生成图片,都属于 AIGC。

API(Application Programming Interface,应用程序编程接口)

程序和程序之间的"对话规则"。详见 API学院

Attention(注意力机制)

Transformer 的核心创新。让 AI 能判断句子中哪些词之间有关系。比如"小明把书放在桌上,因为它太重了",注意力机制能让 AI 知道"它"指的是"书"。


B

Benchmark(基准测试)

用来衡量 AI 模型能力的标准化测试。就像学生的考试,不同的 benchmark 测试不同能力(语言理解、数学、编程等)。常见的有 MMLU、HumanEval、GSM8K。

Bot(机器人)

能自动执行任务的程序。聊天机器人(Chatbot)是最常见的类型。


C

ChatGPT

OpenAI 开发的 AI 聊天产品,基于 GPT 模型。2022 年 11 月发布后迅速走红,让 AI 走向大众。

Context(上下文)

AI 在对话中能"看到"的所有内容。上下文越大,AI 能参考的信息越多。

Context Window(上下文窗口)

模型一次能处理的最大 Token 数。GPT-4o 有 128K,Claude 3.5 有 200K,Gemini 1.5 Pro 有 200万。

CoT(Chain-of-Thought,思维链)

让 AI 一步步思考的 Prompt 技巧。加上"请一步一步思考"就能激活。详见 Prompt学院


D

Deep Learning(深度学习)

使用多层神经网络的机器学习方法。"深度"指网络层数多。是现代 AI 的基础。

DeepSeek(深度求索)

中国的 AI 公司,以极低成本达到接近 GPT-4 的水平。详见 模型大全

Dify

最流行的开源 LLM 应用开发平台。可视化搭建 AI 工作流和知识库。详见 Agent学院


E

Embedding(嵌入/向量化)

把文字转换成一串数字(向量)的技术。意思相近的文字,向量距离近。用于搜索、推荐、RAG。详见 AI基础

Epoch(训练轮次)

模型把所有训练数据完整学习一遍叫一个 Epoch。通常训练多个 Epoch 效果更好,但太多会过拟合。


F

Fine-tuning(微调)

在预训练模型的基础上,用特定领域数据进一步训练。比如用法律文书微调,让模型更懂法律。比从零训练便宜得多。

Few-shot(少样本提示)

在 Prompt 中给 AI 几个例子,让它学会你想要的格式。详见 Prompt学院

Function Calling(函数调用)

让 LLM 能调用外部函数的能力。AI 不直接执行函数,而是输出函数调用的 JSON,由你的程序执行。详见 AI基础


G

GPT(Generative Pre-trained Transformer)

OpenAI 的模型系列。核心思想:先用海量数据预训练,再用于各种任务。GPT 的本质是"预测下一个词"。

GPU(Graphics Processing Unit,图形处理器)

显卡的核心芯片。AI 训练和推理都需要大量 GPU 计算。一张 NVIDIA H100 显卡约 25 万元。


H — L

Hallucination(幻觉)

AI 一本正经地编造不存在的信息。比如编造不存在的论文、虚构数据。这是 LLM 最大的问题之一。

Inference(推理)

用训练好的模型处理新数据、生成回答的过程。和 Training(训练)相对。你用 ChatGPT 聊天就是在做 Inference。

Latency(延迟)

从发送请求到收到回答的时间。延迟越低体验越好。Streaming 可以降低感知延迟。

LLM(Large Language Model,大语言模型)

参数量很大、专门处理语言的 AI 模型。GPT、Claude、DeepSeek 都是 LLM。详见 AI基础


M

MCP(Model Context Protocol,模型上下文协议)

Anthropic 提出的开放标准,让 AI 能统一连接各种工具和数据源。就像 USB 接口。详见 Agent学院

Memory(记忆)

AI 记住信息的能力。短期记忆 = 当前对话上下文;长期记忆 = 持久化存储的信息。

Multi-modal(多模态)

能同时处理文字、图片、音频、视频等多种类型数据的 AI 模型。GPT-4o、Gemini 都是多模态模型。


N — O

Neural Network(神经网络)

模仿人脑结构的计算模型,由多层"神经元"组成。每一层处理一部分信息,传给下一层。

OpenAI

ChatGPT 和 GPT 系列的开发公司。由 Sam Altman 领导,是 AI 浪潮的引领者。

Open Source(开源)

代码公开,任何人可以免费使用和修改。Llama、Qwen、DeepSeek 都有开源版本。


P

Prompt(提示词)

给 AI 的指令。Prompt 的质量直接决定 AI 输出的质量。详见 Prompt学院

Pre-training(预训练)

用海量数据训练模型的基础能力。GPT 的"PT"中的"T"就是 Transformer,"P"就是 Pre-trained。

Python

AI 领域最流行的编程语言。几乎所有 AI 框架和 SDK 都优先支持 Python。


R

RAG(Retrieval-Augmented Generation,检索增强生成)

先搜资料,再回答问题。解决 LLM 知识截止和幻觉问题的核心技术。详见 AI基础

Reinforcement Learning(强化学习)

通过试错学习的方法。做对给奖励,做错给惩罚。AlphaGo 就是用强化学习训练的。

RLHF(Reinforcement Learning from Human Feedback)

用人类反馈来训练 AI 的方法。人类标注员对 AI 的回答打分,AI 学会生成人类更喜欢的回答。ChatGPT 就用了 RLHF。


S

SDK(Software Development Kit,软件开发工具包)

帮你更方便地调用 API 的工具包。详见 API学院

Streaming(流式输出)

AI 边生成边返回,而不是等全部生成完。你用 ChatGPT 时文字一个字蹦出来就是 Streaming。

SSE(Server-Sent Events)

实现流式输出的技术。服务器不断推送数据,客户端只管接收。


T

Token

LLM 处理文字的最小单位。1 个中文字 ≈ 1-2 Token,1 个英文单词 ≈ 1-1.5 Token。详见 AI基础

Temperature(温度)

控制 AI 回答随机性的参数。0 = 最确定,1 = 最随机。编程用低温度,创作用高温度。

Training(训练)

用数据教会 AI 模型的过程。需要大量 GPU 和数据,花费几百万到几千万美元。

Transformer

2017 年 Google 提出的神经网络架构。基于注意力机制,是几乎所有现代 AI 模型的基础。详见 AI基础


V — Z

Vector Database(向量数据库)

专门存储和检索向量的数据库。RAG 系统用它来快速找到最相关的文档。常见的有 Pinecone、Milvus、Chroma。

Vibe Coding(氛围编程)

用自然语言描述需求,让 AI 写代码的编程方式。不关心代码细节,只关心结果。Cursor、Bolt.new 是典型工具。

Workflow(工作流)

多个 AI 步骤串联的自动化流程。详见 Agent学院

Zero-shot(零样本提示)

不给任何例子,直接让 AI 做任务。现代大模型的 Zero-shot 能力已经很强。