AI Models

全球AI模型大全

主流AI模型全家桶，按国家分类，每个模型都有详细介绍：发布时间、公司、技术特点、价格、上下文长度、优缺点和适用人群。

模型总览

全球 AI 大模型形成中美两强格局。

🇺🇸

美国

GPT-4o, Claude, Gemini, Llama, Grok, Mistral

🇨🇳

中国

DeepSeek, Qwen, Kimi, 豆包, GLM, ERNIE, Yi

🇫🇷

法国

Mistral — 欧洲最强，开源友好

🌍

趋势

开源崛起，中国性价比震惊全球

🇺🇸 美国模型

OpenAI GPT 系列

公司：OpenAI | 创始人：Sam Altman | 总部：旧金山

OpenAI 是 AI 浪潮的引领者，ChatGPT 改变了整个行业。

模型	发布时间	上下文	输入价格	输出价格	特点
GPT-4o	2024.05	128K	$2.5/1M	$10/1M	多模态，速度快，性价比高
GPT-4o mini	2024.07	128K	$0.15/1M	$0.6/1M	超便宜，日常够用
o1	2024.09	200K	$15/1M	$60/1M	深度推理，数学编程强
o3-mini	2025.01	200K	$1.1/1M	$4.4/1M	推理能力好，价格适中

优点：综合能力最强，生态最完善（API、插件、GPTs），多模态支持好

缺点：价格较高，中国大陆无法直接使用，有时过于"安全"拒绝回答

适合：企业级应用、需要最强能力的场景、英文为主的应用

Claude (Anthropic)

公司：Anthropic | 创始人：Dario Amodei（前 OpenAI 副总裁） | 总部：旧金山

Anthropic 由 OpenAI 前核心成员创立，以安全和长文本著称。

模型	发布时间	上下文	输入价格	输出价格	特点
Claude 3.5 Sonnet	2024.06	200K	$3/1M	$15/1M	编程极强，性价比优秀
Claude 3.5 Haiku	2024.11	200K	$1/1M	$5/1M	快速轻量，日常够用
Claude 3 Opus	2024.03	200K	$15/1M	$75/1M	最强能力，复杂任务

优点：编程能力顶级，长文本理解好，安全性高，不容易"幻觉"

缺点：中国大陆无法直接使用，多模态能力不如 GPT-4o

适合：程序员（尤其是 Claude + Cursor）、长文档分析、需要高准确性的场景

Gemini (Google)

公司：Google DeepMind | 前身：Bard

模型	上下文	输入价格	输出价格	特点
Gemini 2.0 Flash	1M	$0.1/1M	$0.4/1M	超大上下文，极便宜
Gemini 1.5 Pro	2M	$1.25/1M	$5/1M	200万Token上下文，史上最大

优点：上下文窗口最大（200万Token），价格便宜，可免费使用，多模态强

缺点：中文能力不如 GPT/Claude，API 体验不如 OpenAI

适合：需要超长上下文的场景、预算有限的开发者、Google 生态用户

Grok (xAI)

公司：xAI | 创始人：Elon Musk

Grok 的特色是实时联网（接入 X/Twitter 数据）和不设审查的风格。

适合：需要实时信息、喜欢 Elon Musk 生态的用户

Llama (Meta)

公司：Meta (Facebook) | 特点：完全开源免费

Llama 是最重要的开源模型系列，可以免费下载、商用。

模型	参数量	特点
Llama 3.1 405B	4050亿	最强开源模型之一
Llama 3.1 70B	700亿	性能好，可本地部署
Llama 3.2 3B	30亿	手机上也能跑

优点：免费开源，可本地部署（数据不出境），社区活跃

缺点：需要自己搭建服务器，中文能力比闭源模型弱

适合：企业私有化部署、不想依赖第三方API的场景

🇨🇳 中国模型

DeepSeek（深度求索）

公司：深度求索 | 创始人：梁文锋（幻方量化创始人）

2025年初爆火的中国AI，以极低成本达到接近 GPT-4 的水平，震惊全球。

模型	上下文	API价格	特点
DeepSeek V3	128K	¥2/1M输入，¥8/1M输出	综合能力强，超便宜
DeepSeek R1	128K	¥4/1M输入，¥16/1M输出	深度推理，数学/编程顶级

优点：价格极低（GPT-4 的 1/50），开源可部署，中文能力强，推理能力出色

缺点：高峰期 API 不稳定，多模态能力弱，服务偶尔过载

适合：中文用户首选、预算有限的开发者、需要推理能力的场景

通义千问 Qwen（阿里云）

公司：阿里云 | 特点：阿里生态集成

模型	上下文	价格	特点
Qwen2.5-Max	128K	¥2/1M输入	阿里最强模型
Qwen2.5-72B	128K	开源免费	开源版本，可本地部署
Qwen-VL-Max	128K	¥3/1M输入	多模态，能看图

优点：中文能力强，阿里云生态完善，开源版本质量高

缺点：英文能力不如 GPT/Claude，API 文档不如 OpenAI 清晰

Kimi（月之暗面）

公司：月之暗面 (Moonshot AI) | 创始人：杨植麟

Kimi 以超长上下文闻名，最早支持 200K Token，擅长读长文档。

优点：长文本理解好，中文能力强，有免费额度，产品体验好

缺点：API 能力不如 DeepSeek/Qwen，英文较弱

适合：需要阅读长文档、中文写作、日常聊天

豆包 Doubao（字节跳动）

公司：字节跳动 | 背景：抖音母公司

豆包是字节跳动的 AI 产品，背后用的是云雀大模型。API 价格极低。

优点：价格极低（比 DeepSeek 还便宜），字节生态集成，产品形态丰富

缺点：模型能力不是最强，API 灵活度不如 OpenAI

GLM（智谱 AI）

公司：智谱 AI | 背景：清华大学团队

GLM 系列是中国最早的对话模型之一，学术背景深厚。

优点：学术背景扎实，开源版本可用，支持工具调用

缺点：产品体验不如竞品，生态不如阿里/字节

文心 ERNIE（百度）

公司：百度 | 产品名：文心一言

百度的 AI 大模型，深度集成百度搜索和百度生态。

优点：中文理解好（百度搜索数据加持），百度生态集成

缺点：API 体验一般，国际影响力弱

Yi（零一万物）

公司：零一万物 | 创始人：李开复

李开复创办的 AI 公司，模型开源为主。

🇫🇷 欧洲模型

Mistral（法国）

公司：Mistral AI | 总部：巴黎 | 创始人：前 Meta 和 Google DeepMind 研究员

欧洲最强的 AI 公司，以高效小模型和开源精神著称。

模型	参数量	特点
Mistral Large	未公开	旗舰模型，能力接近 GPT-4
Mistral 7B	70亿	小而精，本地可跑
Mixtral 8x7B	46.7亿激活	MoE架构，效率极高

优点：开源友好，模型效率高，欧洲数据合规

缺点：中文能力弱，生态不如 OpenAI

对比总结

维度	最强	最便宜	中文最好	开源最好
综合	GPT-4o / Claude 3.5	Gemini Flash / 豆包	DeepSeek / Qwen	Llama / Qwen
编程	Claude 3.5 Sonnet	DeepSeek V3	DeepSeek	DeepSeek Coder
推理	o1 / DeepSeek R1	DeepSeek R1	DeepSeek R1	DeepSeek R1
长文本	Gemini 1.5 Pro (2M)	Gemini Flash	Kimi	Yi / Qwen
多模态	GPT-4o	Gemini Flash	Qwen-VL	Qwen-VL

怎么选模型？

👑最强综合

GPT-4o / Claude 3.5

💰中文+便宜

DeepSeek V3

🧮推理/数学

DeepSeek R1 / o3-mini

📚超长文档

Gemini Pro / Kimi

🖥️本地部署

Llama / Qwen / DeepSeek

💬免费聊天

豆包 / Kimi / 通义千问

← 上一节

认识AI

AI工具大全