AI Models

全球AI模型大全

主流AI模型全家桶,按国家分类,每个模型都有详细介绍:发布时间、公司、技术特点、价格、上下文长度、优缺点和适用人群。

模型总览

全球 AI 大模型形成中美两强格局。

🇺🇸
美国
GPT-4o, Claude, Gemini, Llama, Grok, Mistral
🇨🇳
中国
DeepSeek, Qwen, Kimi, 豆包, GLM, ERNIE, Yi
🇫🇷
法国
Mistral — 欧洲最强,开源友好
🌍
趋势
开源崛起,中国性价比震惊全球

🇺🇸 美国模型

OpenAI GPT 系列

公司:OpenAI  |  创始人:Sam Altman  |  总部:旧金山

OpenAI 是 AI 浪潮的引领者,ChatGPT 改变了整个行业。

模型发布时间上下文输入价格输出价格特点
GPT-4o2024.05128K$2.5/1M$10/1M多模态,速度快,性价比高
GPT-4o mini2024.07128K$0.15/1M$0.6/1M超便宜,日常够用
o12024.09200K$15/1M$60/1M深度推理,数学编程强
o3-mini2025.01200K$1.1/1M$4.4/1M推理能力好,价格适中

优点:综合能力最强,生态最完善(API、插件、GPTs),多模态支持好

缺点:价格较高,中国大陆无法直接使用,有时过于"安全"拒绝回答

适合:企业级应用、需要最强能力的场景、英文为主的应用


Claude (Anthropic)

公司:Anthropic  |  创始人:Dario Amodei(前 OpenAI 副总裁) |  总部:旧金山

Anthropic 由 OpenAI 前核心成员创立,以安全长文本著称。

模型发布时间上下文输入价格输出价格特点
Claude 3.5 Sonnet2024.06200K$3/1M$15/1M编程极强,性价比优秀
Claude 3.5 Haiku2024.11200K$1/1M$5/1M快速轻量,日常够用
Claude 3 Opus2024.03200K$15/1M$75/1M最强能力,复杂任务

优点:编程能力顶级,长文本理解好,安全性高,不容易"幻觉"

缺点:中国大陆无法直接使用,多模态能力不如 GPT-4o

适合:程序员(尤其是 Claude + Cursor)、长文档分析、需要高准确性的场景


Gemini (Google)

公司:Google DeepMind  |  前身:Bard

模型上下文输入价格输出价格特点
Gemini 2.0 Flash1M$0.1/1M$0.4/1M超大上下文,极便宜
Gemini 1.5 Pro2M$1.25/1M$5/1M200万Token上下文,史上最大

优点:上下文窗口最大(200万Token),价格便宜,可免费使用,多模态强

缺点:中文能力不如 GPT/Claude,API 体验不如 OpenAI

适合:需要超长上下文的场景、预算有限的开发者、Google 生态用户


Grok (xAI)

公司:xAI  |  创始人:Elon Musk

Grok 的特色是实时联网(接入 X/Twitter 数据)和不设审查的风格。

适合:需要实时信息、喜欢 Elon Musk 生态的用户


Llama (Meta)

公司:Meta (Facebook)  |  特点:完全开源免费

Llama 是最重要的开源模型系列,可以免费下载、商用。

模型参数量特点
Llama 3.1 405B4050亿最强开源模型之一
Llama 3.1 70B700亿性能好,可本地部署
Llama 3.2 3B30亿手机上也能跑

优点:免费开源,可本地部署(数据不出境),社区活跃

缺点:需要自己搭建服务器,中文能力比闭源模型弱

适合:企业私有化部署、不想依赖第三方API的场景


🇨🇳 中国模型

DeepSeek(深度求索)

公司:深度求索  |  创始人:梁文锋(幻方量化创始人)

2025年初爆火的中国AI,以极低成本达到接近 GPT-4 的水平,震惊全球。

模型上下文API价格特点
DeepSeek V3128K¥2/1M输入,¥8/1M输出综合能力强,超便宜
DeepSeek R1128K¥4/1M输入,¥16/1M输出深度推理,数学/编程顶级

优点:价格极低(GPT-4 的 1/50),开源可部署,中文能力强,推理能力出色

缺点:高峰期 API 不稳定,多模态能力弱,服务偶尔过载

适合:中文用户首选、预算有限的开发者、需要推理能力的场景


通义千问 Qwen(阿里云)

公司:阿里云  |  特点:阿里生态集成

模型上下文价格特点
Qwen2.5-Max128K¥2/1M输入阿里最强模型
Qwen2.5-72B128K开源免费开源版本,可本地部署
Qwen-VL-Max128K¥3/1M输入多模态,能看图

优点:中文能力强,阿里云生态完善,开源版本质量高

缺点:英文能力不如 GPT/Claude,API 文档不如 OpenAI 清晰


Kimi(月之暗面)

公司:月之暗面 (Moonshot AI)  |  创始人:杨植麟

Kimi 以超长上下文闻名,最早支持 200K Token,擅长读长文档。

优点:长文本理解好,中文能力强,有免费额度,产品体验好

缺点:API 能力不如 DeepSeek/Qwen,英文较弱

适合:需要阅读长文档、中文写作、日常聊天


豆包 Doubao(字节跳动)

公司:字节跳动  |  背景:抖音母公司

豆包是字节跳动的 AI 产品,背后用的是云雀大模型。API 价格极低。

优点:价格极低(比 DeepSeek 还便宜),字节生态集成,产品形态丰富

缺点:模型能力不是最强,API 灵活度不如 OpenAI


GLM(智谱 AI)

公司:智谱 AI  |  背景:清华大学团队

GLM 系列是中国最早的对话模型之一,学术背景深厚

优点:学术背景扎实,开源版本可用,支持工具调用

缺点:产品体验不如竞品,生态不如阿里/字节


文心 ERNIE(百度)

公司:百度  |  产品名:文心一言

百度的 AI 大模型,深度集成百度搜索和百度生态。

优点:中文理解好(百度搜索数据加持),百度生态集成

缺点:API 体验一般,国际影响力弱


Yi(零一万物)

公司:零一万物  |  创始人:李开复

李开复创办的 AI 公司,模型开源为主。


🇫🇷 欧洲模型

Mistral(法国)

公司:Mistral AI  |  总部:巴黎  |  创始人:前 Meta 和 Google DeepMind 研究员

欧洲最强的 AI 公司,以高效小模型开源精神著称。

模型参数量特点
Mistral Large未公开旗舰模型,能力接近 GPT-4
Mistral 7B70亿小而精,本地可跑
Mixtral 8x7B46.7亿激活MoE架构,效率极高

优点:开源友好,模型效率高,欧洲数据合规

缺点:中文能力弱,生态不如 OpenAI


对比总结

维度最强最便宜中文最好开源最好
综合GPT-4o / Claude 3.5Gemini Flash / 豆包DeepSeek / QwenLlama / Qwen
编程Claude 3.5 SonnetDeepSeek V3DeepSeekDeepSeek Coder
推理o1 / DeepSeek R1DeepSeek R1DeepSeek R1DeepSeek R1
长文本Gemini 1.5 Pro (2M)Gemini FlashKimiYi / Qwen
多模态GPT-4oGemini FlashQwen-VLQwen-VL

怎么选模型?

👑最强综合
GPT-4o / Claude 3.5
💰中文+便宜
DeepSeek V3
🧮推理/数学
DeepSeek R1 / o3-mini
📚超长文档
Gemini Pro / Kimi
🖥️本地部署
Llama / Qwen / DeepSeek
💬免费聊天
豆包 / Kimi / 通义千问