全球AI模型大全
主流AI模型全家桶,按国家分类,每个模型都有详细介绍:发布时间、公司、技术特点、价格、上下文长度、优缺点和适用人群。
模型总览
全球 AI 大模型形成中美两强格局。
🇺🇸 美国模型
OpenAI GPT 系列
公司:OpenAI | 创始人:Sam Altman | 总部:旧金山
OpenAI 是 AI 浪潮的引领者,ChatGPT 改变了整个行业。
| 模型 | 发布时间 | 上下文 | 输入价格 | 输出价格 | 特点 |
|---|---|---|---|---|---|
| GPT-4o | 2024.05 | 128K | $2.5/1M | $10/1M | 多模态,速度快,性价比高 |
| GPT-4o mini | 2024.07 | 128K | $0.15/1M | $0.6/1M | 超便宜,日常够用 |
| o1 | 2024.09 | 200K | $15/1M | $60/1M | 深度推理,数学编程强 |
| o3-mini | 2025.01 | 200K | $1.1/1M | $4.4/1M | 推理能力好,价格适中 |
优点:综合能力最强,生态最完善(API、插件、GPTs),多模态支持好
缺点:价格较高,中国大陆无法直接使用,有时过于"安全"拒绝回答
适合:企业级应用、需要最强能力的场景、英文为主的应用
Claude (Anthropic)
公司:Anthropic | 创始人:Dario Amodei(前 OpenAI 副总裁) | 总部:旧金山
Anthropic 由 OpenAI 前核心成员创立,以安全和长文本著称。
| 模型 | 发布时间 | 上下文 | 输入价格 | 输出价格 | 特点 |
|---|---|---|---|---|---|
| Claude 3.5 Sonnet | 2024.06 | 200K | $3/1M | $15/1M | 编程极强,性价比优秀 |
| Claude 3.5 Haiku | 2024.11 | 200K | $1/1M | $5/1M | 快速轻量,日常够用 |
| Claude 3 Opus | 2024.03 | 200K | $15/1M | $75/1M | 最强能力,复杂任务 |
优点:编程能力顶级,长文本理解好,安全性高,不容易"幻觉"
缺点:中国大陆无法直接使用,多模态能力不如 GPT-4o
适合:程序员(尤其是 Claude + Cursor)、长文档分析、需要高准确性的场景
Gemini (Google)
公司:Google DeepMind | 前身:Bard
| 模型 | 上下文 | 输入价格 | 输出价格 | 特点 |
|---|---|---|---|---|
| Gemini 2.0 Flash | 1M | $0.1/1M | $0.4/1M | 超大上下文,极便宜 |
| Gemini 1.5 Pro | 2M | $1.25/1M | $5/1M | 200万Token上下文,史上最大 |
优点:上下文窗口最大(200万Token),价格便宜,可免费使用,多模态强
缺点:中文能力不如 GPT/Claude,API 体验不如 OpenAI
适合:需要超长上下文的场景、预算有限的开发者、Google 生态用户
Grok (xAI)
公司:xAI | 创始人:Elon Musk
Grok 的特色是实时联网(接入 X/Twitter 数据)和不设审查的风格。
适合:需要实时信息、喜欢 Elon Musk 生态的用户
Llama (Meta)
公司:Meta (Facebook) | 特点:完全开源免费
Llama 是最重要的开源模型系列,可以免费下载、商用。
| 模型 | 参数量 | 特点 |
|---|---|---|
| Llama 3.1 405B | 4050亿 | 最强开源模型之一 |
| Llama 3.1 70B | 700亿 | 性能好,可本地部署 |
| Llama 3.2 3B | 30亿 | 手机上也能跑 |
优点:免费开源,可本地部署(数据不出境),社区活跃
缺点:需要自己搭建服务器,中文能力比闭源模型弱
适合:企业私有化部署、不想依赖第三方API的场景
🇨🇳 中国模型
DeepSeek(深度求索)
公司:深度求索 | 创始人:梁文锋(幻方量化创始人)
2025年初爆火的中国AI,以极低成本达到接近 GPT-4 的水平,震惊全球。
| 模型 | 上下文 | API价格 | 特点 |
|---|---|---|---|
| DeepSeek V3 | 128K | ¥2/1M输入,¥8/1M输出 | 综合能力强,超便宜 |
| DeepSeek R1 | 128K | ¥4/1M输入,¥16/1M输出 | 深度推理,数学/编程顶级 |
优点:价格极低(GPT-4 的 1/50),开源可部署,中文能力强,推理能力出色
缺点:高峰期 API 不稳定,多模态能力弱,服务偶尔过载
适合:中文用户首选、预算有限的开发者、需要推理能力的场景
通义千问 Qwen(阿里云)
公司:阿里云 | 特点:阿里生态集成
| 模型 | 上下文 | 价格 | 特点 |
|---|---|---|---|
| Qwen2.5-Max | 128K | ¥2/1M输入 | 阿里最强模型 |
| Qwen2.5-72B | 128K | 开源免费 | 开源版本,可本地部署 |
| Qwen-VL-Max | 128K | ¥3/1M输入 | 多模态,能看图 |
优点:中文能力强,阿里云生态完善,开源版本质量高
缺点:英文能力不如 GPT/Claude,API 文档不如 OpenAI 清晰
Kimi(月之暗面)
公司:月之暗面 (Moonshot AI) | 创始人:杨植麟
Kimi 以超长上下文闻名,最早支持 200K Token,擅长读长文档。
优点:长文本理解好,中文能力强,有免费额度,产品体验好
缺点:API 能力不如 DeepSeek/Qwen,英文较弱
适合:需要阅读长文档、中文写作、日常聊天
豆包 Doubao(字节跳动)
公司:字节跳动 | 背景:抖音母公司
豆包是字节跳动的 AI 产品,背后用的是云雀大模型。API 价格极低。
优点:价格极低(比 DeepSeek 还便宜),字节生态集成,产品形态丰富
缺点:模型能力不是最强,API 灵活度不如 OpenAI
GLM(智谱 AI)
公司:智谱 AI | 背景:清华大学团队
GLM 系列是中国最早的对话模型之一,学术背景深厚。
优点:学术背景扎实,开源版本可用,支持工具调用
缺点:产品体验不如竞品,生态不如阿里/字节
文心 ERNIE(百度)
公司:百度 | 产品名:文心一言
百度的 AI 大模型,深度集成百度搜索和百度生态。
优点:中文理解好(百度搜索数据加持),百度生态集成
缺点:API 体验一般,国际影响力弱
Yi(零一万物)
公司:零一万物 | 创始人:李开复
李开复创办的 AI 公司,模型开源为主。
🇫🇷 欧洲模型
Mistral(法国)
公司:Mistral AI | 总部:巴黎 | 创始人:前 Meta 和 Google DeepMind 研究员
欧洲最强的 AI 公司,以高效小模型和开源精神著称。
| 模型 | 参数量 | 特点 |
|---|---|---|
| Mistral Large | 未公开 | 旗舰模型,能力接近 GPT-4 |
| Mistral 7B | 70亿 | 小而精,本地可跑 |
| Mixtral 8x7B | 46.7亿激活 | MoE架构,效率极高 |
优点:开源友好,模型效率高,欧洲数据合规
缺点:中文能力弱,生态不如 OpenAI
对比总结
| 维度 | 最强 | 最便宜 | 中文最好 | 开源最好 |
|---|---|---|---|---|
| 综合 | GPT-4o / Claude 3.5 | Gemini Flash / 豆包 | DeepSeek / Qwen | Llama / Qwen |
| 编程 | Claude 3.5 Sonnet | DeepSeek V3 | DeepSeek | DeepSeek Coder |
| 推理 | o1 / DeepSeek R1 | DeepSeek R1 | DeepSeek R1 | DeepSeek R1 |
| 长文本 | Gemini 1.5 Pro (2M) | Gemini Flash | Kimi | Yi / Qwen |
| 多模态 | GPT-4o | Gemini Flash | Qwen-VL | Qwen-VL |