Skip to main content
Google AI 开发者平台

Gemini API

基于 Google Gemini 模型构建应用

通过单一 API 访问 Gemini 2.5 Pro、Flash、Flash-Lite、Gemini 3.5 Flash 与 Gemini 3 Pro。 多模态推理、智能体、函数调用,最高 100 万 token 上下文,适用于生产环境。

2.5 Pro · Flash · 3 Pro
100 万 Token 上下文
多模态输入输出
generateContent API

什么是 Gemini API?

Gemini API 是 Google 将 Gemini 多模态 AI 模型(文本、图像、视频、音频、PDF)集成到产品中的编程接口。 开发者使用生产级 generateContent API,以及面向多轮智能体的 Interactions API(agentic 测试版)。 能力包括函数调用、结构化输出、Google 搜索 grounding、代码执行与流式输出,覆盖 Gemini 2.5 Pro(最强)、2.5 Flash(快速)、2.5 Flash-Lite(高性价比)、Gemini 3.5 Flash 与 Gemini 3 Pro。

可在 Google AI Studio(aistudio.google.com)快速上手,或通过 Google Cloud Vertex AI 部署。 官方文档见 ai.google.dev。 结合上下文缓存、批量 API 与安全过滤,团队可规模化构建聊天机器人、编程助手、文档流水线与自主智能体。

概览

一览

编程

生成、解释与重构代码,在真实工程任务中表现优异,并支持内置代码执行。

智能体与工具

Interactions API 支持智能体工作流、函数调用、并行工具与 grounding 多步推理。

百万上下文

处理大型代码库、文档、视频转录与长对话——在支持的模型上最高 100 万 token。

灵活定价

从 Flash-Lite 到 Pro 按 token 计费,批量 API 与上下文缓存可显著节省成本。

核心能力

Gemini API 能做什么

面向生产的多模态 AI——从创意内容与编程到自主智能体与长文档分析。

创意写作

撰写营销文案、长文、技术文档与风格一致的优质内容。

编程

构建功能、修复缺陷、审查 PR,并通过 API 运行代码——Gemini 擅长软件工程流程。

高级推理

在数学、研究综合、规划与复杂多步分析中提供深度推理,支持多模态。

智能体工作流

结合 Interactions API、函数调用、grounding 与代码执行,让 Gemini 自主规划、执行与迭代。

长上下文处理

在单次请求中分析整个代码库、合同、研究语料或多模态输入,最高 100 万 token。

应用场景

Gemini API 的亮点场景

软件开发

代码生成、审查、调试与全库分析——从 IDE 插件到自主编程智能体。

AI 智能体与自动化

通过 Interactions API 构建研究助手、流程机器人与多工具智能体,支持 grounding 与函数调用。

文档智能

总结 PDF、从图像与视频提取洞察,并用原生多模态模型分析音频。

客户与企业

客服自动化、知识库与内部 Copilot,可部署于 Vertex AI 并满足企业管控需求。

开发AI 智能体文档企业

技术架构

Gemini API 如何构建

Gemini API 通过 generateContent API(生产)与 Interactions API(agentic 测试版)暴露 Google 最新 Gemini 模型。2.5 Pro 面向最难推理任务;2.5 Flash 平衡速度与能力;2.5 Flash-Lite 优化高并发成本;Gemini 3.5 Flash 与 Gemini 3 Pro 提供前沿性能。 均支持多模态输入、函数调用、结构化 JSON、grounding 与流式输出。

模型阵容 2.5 Pro · Flash · 3 Pro
旗舰模型 Gemini 2.5 Pro
快速档 Gemini 2.5 Flash
上下文窗口 最高 100 万 token
API 形态 generateContent · Interactions
部署方式 AI Studio · Vertex AI

为何选择 Gemini API

竞争优势

Gemini API 以原生多模态、超大上下文、Google 搜索 grounding 以及与 AI Studio、Vertex AI 的深度集成著称,是构建生产级 AI 应用的理想选择。

  • 原生多模态——文本、图像、视频、音频、PDF 统一 API。
  • 最高 100 万 token 上下文,适合大型代码库、文档与长智能体会话。
  • 内置 Google 搜索 grounding、结构化输出、函数调用与代码执行。
  • 从 Flash-Lite 到 Pro 的灵活定价,批量 API 与上下文缓存可享折扣。

API 访问与定价

方案与费用

Gemini API 按 token 即用即付。2.5 Flash-Lite 适合高并发低延迟;2.5 Flash 为多数应用默认;2.5 Pro 与 Gemini 3 Pro 处理最难推理。 批量 API 为异步任务提供折扣,上下文缓存可降低重复长上下文成本。

在 Google AI Studio 免费创建 API 密钥,使用官方 SDK(Python、JavaScript、Go)或 REST generateContent API; 企业场景可迁移至 Vertex AI 获得 VPC 与合规能力。

发布历程

重要里程碑

  • 2023 年 12 月 — Google 发布 Gemini,通过 Gemini API 向开发者开放多模态 AI。
  • 2024 年 2 月 — Gemini 1.5 Pro 预览版支持 100 万 token 上下文与原生多模态理解。
  • 2025 年 3 月 — Gemini 2.5 系列发布 Pro、Flash、Flash-Lite,推理与编程能力显著提升。
  • 2026 年 — Gemini 3.5 Flash 与 Gemini 3 Pro 扩展 Interactions API、grounding 与生产规模能力。

快速开始

如何使用 Gemini API

1

创建 API 密钥

登录 Google AI Studio(aistudio.google.com),创建 API 密钥并查看用量限制。 开发者可免费试用。

2

安装 SDK

使用 Google Gen AI 官方 SDK,或直接调用 REST generateContent API。 完整快速入门见 ai.google.dev。

3

构建与部署

按场景选择 Pro、Flash 或 Flash-Lite,启用 grounding、工具与流式输出; 生产环境可迁移至 Vertex AI。

常见问题

FAQ

什么是 Gemini API?

Gemini API 是 Google 以编程方式访问 Gemini 模型的开发者接口,通过 generateContent 与 Interactions API 为聊天机器人、编程助手、多模态应用与企业方案提供函数调用、grounding 与结构化输出。

有哪些 Gemini 模型可用?

API 提供 Gemini 2.5 Pro(最强)、2.5 Flash(均衡速度)、2.5 Flash-Lite(高性价比)、Gemini 3.5 Flash 与 Gemini 3 Pro。 支持的模型可为长输入提供最高 100 万 token 上下文。

Gemini API 由谁开发?

Gemini API 由 Google DeepMind 与 Google AI 构建。Gemini 是 Google 的多模态模型家族,开发者可通过 AI Studio 使用,企业可通过 Vertex AI 部署。

Gemini API 与其他 AI API 相比如何?

Gemini API 以原生多模态(文本、图像、视频、音频、PDF)、最高 100 万上下文、Google 搜索 grounding、结构化输出以及 Flash 档高性价比著称。

Gemini API 是否支持智能体与函数调用?

支持。 可在 generateContent 请求中使用函数调用,或使用 Interactions API(agentic 测试版)构建多轮智能体,支持工具、grounding、代码执行与并行函数调用。

Gemini API 如何计费?

按百万 token 计费,价格因 Flash-Lite 至 Pro 档位而异。 批量 API 与上下文缓存可显著折扣,详见 ai.google.dev 定价页。

获取 Gemini API 访问

通过推荐平台接入——AIAPI.world 提供 100+ 模型统一 API,WorldBase.ai 提供含 Gemini 在内的开发者控制台。