跳转到主要内容
POST
/
kyyAiPower
/
v1
/
chat
/
completions
curl --request POST \
  --url https://zcbservice.aizfw.cn/kyyAiPower/v1/chat/completions \
  --header 'Authorization: Bearer {{YOUR_API_KEY}}' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "gemini-3-pro",
    "messages": [
      {
        "role": "system",
        "content": "你是一个情感陪伴助手"
      },
      {
        "role": "user",
        "content": "hello world"
      }
    ],
    "temperature": 0.7,
    "max_completion_tokens": 2000
  }'
{
  "code": "200",
  "msg": "成功",
  "data": {
    "content": "你好!我是 Gemini,很高兴为你服务。有什么我可以帮助你的吗?",
    "usage": {
      "prompt_tokens": 25,
      "completion_tokens": 150,
      "total_tokens": 175
    },
    "model": "gemini-3-pro",
    "id": "chatcmpl-abc123",
    "success": true
  }
}

认证

所有请求都需要在请求头中包含 Bearer token:
Authorization: Bearer {{YOUR_API_KEY}}

请求参数

model
string
必填
要使用的模型的 ID。支持的模型:
  • gemini-3-pro
messages
array
必填
至今为止对话所包含的消息列表。每个消息对象包含 rolecontent 字段
temperature
number
采样温度,介于 0 和 2 之间。较高的值(如 0.8)使输出更随机,较低的值(如 0.2)使输出更集中和确定。
建议改变此参数或 top_p,但不要同时改变两者
top_p
number
核采样参数,模型考虑具有 top_p 概率质量的标记的结果。例如 0.1 意味着只考虑构成前 10% 概率质量的标记。
建议改变此参数或 temperature,但不要同时改变两者
stream
boolean
默认为 false。如果设置为 true,则会像 ChatGPT 一样发送部分消息增量。标记将以仅数据的服务器发送事件的形式发送,并在 data: [DONE] 消息终止流
max_completion_tokens
integer
默认为 inf。在聊天补全中生成的最大标记数。输入标记和生成标记的总长度受模型的上下文长度限制
stop
string/array
默认为 null。最多 4 个序列,API 将停止进一步生成标记
presence_penalty
number
-2.0 和 2.0 之间的数字。正值会根据到目前为止是否出现在文本中来惩罚新标记,从而增加模型谈论新主题的可能性
frequency_penalty
number
默认为 0。-2.0 到 2.0 之间的数字。正值根据文本目前的存在频率惩罚新标记,降低模型重复相同行的可能性

Messages 数组结构

每个 message 对象包含以下字段:
role
string
必填
消息角色,可选值:systemuserassistant
content
string/array
必填
消息内容。可以是字符串(纯文本),或数组(多模态内容,支持文本、图片、视频)

多模态内容结构

content 为数组时,支持以下类型的对象: 文本对象:
{
  "type": "text",
  "text": "消息文本内容"
}
图片/视频对象:
{
  "type": "image_url",
  "image_url": {
    "url": "图片或视频URL地址"
  }
}

响应参数

code
string
响应状态码,成功时为 “200”
msg
string
响应消息,成功时为 “成功”
data.content
string
AI 生成的回复内容
data.usage.prompt_tokens
integer
输入提示使用的令牌数
data.usage.completion_tokens
integer
生成补全使用的令牌数
data.usage.total_tokens
integer
总令牌数(prompt_tokens + completion_tokens)
data.model
string
使用的模型名称
data.id
string
聊天补全的唯一标识符
data.success
boolean
请求是否成功

多模态支持

Gemini 模型支持多模态输入,可以在同一个请求中处理文本、图片和视频:

纯文本对话

content 直接使用字符串

图片分析

content 使用数组,包含 textimage_url 对象

视频分析

content 使用数组,视频也使用 image_url 类型传递

混合输入

可以在同一个 content 数组中同时包含文本、图片和视频
重要提示:
  • 图片和视频 URL 必须可公开访问
  • 视频文件也使用 image_url 类型传递,不是 video_url
  • 不同模型对多模态的支持程度可能不同,建议使用 gemini-3.1-pro-preview 或更高版本

注意事项

最佳实践:
  1. 请求必须使用 application/json 格式
  2. temperaturetop_p 建议只调整其中一个参数
  3. 使用 JSON 模式时,必须在消息中明确指示模型生成 JSON
  4. 流式响应以 Server-Sent Events (SSE) 格式返回,以 data: [DONE] 结束
  5. finish_reasonlength 时,表示生成超过了 max_completion_tokens 或对话超过了最大上下文长度
curl --request POST \
  --url https://zcbservice.aizfw.cn/kyyAiPower/v1/chat/completions \
  --header 'Authorization: Bearer {{YOUR_API_KEY}}' \
  --header 'Content-Type: application/json' \
  --data '{
    "model": "gemini-3-pro",
    "messages": [
      {
        "role": "system",
        "content": "你是一个情感陪伴助手"
      },
      {
        "role": "user",
        "content": "hello world"
      }
    ],
    "temperature": 0.7,
    "max_completion_tokens": 2000
  }'
{
  "code": "200",
  "msg": "成功",
  "data": {
    "content": "你好!我是 Gemini,很高兴为你服务。有什么我可以帮助你的吗?",
    "usage": {
      "prompt_tokens": 25,
      "completion_tokens": 150,
      "total_tokens": 175
    },
    "model": "gemini-3-pro",
    "id": "chatcmpl-abc123",
    "success": true
  }
}