Skip to main content

国产视频模型

国产视频模型指腾讯 VOD AIGC 生视频渠道下的一组模型,统一通过 Geeknow 视频接口调用。
  • 提交任务:POST /v1/videos
  • 查询任务:GET /v1/videos/{task_id}
  • 获取视频内容:GET /v1/videos/{task_id}/content

视频生成

提交国产视频任务,支持文生、图生、参考图、参考视频、首尾帧、动作控制、数字人、对口型和模板特效。

任务查询

查询任务状态、进度、错误与结果地址,并获取生成后的视频内容。

渠道鉴权

渠道密钥使用竖线分隔:
  • SubAppId|SecretId|SecretKey
  • SubAppId|SecretId|SecretKey|Region
Region 可选。创建渠道时选择 AIGC / 腾讯 VOD 相关渠道后,把上面的密钥填入渠道密钥即可。

模型命名

用户请求 model 推荐传基础模型,例如 Kling-2.6Vidu-q2-proGV-3.1-fast。也可以直接传组合计费模型,例如 kling-3.0-omni-1080p-ref-audiovidu-q2-pro-reference-1080p-offpeak 接口会做两件事:
  1. 根据 model 识别模型家族和版本,例如 KlingViduGVOSHailuoHunyuanMingmouSVJV
  2. 根据模型、场景、分辨率、参考输入、音频开关、错峰等参数匹配对应计费规则。

基础模型

模型名含义
Vidu-*Vidu 系列模型
Kling-*可灵系列模型
GV-*GV 系列模型
OS-*OS 系列模型
Hunyuan-*混元系列模型
Mingmou-*明眸系列模型
Hailuo-*海螺系列模型
SV-*SV 系列模型
JV-*JV 系列模型

组合计费模型

组合计费模型可以直接作为 model 传入。接口会根据组合模型中的版本、分辨率、场景和音频等信息应用对应参数与计费规则。
示例含义
vidu-q2-pro-reference-1080p-offpeakvidu 模型族,q2-pro 版本,参考生视频 / 参考模式,1080p 分辨率档位,offpeak 错峰模式
kling-3.0-omni-1080p-ref-audiokling 模型族,3.0-omni 版本,1080p 分辨率档位,ref 表示有参考输入,audio 表示有声
kling-2.6-motion-pro-1080pkling 模型族,2.6 版本,动作控制场景,pro 动作控制档位,1080p 分辨率档位
kling-avatar-720p可灵数字人场景,720p 分辨率档位
kling-identify-face可灵对口型场景,不足 5 秒按 5 秒计
sv-1.5-pro-1080p-audiosv 模型族,1.5-pro 版本,1080p 分辨率档位,有声

国产模型怎么选

模型家族代表模型适合场景选型建议
ViduVidu-q2Vidu-q2-proVidu-q3-proVidu-q3-turboVidu-template文生视频、图生视频、参考图、多图参考、首尾帧、模板特效更看重参考图、多图输入、模板特效和较完整分辨率档位时,优先看 Vidu
KlingKling-1.6Kling-2.0Kling-2.1Kling-2.5Kling-2.6Kling-3.0Kling-3.0-OmniKling-O1文生视频、图生视频、动作控制、数字人、对口型、多镜头扩展需要动作控制、数字人、对口型或音频开关时,优先看 Kling
GVGV-3.1GV-3.1-fast文生视频、首尾帧、平滑过渡适合固定时长和首尾帧过渡场景。
OSOS-2.0文生视频适合参数较少、快速调用的短视频场景。
Hunyuan / MingmouHunyuan-1.5Mingmou-1.0常规文生视频适合通用国产视频接入,参数面相对简单。
HailuoHailuo-02Hailuo-2.3Hailuo-2.3-fast文生视频、首帧生视频更适合文生和首帧生视频,当前不建议强依赖 aspect_ratio
SVSV-1.5-proSV-1.0-proSV-1.0-pro-fastSV-1.0-lite组合计费模型常见按分辨率和音频开关拆分计费。
JVJV-3.0-pro组合计费模型当前多按版本直接计费,参数面较简单。

请求体总览

统一请求体使用 POST /v1/videos
字段说明
model模型名称,支持基础模型或组合计费模型
prompt提示词
seconds / duration生成时长,顶层字段优先级最高
size快速尺寸输入,例如 720P1080P720x1280
image / images / input_reference图生、参考图、首帧、首尾帧等输入
metadata扩展参数,建议把高级输出配置放入 metadata.output_config
顶层 seconds / duration 目前仍然生效,不是只能放进 metadata。复杂场景建议显式传 metadata.output_config.resolutionmetadata.output_config.aspect_ratio,减少尺寸推断带来的歧义。

参数优先级

时长优先级:
  1. 顶层 seconds
  2. 顶层 duration
  3. metadata.seconds / metadata.duration / metadata.video_duration
  4. 默认 5
分辨率优先级:
  1. metadata.output_config.resolution
  2. 顶层 size
  3. 模型默认值
文生 / 图生判定:
  • 存在参考输入,例如 imageimagesinput_referencelast_frame_*,按图生或参考输入场景处理。
  • 没有参考输入时,按文生视频处理。

metadata 扩展

字段说明
scene_type场景类型,常见值为 motion_controlavatar_i2vlip_synctemplate_effect
motion_level动作控制档位,std / pro,用于动作控制计费分档
offpeak是否错峰计费,布尔值
last_frame_url / last_frame_file_id首尾帧中的尾帧
video_url参考视频 URL
file_infos素材列表,高级用法
output_config输出配置,支持 snake_case 字段
ext_info扩展信息字符串,高级用法

output_config 字段映射

metadata.output_config 支持 snake_case 字段,也兼容对应的 UpperCamelCase 字段:
snake_case 字段兼容字段
storage_modeStorageMode
media_nameMediaName
class_idClassId
expire_timeExpireTime
durationDuration
resolutionResolution
aspect_ratioAspectRatio
audio_generationAudioGeneration
person_generationPersonGeneration
input_compliance_checkInputComplianceCheck
output_compliance_checkOutputComplianceCheck
enhance_switchEnhanceSwitch
frame_interpolateFrameInterpolate
logo_addLogoAdd

output_config 字段

字段类型说明
storage_modeStringPermanent / Temporary,默认 Temporary
media_nameString输出媒体名,最长 64 字符
class_idInteger分类 ID,默认 0
expire_timeString过期时间,ISO 8601,例如 2025-12-28T00:35:00Z
durationFloat生成时长,单位秒
resolutionString分辨率档位,例如 720P / 1080P
aspect_ratioString宽高比,例如 16:9 / 9:16
audio_generationStringEnabled / Disabled
person_generationStringAllowAdult / Disallowed
input_compliance_checkStringEnabled / Disabled
output_compliance_checkStringEnabled / Disabled
enhance_switchStringEnabled / Disabled
frame_interpolateStringEnabled / Disabled,Vidu 常用
logo_addStringEnabled / Disabled,Vidu 常用
时长字段建议保持顶层 secondsmetadata.output_config.duration 一致。如果只传一处,优先传顶层 seconds

模型约束

参数模型家族可用值
DurationKling5 / 10,默认 5
DurationHailuo6 / 10,默认 6
DurationVidu110
DurationGV8,默认 8
DurationOS4 / 8 / 12,默认 8
ResolutionKling720P / 1080P,默认 720P
ResolutionHailuo768P / 1080P,默认 768P
ResolutionVidu720P / 1080P,默认 720P
ResolutionGV720P / 1080P,默认 720P
ResolutionOS720P
AspectRatioKling 文生16:9 / 9:16 / 1:1,默认 16:9
AspectRatioVidu 文生 / 图生16:9 / 9:16 / 4:3 / 3:4 / 1:14:3 / 3:4 仅 q2
AspectRatioGV16:9 / 9:16,默认 16:9
AspectRatioOS 文生16:9 / 9:16,默认 16:9
AspectRatioHailuo暂不支持

特殊规则

  • scene_type=motion_control 必须提供视频参考,仅传图片会触发类似 videoUrl must not be blank 的错误。
  • 动作控制视频参考可以用 metadata.video_url,也可以用 metadata.file_infosCategory=Video
  • scene_type=lip_sync / identify-face 不足 5 秒按 5 秒计。
  • 素材列表最多支持 3 项。
  • Type=Url 时必须有 Url
  • Type=File 时必须有 FileId
  • 顶层 image / images / input_reference 会作为图片素材处理。
  • 顶层图片输入仅支持可访问的 http(s) 图片 URL 或文件 ID;当前不支持 data:image/...;base64,... 这类 base64 data URI。

file_infos 子字段

素材列表可使用 metadata.file_infos,也兼容 metadata.FileInfos
字段说明
Type / typeFile / Url
Category / categoryImage / Video
FileId / file_idType=File 时使用
Url / urlType=Url 时使用
Usage / usage例如 FirstFrame / Reference
ReferenceType / reference_type适用于 GV / Kling 的参考类型区分;Kling + Category=Video 时,feature 表示特征参考视频,base 表示待编辑视频
ObjectId / object_id适用于 Vidu 主体 / 参考图模式
VoiceId / voice_id适用于 Vidu-q2
KeepOriginalSound / keep_original_soundCategory=Video 时有效

默认可选模型

渠道选择 AIGC 后,前端默认模型列表包含:
  • Vidu-q2 / Vidu-q2-pro / Vidu-q2-turbo / Vidu-q3-pro / Vidu-q3-turbo / Vidu-template
  • Hunyuan-1.5 / Mingmou-1.0 / OS-2.0
  • GV-3.1 / GV-3.1-fast
  • Kling-1.6 / Kling-2.0 / Kling-2.1 / Kling-2.5 / Kling-2.6 / Kling-3.0 / Kling-3.0-Omni / Kling-O1
  • Hailuo-02 / Hailuo-2.3 / Hailuo-2.3-fast
  • SV-1.5-pro / SV-1.0-pro / SV-1.0-pro-fast / SV-1.0-lite
  • JV-3.0-pro
  • 组合计费模型,例如 vidu-q2-pro-reference-1080p-offpeakkling-2.6-motion-pro-1080pkling-3.0-omni-1080p-ref-audiohailuo-2.3-fast-1080psv-1.5-pro-1080p-audiojv-3.0-pro
当前仓库已内置映射到上述 Kling 型号;Kling-O3Kling-Mini 还未作为预置型号加入文档与计费映射。

默认价格表

以下为默认单价,单位为元 / 秒。实际以账户侧开通能力与结算为准。

Vidu

版本场景分辨率单价
q2普通≤720P0.32
q2普通(错峰)≤720P0.16
q2普通≤1080P0.47
q2普通(错峰)≤1080P0.24
q2参考≤540P0.24
q2参考(错峰)≤540P0.12
q2参考≤720P0.32
q2参考(错峰)≤720P0.16
q2参考≤1080P0.82
q2参考(错峰)≤1080P0.41
q2-pro普通≤720P0.35
q2-pro普通(错峰)≤720P0.18
q2-pro普通≤1080P0.70
q2-pro普通(错峰)≤1080P0.35
q2-pro参考≤540P0.27
q2-pro参考(错峰)≤540P0.14
q2-pro参考≤720P0.35
q2-pro参考(错峰)≤720P0.18
q2-pro参考≤1080P0.90
q2-pro参考(错峰)≤1080P0.45
q2-turbo普通≤720P0.25
q2-turbo普通(错峰)≤720P0.13
q2-turbo普通≤1080P0.47
q2-turbo普通(错峰)≤1080P0.24
q3-pro普通≤540P0.44
q3-pro普通(错峰)≤540P0.22
q3-pro普通≤720P0.937
q3-pro普通(错峰)≤720P0.468
q3-pro普通≤1080P1.00
q3-pro普通(错峰)≤1080P0.50
q3-turbo普通≤540P0.25
q3-turbo普通(错峰)≤540P0.13
q3-turbo普通≤720P0.38
q3-turbo普通(错峰)≤720P0.19
q3-turbo普通≤1080P0.50
q3-turbo普通(错峰)≤1080P0.25
template特效模板-0.40

Hunyuan / Mingmou / OS / GV

模型版本分辨率单价
Hunyuan1.5≤720P0.30
Hunyuan1.5≤1080P0.50
Mingmou1.0≤720P0.30
Mingmou1.0≤1080P0.50
OS2.0不区分0.75
GV3.1不区分3.00
GV3.1-fast不区分1.15

Kling

版本场景分辨率单价
3.0无声≤720P0.60
3.0有声≤720P0.90
3.0无声≤1080P0.80
3.0有声≤1080P1.20
3.0-Omni无参考无声≤720P0.60
3.0-Omni无参考有声≤720P0.80
3.0-Omni有参考无声≤720P0.90
3.0-Omni有参考有声≤720P1.10
3.0-Omni无参考无声≤1080P0.80
3.0-Omni无参考有声≤1080P1.00
3.0-Omni有参考无声≤1080P1.20
3.0-Omni有参考有声≤1080P1.40
2.6无声不区分0.50
2.6有声不区分1.00
2.6动作控制 std不区分0.50
2.6动作控制 pro不区分0.80
O1普通≤720P0.90
O1普通≤1080P1.20
2.5普通≤720P0.30
2.5普通≤1080P0.50
1.6 / 2.0 / 2.1普通≤720P0.40
1.6 / 2.0 / 2.1普通≤1080P0.70
avatar数字人≤720P0.40
avatar数字人≤1080P0.80
identify-face对口型不区分,不足 5 秒按 5 秒0.10

Hailuo

版本分辨率单价
02 / 2.3≤768P0.33
02 / 2.3≤1080P0.58
2.3-fast≤768P0.23
2.3-fast≤1080P0.39

SV

版本分辨率单价
1.5-pro≤480P(无声)0.08
1.5-pro≤480P(有声)0.16
1.5-pro≤720P(无声)0.172
1.5-pro≤720P(有声)0.346
1.5-pro≤1080P(无声)0.388
1.5-pro≤1080P(有声)0.778
1.0-pro≤480P0.146
1.0-pro≤720P0.308
1.0-pro≤1080P0.734
1.0-pro-fast≤480P0.04
1.0-pro-fast≤720P0.086
1.0-pro-fast≤1080P0.206
1.0-lite≤480P0.098
1.0-lite≤720P0.206
1.0-lite≤1080P0.49

JV

模型版本分辨率单价
JV3.0-pro不区分1.00

相关页面