Skip to main content

Documentation Index

Fetch the complete documentation index at: https://docs.geeknow.top/llms.txt

Use this file to discover all available pages before exploring further.

文本模型支持矩阵

文本系列的复杂点不在于“模型多”,而在于“协议也多”。当前系统同时支持 OpenAI Chat Completions、OpenAI Responses、Claude Messages、Gemini 原生格式,以及 Embeddings、Rerank、Moderations、Web 工具、Realtime 等能力。如果没有一张矩阵,外部用户很容易只看到接口名,却不知道应该从哪条协议接入。
这一页按“协议风格 + 能力类型”整理,不按单个模型逐个枚举。单个 API Key 实际可用哪些模型,还是以 模型列表 返回结果为准。

协议总表

协议/能力推荐入口典型模型家族流式工具调用多模态适用场景
OpenAI Chat Completions/v1/chat/completionsGPT、Claude 映射模型、Gemini 映射模型、DeepSeek、Qwen 等支持支持支持聊天、Agent、传统 OpenAI SDK 兼容
OpenAI Responses/v1/responsesGPT、支持 Responses 语义的兼容模型支持支持支持结构化输出、工具编排、上下文续接
Claude Messages/v1/messagesClaude Sonnet / Opus / Haiku 等支持支持支持已有 Anthropic SDK 或 Claude 原生提示结构
Gemini 原生/v1beta/models/{model}:{action}Gemini Flash / Pro / 图像预览 / 向量模型支持支持支持已有 Gemini SDK、要保留 contents/parts 结构
Legacy Completions/v1/completions兼容旧 Completion 风格的文本模型通常非首选有限历史系统兼容
Embeddings/v1/embeddingstext-embedding、Gemini embedding 等向量检索、RAG、相似度计算
Rerank/v1/rerank重排模型检索结果重排序
Moderations/v1/moderations审核模型部分内容安全审核
Web 工具/v1/web-reader/read/v1/web-search/search网页读取 / 搜索工具不适用阅读网页、搜索结果接入
Realtime/v1/realtime实时对话模型实时流依模型多模态视模型WebSocket 实时交互

常见模型名称示例

下面这些不是“完整可用模型列表”,而是当前系统里常见、对外最容易遇到的一批文本模型名称示例。实际是否可用仍取决于你的渠道配置和 GET /v1/models 返回。

OpenAI / GPT 风格

常见模型名说明
gpt-4o通用多模态模型
gpt-4o-mini轻量版通用模型
gpt-4.1通用文本/工具调用模型
gpt-4.1-mini轻量版 4.1
gpt-4.1-nano更小规格 4.1
o1推理模型
o3推理模型
o4推理模型

Claude

常见模型名说明
claude-sonnet-4-20250514Claude Sonnet 系列常见版本
claude-sonnet-4-5-20250929Sonnet 后续版本
claude-sonnet-4-6Sonnet 4.6
claude-opus-4-20250514Claude Opus 系列
claude-opus-4-1-20250805Opus 后续版本
claude-opus-4-6Opus 4.6
claude-opus-4-7Opus 4.7
claude-haiku-4-5-20251001Haiku 轻量模型

Gemini

常见模型名说明
gemini-2.0-flashGemini 通用快速模型
gemini-2.5-flashGemini 2.5 Flash
gemini-2.5-proGemini 2.5 Pro
gemini-3.1-pro-previewGemini 预览版 Pro
gemini-3-pro-image-previewGemini 图像预览模型
gemini-3.1-flash-image-previewGemini 图像预览快速模型

DeepSeek

常见模型名说明
deepseek-chat通用对话模型
deepseek-reasoner推理模型
deepseek-v4-flash新一代快速模型
deepseek-v4-pro新一代高阶模型
deepseek-r1推理系列
deepseek-r1-distill-qwen-32b蒸馏推理模型

Qwen

常见模型名说明
qwen-maxQwen 高规格模型
qwen3-maxQwen 3 系列高规格模型
qwen3-omni-flashQwen 多模态快速模型
qwq / qwq-*Qwen 推理系列常见命名

向量与重排

常见模型名说明
text-embedding-3-smallOpenAI 风格向量模型
text-embedding-3-largeOpenAI 风格高维向量模型
bge-reranker-large常见重排模型示例
rerank-english-v3.0Cohere 风格重排模型
rerank-multilingual-v3.0多语言重排模型

按协议选入口

1. OpenAI Chat Completions

项目说明
入口POST /v1/chat/completions
典型字段modelmessagesstreamtoolsresponse_format
多模态输入messages[].content 支持 textimage_urlinput_audiofilevideo_url
适合人群已经在用 OpenAI SDK、希望最低迁移成本接入
典型模型家族GPT、Claude 映射模型、Gemini 映射模型、DeepSeek、Qwen
常见模型名示例gpt-4ogpt-4.1gpt-4o-minideepseek-chatdeepseek-reasonerqwen-max

2. OpenAI Responses

项目说明
入口POST /v1/responses
典型字段modelinputinstructionstoolsprevious_response_idtext
优势更适合结构化输出、工具调用和复杂任务编排
流式支持 SSE
典型模型家族GPT 风格模型及兼容 Responses 语义的上游
常见模型名示例gpt-4ogpt-4.1o1o3

3. Claude Messages

项目说明
入口POST /v1/messages
典型字段modelmessagessystemmax_tokenstoolsthinking
认证兼容Authorization: Bearerx-api-key + anthropic-version
适合人群已经有 Claude 原生格式调用代码
常见模型名示例claude-sonnet-4-20250514claude-sonnet-4-6claude-opus-4-6claude-opus-4-7

4. Gemini 原生

项目说明
入口POST /v1beta/models/{model}:generateContent
典型字段contentsgenerationConfigtoolssafetySettings
认证兼容Authorization: Bearerx-goog-api-key
适合人群需要完整保留 Gemini contents/parts 结构、图像 part、Google 工具风格
常见模型名示例gemini-2.0-flashgemini-2.5-flashgemini-2.5-progemini-3.1-pro-preview

按能力选接口

对话生成

需求推荐接口说明
通用聊天/v1/chat/completions最通用、最兼容
工具编排/v1/responses更适合结构化工作流
Claude 原生/v1/messages保持 Anthropic 请求结构
Gemini 原生/v1beta/models/{model}:generateContent保持 Gemini 请求结构

向量与检索

需求推荐接口说明
单条或批量向量/v1/embeddingsOpenAI 兼容写法
旧 embedding 路径兼容/v1/engines/{model}/embeddings历史路径
文档重排/v1/rerank适合 RAG 检索后精排

安全与工具

需求推荐接口说明
内容审核/v1/moderationsOpenAI Moderations 兼容
网页读取/v1/web-reader/read抓取并提取网页内容
网页搜索/v1/web-search/search返回搜索结果摘要
实时连接/v1/realtimeWebSocket 实时会话

常见模型家族映射思路

家族常见接法说明
GPT / OpenAI 风格模型/v1/chat/completions/v1/responses默认优先看 OpenAI 兼容协议
Claude/v1/messages/v1/chat/completions新接入更推荐 messages;兼容层也可走 chat
Gemini/v1beta/models/{model}:{action}/v1/chat/completions要原生能力就走 v1beta,要统一 SDK 兼容就走 chat
DeepSeek / Qwen 等 OpenAI 风格上游/v1/chat/completions通常最省事
向量模型/v1/embeddings 或 Gemini embedContent看你希望保留哪套协议

选型建议

  1. 如果你已经是 OpenAI SDK 客户端,先从 通用对话接口(默认流式) 开始。
  2. 如果你要做工具调用、上下文续接、结构化输出,优先用 OpenAI 多模态响应接口
  3. 如果你已有 Anthropic SDK,直接接 Claude 消息接口
  4. 如果你已有 Gemini SDK 或要保留 contents/parts 结构,直接接 Gemini 原生格式
  5. 如果你不确定当前 key 能用哪些模型,先查 模型列表