使用 OpenAI Chat Completions 兼容格式发起对话,并以 SSE 流式返回模型输出。
Documentation Index
Fetch the complete documentation index at: https://docs.geeknow.top/llms.txt
Use this file to discover all available pages before exploring further.
stream 未传时按非流式处理。若希望固定获得流式响应,请显式传入 "stream": true。system、user、assistant、tool。text、image_url、input_audio、file、video_url。true 后响应为 text/event-stream,每个片段以 data: 推送,结束时返回 data: [DONE]。max_completion_tokens。0 到 2。较低值更稳定,较高值更多样。0 到 1。通常不建议同时大幅调整 temperature 和 top_p。tools。auto、none、required,也可指定某个函数。{ "type": "json_object" } 或 json_schema。low、medium、high,是否生效取决于模型。chat.completion.chunk。role、content、reasoning_content 或 tool_calls。stop、length、tool_calls。stream_options.include_usage 时才一定出现。