一文吃透ComfyUI /v1/images/generations接口：OpenAI兼容生图API全解析

306次阅读

长期使用ComfyUI做本地化绘图、业务对接的朋友都知道：ComfyUI原生/prompt接口需要传入完整节点Workflow JSON，适配成本极高，对接LangChain、OneAPI、各类AI中台、第三方应用时，需要二次封装转换格式，开发效率很低。

而 /v1/images/generations 是ComfyUI官方适配OpenAI标准文生图协议的轻量化兼容接口，无需编写复杂工作流JSON，完全对齐OpenAI DALL·E调用格式，是目前ComfyUI业务私有化部署、跨平台对接、快速开发最优的生图接口，本文从零拆解接口原理、参数、调用代码、踩坑方案，零基础可直接复用。

一、接口基础认知：它和原生/prompt接口有什么区别？

1. 接口定位

接口地址：默认 http://127.0.0.1:8188/v1/images/generations
请求方式：POST
协议标准：完全兼容 OpenAI DALL·E v1 文生图协议
启用条件：ComfyUI 版本 ≥ v0.3.10（新版默认内置，无需额外插件；旧版需安装comfyui-openai-adapter适配插件）

2. 核心优劣对比

接口	调用门槛	格式复杂度	自定义工作流	第三方框架适配
原生 /prompt	高	需完整Workflow节点JSON	全自由度自定义	需二次封装，适配难度大
/v1/images/generations	极低	极简OpenAI格式	绑定预设基础工作流	开箱即用，适配所有OpenAI生态

适用场景选型：简单文生图、平台对接、中台接入、小程序开发 → 用/v1/images/generations；复杂可控LoRA堆叠、控骨、分块渲染、定制节点流水线 → 用原生/prompt接口

二、接口请求全参数详解（必填+可选全覆盖）

该接口请求体1:1复刻OpenAI DALL·E，同时拓展了ComfyUI专属绘图参数，兼顾通用性与本地化绘图能力，以下为生产级可用参数。

✅ 必填参数

promptstring：正向绘图提示词，支持中文、英文，支持模型原生语法，例：二次元少女，蓝天白云，日系插画，8k

✅ 通用可选参数（对齐OpenAI标准）

nint：生成图片数量，范围1-10，默认=1
sizestring：画布尺寸，支持标准尺寸：512x512、768x768、1024x1024、1024x1792，默认512×512
modelstring：指定绘图模型，需提前放入ComfyUI models目录，例：sdxl_v10、majicmixRealistic_v7
response_formatstring：返回格式，可选url / b64_json，内网对接推荐b64_json，公网部署推荐url

✅ ComfyUI拓展专属参数（核心实用）

negative_prompt：反向负面提示词，过滤畸形、低画质内容
seedlong：随机种子，固定种子可复刻同款图像，-1为随机种子
stepsint：采样步数，默认20，建议20-35，越高画质越好、速度越慢
cfg_scalefloat：提示词遵从度，默认7，范围1-15，数值越大越贴合提示词
sampler：采样器，支持euler、dpm++2m、ddim，默认dpm++2m

三、极简调用示例（Python + CURL 双版本，直接复制可用）

前提：本地ComfyUI正常启动，端口8188放行，防火墙允许内网访问

1. CURL 一键测试（终端直接执行）

curl -X POST http://127.0.0.1:8188/v1/images/generations \
-H "Content-Type: application/json" \
-d '{
  "prompt": "赛博朋克城市，雨夜，霓虹灯光，超写实，8k",
  "negative_prompt": "模糊，低画质，畸形，水印",
  "n": 1,
  "size": "1024x1024",
  "steps": 28,
  "cfg_scale": 7,
  "response_format": "b64_json"
}'

2. Python requests 生产调用代码

import requests
import base64

# 接口地址
API_URL = "http://127.0.0.1:8188/v1/images/generations"

payload = {
    "prompt": "古风汉服美女，江南水乡，水墨国风，高清",
    "negative_prompt": "人脸崩坏，手指畸形，黑白，劣质画质",
    "n": 1,
    "size": "768x768",
    "seed": 666888,
    "steps": 30,
    "cfg_scale": 8,
    "sampler": "dpm++2m",
    "response_format": "b64_json"
}

res = requests.post(API_URL, json=payload, timeout=120)
result = res.json()

# 解析base64图片并保存
img_b64 = result["data"][0]["b64_json"]
with open("./output.jpg", "wb") as f:
    f.write(base64.b64decode(img_b64))
print("生图完成，图片已保存")

3. 标准返回体结构

{
  "created": 1792123658,
  "data": [
    {
      "b64_json": "xxxx图片base64编码",
      "url": "http://127.0.0.1:8188/view?filename=xxx.png&type=output"
    }
  ]
}

四、核心底层原理：接口如何简化ComfyUI调用？

很多开发者疑惑：为什么这个接口不用传节点Workflow？底层运行逻辑分为3步：

内置模板绑定：ComfyUI后台内置一套标准化【加载模型→编码提示词→潜空间采样→解码出图】通用工作流模板，无需用户自定义节点
参数自动映射：前端传入prompt、steps、seed等参数，接口自动映射填充至内置工作流对应节点参数
复用原生调度：交由ComfyUI队列调度、GPU推理，推理完成后封装为OpenAI格式返回数据

进阶自定义：可修改ComfyUI配置文件，替换接口默认内置工作流，自定义专属基底绘图流水线，保留OpenAI调用格式。

五、业务落地高频问题&避坑指南

❌ 问题1：访问404，不存在/v1/images/generations路由

解决方案：

升级ComfyUI到最新main分支版本
启动命令添加兼容参数：python main.py --enable-openai-api
旧版手动安装适配插件：pip install comfyui-openai-endpoint

❌ 问题2：指定LoRA不生效

解决方案：提示词内使用SD标准LoRA语法即可，接口自动解析：<lora:古风服饰_v1:0.8>

❌ 问题3：公网url无法访问图片

解决方案：启动添加跨域+外网访问参数 --listen --cors-origin *，同时开放8188端口防火墙

❌ 问题4：批量生成n>1报错

解决方案：调低单次生成数量，显存低于8G建议单次n≤2，避免CUDA显存溢出

六、接口适配生态（为什么开发者都在用？）

中台对接：无缝接入OneAPI、NewAPI，和GPT、DALL·E统一调用管理
框架适配：原生支持LangChain、LlamaIndex、n8n自动化工作流
客户端适配：所有支持自定义OpenAI接口的绘图APP、小程序、后台均可直接接入
私有化部署：替代付费DALL·E，本地私有化控模型、控数据，无外网扣费

七、总结&选型建议

1. /v1/images/generations核心价值：抹平ComfyUI原生接口复杂度，一套OpenAI格式，打通本地SD绘图+全网AI应用生态，大幅降低二次开发成本；

2. 选型结论：轻量化业务、快速对接、标准化生图首选本接口；特效级、节点定制化、可控度极高的绘图项目，依旧使用原生/prompt接口；

3. 后续进阶：可拓展对接/v1/images/edits图生图接口、/v1/chat/completions图文理解接口，全套打通ComfyUI OpenAI全系能力。

💬 互动交流：你平时用ComfyUI对接业务更喜欢兼容接口还是原生接口？遇到接口报错可以留言，统一答疑适配配置方案～

正文完

可以使用微信扫码关注公众号（ID：xzluomor）

AI AIGC AI应用 ComfyUI CUDA DALL·E GPT OpenAI Prompt Python 城市工作开发者

发表至： ComfyUI

2026年6月16日

0

保姆级教程｜ComfyUI 本地跑通 Wan2.2 最新视频生成模型（文生视频/图生视频）

已解决｜ComfyUI启动报错：unrecognized arguments: –enable-openai-api 全网最简修复教程

Bernini-R + ComfyUI 完整部署使用指南

从零看懂ComfyUI生图工作流：告别一键出图，拿捏AI绘画精准控制权

深度拆解｜Hermes Agent `/v1/images/generations` 图像生成接口全指南