Skip to content

🖼 图像生成配置

配置变量 可选值
IMAGE_PROVIDER dalle huggingface sdwebui 默认值: dalle

DALL-e

.env 文件中,确保 IMAGE_PROVIDER 被注释掉(或设置为 dalle):

# IMAGE_PROVIDER=dalle    # 这是默认值

进一步的可选配置:

配置变量 可选值 默认值: 256
IMAGE_SIZE 256 512 1024 默认值: 256

Hugging Face

要使用 Hugging Face 的文本到图像模型,您需要一个 Hugging Face API 令牌。 链接到适当的设置页面:Hugging Face > 设置 > 令牌

一旦您有了 API 令牌,请取消注释并在您的 .env 文件中调整这些变量:

IMAGE_PROVIDER=huggingface
HUGGINGFACE_API_TOKEN=你的Hugging Face API令牌

进一步的可选配置:

配置变量
HUGGINGFACE_IMAGE_MODEL 参见可用模型 默认值:CompVis/stable-diffusion-v1-4

稳定扩散WebUI

您可以使用自己托管的稳定扩散WebUI与AutoGPT一起使用:

IMAGE_PROVIDER=sdwebui

注意

确保您正在运行启用了--api的WebUI。

进一步的可选配置:

配置变量
SD_WEBUI_URL 您的WebUI的URL 默认值:http://127.0.0.1:7860
SD_WEBUI_AUTH {用户名}:{密码} 注意:不要复制大括号!

Selenium

sudo Xvfb :10 -ac -screen 0 1024x768x24 & DISPLAY=:10 <YOUR_CLIENT>

Selenium是一个用于自动化浏览器操作的工具。它可以模拟用户在浏览器中的行为,例如点击、输入文本等操作。使用Selenium,您可以编写自动化测试脚本,以验证您的网站在不同浏览器和操作系统上的表现。

上面的命令是在Linux系统中使用Xvfb(虚拟帧缓冲)启动一个虚拟的X服务器。Xvfb允许您在没有物理显示器的情况下运行图形应用程序。命令中的:10表示虚拟X服务器的显示号码,-ac表示允许任何客户端连接到X服务器,-screen 0 1024x768x24表示设置虚拟屏幕的分辨率为1024x768像素,颜色深度为24位。

DISPLAY=:10是一个环境变量,它告诉应用程序将其显示输出发送到虚拟X服务器的显示号码为10的屏幕上。

<YOUR_CLIENT>是您要运行的客户端应用程序的命令。您可以将其替换为您要运行的实际应用程序的命令。

通过运行上述命令,您可以在虚拟X服务器上运行客户端应用程序,并将其显示输出发送到虚拟屏幕上。这对于在没有物理显示器的服务器上运行自动化测试非常有用。