🖼 图像生成配置¶
配置变量 | 可选值 | |
---|---|---|
IMAGE_PROVIDER |
dalle huggingface sdwebui |
默认值: dalle |
DALL-e¶
在 .env
文件中,确保 IMAGE_PROVIDER
被注释掉(或设置为 dalle
):
# IMAGE_PROVIDER=dalle # 这是默认值
进一步的可选配置:
配置变量 | 可选值 | 默认值: 256 |
---|---|---|
IMAGE_SIZE |
256 512 1024 |
默认值: 256 |
Hugging Face¶
要使用 Hugging Face 的文本到图像模型,您需要一个 Hugging Face API 令牌。 链接到适当的设置页面:Hugging Face > 设置 > 令牌
一旦您有了 API 令牌,请取消注释并在您的 .env
文件中调整这些变量:
IMAGE_PROVIDER=huggingface
HUGGINGFACE_API_TOKEN=你的Hugging Face API令牌
进一步的可选配置:
配置变量 | 值 | |
---|---|---|
HUGGINGFACE_IMAGE_MODEL |
参见可用模型 | 默认值:CompVis/stable-diffusion-v1-4 |
稳定扩散WebUI¶
您可以使用自己托管的稳定扩散WebUI与AutoGPT一起使用:
IMAGE_PROVIDER=sdwebui
注意
确保您正在运行启用了--api
的WebUI。
进一步的可选配置:
配置变量 | 值 | |
---|---|---|
SD_WEBUI_URL |
您的WebUI的URL | 默认值:http://127.0.0.1:7860 |
SD_WEBUI_AUTH |
{用户名}:{密码} |
注意:不要复制大括号! |
Selenium¶
sudo Xvfb :10 -ac -screen 0 1024x768x24 & DISPLAY=:10 <YOUR_CLIENT>
Selenium是一个用于自动化浏览器操作的工具。它可以模拟用户在浏览器中的行为,例如点击、输入文本等操作。使用Selenium,您可以编写自动化测试脚本,以验证您的网站在不同浏览器和操作系统上的表现。
上面的命令是在Linux系统中使用Xvfb(虚拟帧缓冲)启动一个虚拟的X服务器。Xvfb允许您在没有物理显示器的情况下运行图形应用程序。命令中的:10
表示虚拟X服务器的显示号码,-ac
表示允许任何客户端连接到X服务器,-screen 0 1024x768x24
表示设置虚拟屏幕的分辨率为1024x768像素,颜色深度为24位。
DISPLAY=:10
是一个环境变量,它告诉应用程序将其显示输出发送到虚拟X服务器的显示号码为10的屏幕上。
<YOUR_CLIENT>
是您要运行的客户端应用程序的命令。您可以将其替换为您要运行的实际应用程序的命令。
通过运行上述命令,您可以在虚拟X服务器上运行客户端应用程序,并将其显示输出发送到虚拟屏幕上。这对于在没有物理显示器的服务器上运行自动化测试非常有用。