如何使用 AI 图像生成器 DALL-E 和 Midjourney

2024-04-11 08:00:00 · 飞浪 · 泽维尔·莫雷拉

了解如何使用 DALL-E 和 Midjourney 图像生成器工具创建 AI 生成的图像，同时牢记风险。

您是否听过这样一句话：“一图胜千言？”

图像可以增强理解、激发情感并创造更多视觉吸引力。但找到合适的图像并不总是一件容易的事。虽然有 Getty Images 和 iStockPhoto 等网站，但这些照片可能很贵——而且您可能找不到您想要的确切照片。

如果您可以通过文本描述您要查找的内容并获取所需的图像，会怎么样？欢迎使用AI 图像生成。

开始之前：创建和使用人工智能生成图像的风险

一会儿，我将向您展示如何创建看起来像是直接来自您想象的图像。但首先我需要告诉您几件事。

人工智能模型必须基于现有数据进行训练才能创建新内容，无论是文本、预测还是图像。基于图像的生成式人工智能平台使用的许多模型都是基于公开数据进行训练的。然而，图像公开并不意味着它是免费提供的。

一些由 AI 图像生成器生成的照片可能与受版权保护的图像过于相似。在使用 AI 生成的图像之前，请检查您计划发布或使用它的平台的规则。有些平台要求您在使用 AI 创建的任何图像上添加水印或免责声明。

在某些情况下，你根本不应该使用人工智能生成的图像。你还必须记住，你不会受到任何法律保护。

我不想阻止你尝试这些工具，但在尝试之前你应该意识到风险。话虽如此，让我向你介绍 DALL-E 和 Midjourney。

如何使用 DALL-E 和 ChatGPT-4 创建图像

DALL-E是一系列 AI 模型，可用于根据自然语言创建图像。在撰写本文时，最新版本是 DALL-E 3。它集成到 ChatGPT Plus 订阅中，可通过 OpenAI API 获得。

有趣的事实：DALL-E 这个名字来自于动画皮克斯机器人 WALL-E 和西班牙艺术家萨尔瓦多·达利的名字。

要在 DALL-E 中生成图像：

打开ChatGPT-4。（您必须是 ChatGPT Plus 订阅者才能访问。）
写一个提示来描述您想要的图像。
按回车键。

是的，就是这样！

简单性使得基于图像的生成式 AI 如此有价值（这也是为什么谨慎使用这些图像很重要）。现在，让我给你一些关于如何改进你的图像生成游戏的提示。

使用 DALL-E 创造更好图像的 4 个技巧

您可以采取多种措施来提高所生成图像的质量。

1. 让 ChatGPT 帮你写提示

您可以要求 ChatGPT 为图像生成创建清晰的提示。创建提示来生成其他提示是基于文本的生成式 AI 中的常见做法。

2. 为图像生成器创建清晰的提示

ChatGPT 无法读懂您的想法。当您请求图片时，请包含所有详细信息。例如，您可以指定风格、背景、人数以及任何其他详细信息。

如果您不清楚，您可能会收到意外的输出。例如，在下面的例子中，我要求 ChatGPT 为我的图像创建提示，但由于我不清楚，它立即开始创建图像。

3. 更改 AI 生成图像的纵横比

使用图像生成器创建图片后，您可以要求进行更改。例如，您可以要求不同的纵横比。在本例中，我要求 16:9，这通常用于演示文稿和视频。

4. 更改 AI 生成图像的各个组成部分

您可以修改 AI 生成图像的单个元素。例如，假设我想要一只粉色独角兽，而不是白色的。

如何使用 OpenAI API 使用 DALL-E

如果您需要以编程方式生成图像，则可以使用 OpenAI API 通过图像生成端点使用 DALL-E 生成新图像。以下是您需要执行的操作。

1. 获取 OpenAI API 访问权限

确保您可以访问 API。为此，您需要注册并获取 API 密钥。

2. 确定如何访问 API

直接访问图像生成端点是使用 API 的最直接方式（并且适用于所有语言）。您还可以使用官方支持或社区管理的OpenAI 库之一，它们提供了一种使用 API 的简便方法。

3.准备请求、进行 API 调用并解析响应

获得 API 密钥并决定如何访问 API 后，就可以开始编码了。在本例中，我将使用 Python 并通过 HTTP 调用来调用端点。

首先，我指定端点的 URL。然后，我描述数据。这包括提示、我想要的图像数量和图像大小。

      URL = "https://api.openai.com/v1/images/generations"

data = {
    "prompt": "A unicorn flying on top of the rainbow on the moon",
    "model": "dall-e-2",
    "n": 2,
    "size": "1024x1024"
}
    

接下来，我创建一个函数来发出 HTTP 请求。这不包含任何特殊内容；它只是对作为参数收到的 URL 进行 POST 调用并设置授权标头和数据。

      def make_openai_request(url, data=None):
    """Takes a prompt as an argument and sends a POST request to the OpenAI API"""

    headers = {
        'Authorization': f'Bearer {key}'
    }
    if data:
        headers['Content-Type'] = 'application/json'
    response = requests.post(url, headers=headers, json=data, timeout=20)

    if response.status_code == 200:
        result = response.json()
        return result
    print('Request failed with status code:', response.status_code)
    return None
    

现在我打电话。

      request_result = make_openai_request(URL, data)

返回值是一个 URL，我可以使用这个 URL 下载结果中收到的图像。下面是一个包含两张图片的示例结果。

您现在可以尝试图像变化、修复和其他因模型而异的功能。有关如何使用 OpenAI API 和 DALL-E 生成图像的更详细说明，请查看我的课程使用 Python 和 Open AI 开发生成式 AI 应用程序。

如何使用 Midjourney AI 图像生成器

Midjourney 是使用 AI 和自然语言提示生成图像的另一个不错的选择。Midjourney 的工作原理与 OpenAI 的 DALL-E 平台类似。以下是您需要了解的入门信息。

1. 访问 Discord 和 Midjourney

您可以在Discord平台内使用 Midjourney，因此您需要创建一个 Discord 帐户或登录现有帐户才能使用它。由于Midjourney不是免费的，因此您还需要选择一个订阅计划。计划根据资源量和 GPU 时间而有所不同，这决定了您可以生成多少张图像。

2. 导航到 Discord 中的新手频道

进入 Midjourney Discord 服务器后，导航到新手频道。每个频道旁边都有一个数字，但选择哪个频道并不重要。

这些频道专为初学者设计，帮助他们开始使用 Midjourney 机器人。（您也可以在邀请 Midjourney 机器人的其他频道或服务器上生成图像，但目前我们先使用新手频道。）

3. 使用 Midjourney 生成第一张图片

接下来，生成图像。输入/imagine，然后写下你的提示。

就像我对 DALL-E 所做的那样，我会要求“一只独角兽在月球上的彩虹之上飞翔”。

<img data-cmp-is="ps-image" src="/content/dam/ps/images/resource-center/blog/screenshots/ai/how-to-use-ai-image-generators-dall-e-and-midjourney/ai-image-generators-7.webp" class="ps-image size-full" loading="lazy" alt="请为此图像设

_{免责声明：本内容来源于第三方作者授权、网友推荐或互联网整理，旨在为广大用户提供学习与参考之用。所有文本和图片版权归原创网站或作者本人所有，其观点并不代表本站立场。如有任何版权侵犯或转载不当之情况，请与我们取得联系，我们将尽快进行相关处理与修改。感谢您的理解与支持！}

_查看原文

人工智能

数据科学

阅读全文