如何利用生成式人工智能创建图像和视觉效果


在创建博客文章或新闻文章的过程中,每个小型出版商都害怕遇到这样一个时刻:

“我应该用什么来制作我的特色图片?”

代理商和媒体公司有创意总监、摄影师和艺术家随时为他们创造形象。但我们其他人怎么办呢?

尽管我们不会做出更好的判断,但有些人还是会去 Google 图片。其他人会去 Pexels 或 Unsplash 等免费网站。有些人会去 Adob​​e Stock、iStock 或 Shutterstock 等网站付费购买图片。

希望所有读到这篇文章的人都知道为什么从网上窃取图片不是一个好主意。除非你使用的是公共领域的图片,否则你下载的图片是属于某人的。

如果您计划拓展业务或品牌,您肯定不希望您的网站充斥着未经授权的图片,因为有一天这些图片可能会给您带来麻烦。

至于库存照片,每个使用过库存照片网站的人都经历过这样的沮丧:翻遍一页又一页的搜索结果,却找不到合适的照片。很多库存照片都是重复的、普通的或陈词滥调的,简直成了笑话

如果你碰巧找到一张不错的库存照片,很可能它已经被重复使用过。

例如,Pexels 上这张多元化同事的照片已被下载超过 75,000 次,并出现在 175 个网站的 Google 图片中。讽刺的是,这与“多元化”恰恰相反。

过度使用的照片

AI 图像生成器

还记得我说过大公司有创意总监、摄影师和艺术家随时待命吗?有了 AI 图像生成器,你现在也可以拥有所有这些。

目前,有两种类型的网站被广泛用于从文本生成图像。

第一类是只关注图像的网站。最受欢迎的是 Midjourney。第二受欢迎的是采用开源 Stable Diffusion 模型的网站,例如 Stability.Ai 自己的 DreamStudio。 

创意人员和设计师倾向于青睐这些平台,因为它们专注于人工智能艺术;它们处于图像质量的前沿,并为艺术家提供了许多定制和微调选项。

在本文中,我将重点介绍人工智能聊天机器人,营销人员和非艺术家更容易接受这种机器人。

截至撰写本文时,Anthropic 的 Claude 不支持文本转图像,而 Google Gemini 对我来说太不一致了。(我在那里测试的大多数提示都导致错误消息或与我要求的图像不匹配。)

另一方面,OpenAI 的 ChatGPT(由 DALL-E 提供支持的图像生成)和 X 的 Grok(由 FLUX.1 提供支持的图像生成)的表现令人惊叹。 

截至撰写本文时,ChatGPT Plus 每月收费 20 美元。它包括 DALL-E 图像生成和对 ChatGPT 聊天机器人的访问。

我在 4 月份撰写文章时就想到了 ChatGPT,当时我预测人们一旦习惯了使用人工智能聊天机器人,就会减少使用 Google。从那时起,我可以说,我以前在 Google 上进行的搜索中有 80% 现在都是在 ChatGPT 上进行的。

Grok 是社交媒体平台 X 的高级套餐的一部分,每月收费 8 美元。这个价格可以让你使用 FLUX.1 图像生成,以及 Grok 的聊天机器人和 X 上的高级功能。

至于你应该选择哪一个,我建议两者都选。

目前,我认为 ChatGPT 作为聊天机器人的实用性仍然领先于 Grok,而 Grok 在艺术创作方面无疑更胜一筹。

您马上就会看到,每月 28 美元与您仅从图像生成中获得的价值相比只是一笔微不足道的费用,更不用说 AI 聊天机器人可以提高您的工作效率的所有其他方式了。

生成式人工智能作为你的个人创意总监、摄影师和艺术家

对于那些以前从未使用过 AI 聊天机器人进行文本到图像生成的人,我将快速介绍一下它的工作原理。

假设您正在撰写一篇博客文章或一篇关于如何购买床垫的文章,并且您需要选择一张特色图片。

您无需到处寻找图像,只需将其输入到聊天机器人中即可。

  • “给我画一个商店里的盒装床垫。”

以下是我得到的结果:

ChatGPT

chatgpt-盒式床垫店内

格罗克

grok 床垫商店

你可以看到,Grok 明白我的意思,而 ChatGPT 认为我在说“盒子里的床垫”。Grok 得一分。

虽然这是一张漂亮的照片,但实际上你在任何图片库网站上都找不到。让我们面对现实吧——它和大多数“床垫图片库”一样无聊、重复、缺乏创意。 

让我们改变这一点。

在提示中提供更多详细信息

假设您在文章中引用了《豌豆公主》的故事。然后您突然想到,一个漂亮的视觉效果可能是公主睡在一堆床垫上。 

在您的聊天机器人中输入此提示:

  • “生成一幅公主睡在一堆床垫上的图像。”

以下是 ChatGPT 给我的信息:

chatgpt-公主和豌豆

Grok 给了我什么:

grok-最后的公主

您可以开始看到 ChatGPT 和 Grok 在处理“艺术”方面的区别。

ChatGPT 倾向于插图,而 Grok 似乎更倾向于照片写实主义。当然,你可以“要求”他们尝试以你喜欢的任何风格进行绘画。

我应该说,我并没有立即从这两个人工智能那里得到这些图像。事实上,我从这两个人工智能那里得到的第一张图片根本不符合我的要求。但我和聊天机器人“交谈”就像和创意总监交谈一样。

以下是我与 Grok 的“对话”,以获得最终的图像:

  • “给我画一幅画,上面有一堆床垫,一位公主正在睡觉。”
格罗克公主 1
  • “它们看起来不像床垫,更像是毯子。你能给我画出你在商店里能找到的那种盒式床垫吗?”
格罗克公主 2
  • “我需要把它们叠起来,让一位公主睡在上面。”
格罗克公主 3
  • “更多床垫!”
<img class="wp-image-446519 entered exited" src="data:;base64,” alt=”格罗克公主 4″ width=”1024″ height=”768″ data-lazy-srcset=”https://searchengineland.com/wp-content/seloads/2024/09/grok-princess-4.jpeg.webp 1024w,https://searchengineland.com/wp-content/seloads/2024/09/grok-princess-4-451×338.jpeg.webp 451w,https://searchengineland.com/wp-content/seloads/2024/09/grok-princess-4-800×600.jpeg.webp 800w,https://searchengineland.com/wp-content/seloads/2024/09/grok-princess-4-151×113.jpeg.webp 151w,https://searchengineland.com/wp-content/seloads/2024/09/grok-princess-4-768×576.jpeg.webp 768w” data-lazy-sizes=”(max-width: 1024px) 100vw, 1024px” data-lazy-src=”https://searchengineland.com/wp-content/seloads/2024/09/grok-princess-4.jpeg.webp” />
  • “更多床垫!”
<img class="wp-image-446520 entered exited" src="data:;base64,” alt=”格罗克公主 5″ width=”1024″ height=”768″ data-lazy-srcset=”https://searchengineland.com/wp-content/seloads/2024/09/grok-princess-5.jpeg.webp 1024w,https://searchengineland.com/wp-content/seloads/2024/09/grok-princess-5-451×338.jpeg.webp 451w,https://searchengineland.com/wp-content/seloads/2024/09/grok-princess-5-800×600.jpeg.webp 800w,https://searchengineland.com/wp-content/seloads/2024/09/grok-princess-5-151×113.jpeg.webp 151w,https://searchengineland.com/wp-content/seloads/2024/09/grok-princess-5-768×576.jpeg.webp 768w” data-lazy-sizes=”(max-width: 1024px) 100vw, 1024px” data-lazy-src=”https://searchengineland.com/wp-content/seloads/2024/09/grok-princess-5.jpeg.webp” />
  • “不不,给我画至少 10 张叠在一起的床垫,上面睡着一位公主。”
<img class="wp-image-446521 entered exited" src="data:;base64,” alt=”格罗克公主 6″ width=”1024″ height=”768″ data-lazy-srcset=”https://searchengineland.com/wp-content/seloads/2024/09/grok-princess-6.jpeg.webp 1024w,https://searchengineland.com/wp-content/seloads/2024/09/grok-princess-6-451×338.jpeg.webp 451w,https://searchengineland.com/wp-content/seloads/2024/09/grok-princess-6-800×600.jpeg.webp 800w,https://searchengineland.com/wp-content/seloads/2024/09/grok-princess-6-151×113.jpeg.webp 151w,https://searchengineland.com/wp-content/seloads/2024/09/grok-princess-6-768×576.jpeg.webp 768w” data-lazy-sizes=”(max-width: 1024px) 100vw, 1024px” data-lazy-src=”https://searchengineland.com/wp-content/seloads/2024/09/grok-princess-6.jpeg.webp” />
  • “这个不错,不过床垫的花纹要各不相同。”
<img class="wp-image-446522 entered exited" src="data:;base64,” alt=”Grok 公主 7″ width=”1024″ height=”768″ data-lazy-srcset=”https://searchengineland.com/wp-content/seloads/2024/09/grok-princess-7.jpeg.webp 1024w,https://searchengineland.com/wp-content/seloads/2024/09/grok-princess-7-451×338.jpeg.webp 451w,https://searchengineland.com/wp-content/seloads/2024/09/grok-princess-7-800×600.jpeg.webp 800w,https://searchengineland.com/wp-content/seloads/2024/09/grok-princess-7-151×113.jpeg.webp 151w,https://searchengineland.com/wp-content/seloads/2024/09/grok-princess-7-768×576.jpeg.webp 768w” data-lazy-sizes=”(max-width: 1024px) 100vw, 1024px” data-lazy-src=”https://searchengineland.com/wp-content/seloads/2024/09/grok-princess-7.jpeg.webp” />

虽然花了一段时间,但我终于得到了一个令我满意的。

请注意,我所要做的就是与 Grok 进行“对话”,就像我与创意总监进行对话一样。与真正的创意总监不同,Grok 不会在第七轮修改后将我赶出窗外。

现在,在任何图片库网站上搜索“豌豆公主”或“堆叠的床垫”;你很可能找不到像这里看到的一样好的东西。

你看到的睡在床垫上的女孩?她不存在。不需要模特授权,因为照片里没有真人。 

你可以想象,这改变了一切。我不再需要花费数千美元拍摄照片或 200 美元订阅库存照片,而只需花费 8 美元和大约 2 分钟的时间。 

人工智能的生成究竟是怎样进行的? 

假设你想学画一只金毛猎犬。第一步是学习基本的绘画技巧,比如画基本形状、添加纹理和细节以及添加阴影和深度。

你需要研究大量金毛猎犬的图片,才能了解它们的结构、形态和动作。你需要大量练习和反复练习,才能让你的画作看起来像真的一样。

这本质上与人工智能模型的工作方式相同,只是在人工智能世界中,这个过程被称为“生成对抗网络”和“扩散模型”。

不同之处在于,虽然你可能每周只有几个小时来学习和练习,但人工智能模型可以即时且持续地“学习和练习”。

此外,他们可以获得数十亿张图像来训练它们,包括公共领域图像、知识共享图像和图片库公司授权给他们的图像数据。

深入挖掘:人工智能搜索的视觉优化必备条件

获取搜索营销人员所依赖的新闻通讯。


从人工智能中获取灵感

让我们回到我正在写的那篇假设的博客文章。

虽然商店里的床垫图片,甚至是公主睡在一堆床垫上的可爱照片可能会引起人们的注意,但它能吸引他们点击并滚动阅读你的文章吗?

这就是特色图片的全部意义所在。

除了为您生成图像之外,您还可以使用 AI 帮助您首先提出想法。

让我们尝试一下。我们不要告诉人工智能要为我们生成什么,而是寻求建议。

<img class="wp-image-446523 entered exited" src="data:;base64,” alt=”ChatGPT 创意简报” width=”1696″ height=”1004″ data-lazy-srcset=”https://searchengineland.com/wp-content/seloads/2024/09/chat-creativebrief.png.webp 1696w,https://searchengineland.com/wp-content/seloads/2024/09/chat-creativebrief-571×338.png.webp 571w,https://searchengineland.com/wp-content/seloads/2024/09/chat-creativebrief-800×474.png.webp 800w,https://searchengineland.com/wp-content/seloads/2024/09/chat-creativebrief-191×113.png.webp 191w,https://searchengineland.com/wp-content/seloads/2024/09/chat-creativebrief-768×455.png.webp 768w,https://searchengineland.com/wp-content/seloads/2024/09/chat-creativebrief-1536×909.png 1536w” data-lazy-sizes=”(max-width: 1696px) 100vw, 1696px” data-lazy-src=”https://searchengineland.com/wp-content/seloads/2024/09/chat-creativebrief.png.webp” />

再次强调,我只是像与人类交谈一样与人工智能“交谈”。在这种情况下,ChatGPT 给出了非常好的建议。

但是,如果您不喜欢所给出的建议,请记住,您可以与您的 AI 进行对话,在此过程中提供详细信息和说明,类似于我上面所做的。 

在这种情况下,我要求 ChatGPT 使用其答案作为我的提示来生成图像。我对 Grok 做了同样的事情。这就是他们想出的结果。

ChatGPT

<img class="wp-image-446524 entered exited" src="data:;base64,” alt=”ChatGPT 简介” width=”1024″ height=”1024″ data-lazy-srcset=”https://searchengineland.com/wp-content/seloads/2024/09/brief-chatgpt.webp 1024w, https://searchengineland.com/wp-content/seloads/2024/09/brief-chatgpt-338×338.webp 338w, https://searchengineland.com/wp-content/seloads/2024/09/brief-chatgpt-600×600.webp 600w, https://searchengineland.com/wp-content/seloads/2024/09/brief-chatgpt-113×113.webp 113w, https://searchengineland.com/wp-content/seloads/2024/09/brief-chatgpt-768×768.webp 768w, https://searchengineland.com/wp-content/seloads/2024/09/brief-chatgpt-95×95.webp 95w” data-lazy-sizes=”(max-width: 1024px) 100vw, 1024px” data-lazy-src=”https://searchengineland.com/wp-content/seloads/2024/09/brief-chatgpt.webp” />

格罗克

<img class="wp-image-446525 entered exited" src="data:;base64,” alt=”Grok 简介” width=”1024″ height=”768″ data-lazy-srcset=”https://searchengineland.com/wp-content/seloads/2024/09/brief-grok.jpeg.webp 1024w,https://searchengineland.com/wp-content/seloads/2024/09/brief-grok-451×338.jpeg.webp 451w,https://searchengineland.com/wp-content/seloads/2024/09/brief-grok-800×600.jpeg.webp 800w,https://searchengineland.com/wp-content/seloads/2024/09/brief-grok-151×113.jpeg.webp 151w,https://searchengineland.com/wp-content/seloads/2024/09/brief-grok-768×576.jpeg.webp 768w” data-lazy-sizes=”(max-width: 1024px) 100vw, 1024px” data-lazy-src=”https://searchengineland.com/wp-content/seloads/2024/09/brief-grok.jpeg.webp” />

现在问问自己,作为一名消费者,您更有可能点击哪张图片——是这两张图片中的一张,还是一张床垫的库存照片?

如果您不确定,您还可以使用 AI 做其他事情。针对可以实现您的目标的图像提出不同的假设,然后进行 AB 测试。

借助生成式人工智能,测试不同的图像变得像测试副本一样简单,以优化转化率。

首先,我要声明,这只是我的个人观点和意见,并非法律建议。如有任何法律问题,请咨询律师,最好是精通版权和知识产权法的律师。 

网站上使用图像和摄影时最常出现三类法律:

  • 版权法。
  • 隐私/公开权法。
  • 商标法。 

版权法保护原创作品的创作者。许多人错误地认为,需要注册版权才能使作品有效。 

事实是,您自动拥有您创作的任何内容的版权,即使它只是餐巾纸背面的涂鸦。 

为了让其他人合法使用您创作的任何作品,您需要给予他们许可。在艺术和摄影界,这通常是通过许可证来实现的。 

您在网站上使用的每张不属于您所有且由人工创建的图像(公共领域的图像除外)都应获得许可证。 

即使照片可以免费使用,它也受 Creative Commons 等许可证或 Pexels 或 Unsplash 等免费网站的许可证的保护。

事情就从这里开始变得有趣起来。

由于人工智能不是人类,因此版权法(截至目前)不适用于人工智能生成的作品。

这意味着,无论你使用人工智能创作了什么原创作品,你都可以使用,而不必担心因侵犯版权而被起诉。这也意味着任何人都可以访问你的网站并窃取你的人工智能生成的内容。

随着人工智能生成的内容变得越来越普遍,预计将很快通过法律来解决这些问题。

商标法

即使人工智能创作的原创作品不存在版权问题,人工智能“艺术家”仍然需要遵守与人类艺术家相同的法律和规则。

例如,这幅图像有什么问题?

米奇 Esb Iphone

我在生成这篇文章时说得有些夸张,是为了强调生成式人工智能的一些潜在风险。 

Apple 徽标、现代版米老鼠和帝国大厦均已注册商标。然而,Grok 却能为我生成这幅保真度极高的图像。

虽然大多数人都知道徽标和卡通人物是商标,但许多人并没有意识到建筑和产品设计也可能受到商标保护。

在库存照片领域,Adobe Stock 和 Shutterstock 等大型图片库公司会审查其图库中的每张照片,如果照片包含可识别的商标,则会将其标记为“仅供编辑使用”。这是由于他们在许可中提供的赔偿。

另一方面,Pexels 和 Unsplash 等免费网站允许发布此类图片,例如这张迪士尼世界的灰姑娘城堡的照片,该照片已注册商标,下载量超过 23,000 次,浏览量超过 900 万次。

Pexels 在其许可中明确规定禁止商业使用,但简单的反向图片搜索就会发现,数百个网站不遵守这些条款。虽然迪士尼的律师可以起诉所有这些网站,但他们选择不这样做——至少目前是这样。

生成式人工智能领域也出现了类似的情况,谷歌和OpenAI想尽办法阻止用户生成包含商标的图片。 

Grok 和 Stable Diffusion 允许这样做,将合规责任完全放在用户身上。几乎可以肯定,这将在法庭上得到审议。敬请期待。

顺便说一句,我之所以能够在这里使用这张图片,是因为这里的使用受到了“提名合理使用”原则的保护。

简而言之,本文旨在提供报道、评论和教育。本文使用的图片被视为编辑用途,仅用于提供背景信息,我确保我对商标的使用不代表 Apple、Disney 和帝国大厦所有者的认可或关联。 

隐私和公开权法律

正如人工智能可以生成产品、建筑物和人物的逼真图像一样,它也可以生成非常逼真的人物图像。

人工智能生成的人类图像也可能存在问题,主要是当图像类似于真实人时(无论是有意还是无意)。

许多司法管辖区已经制定了规范“深度伪造”的法律,但与版权法和商标法一样,随着生成式人工智能的使用增长,隐私和公开权法律也将不断发展。

图片库公司已经倒闭了吗?

不一定。原因如下。

大多数人认为,当你在图片库网站上为照片或插图付费时,你是在为下载的图像付费。 

事实并非如此。你实际支付的是合法使用该图片的许可,对于大多数大型图片库公司来说,你还购买了保护。 

正如我上面提到的,对于免费网站,你需要弄清楚你从他们的网站下载的照片的使用是否合法。如果有人决定起诉你,你就得自己承担责任。 

另一方面,较大的图片库公司通常会在您的许可中提供赔偿,这意味着如果您因使用从他们那里购买的图片而被起诉,他们会承担您的至少部分法律费用。

“三巨头”图片库提供商 Getty Images、Shutterstock 和 Adob​​e Stock 均提供生成式 AI 功能,而且它们似乎都为使用这些图片提供了赔偿(参见GettyShutterstockAdob​​e的条款)。 

只要生成式人工智能公司将合规责任转嫁给用户,图片库网站就不会消失。但它们会不断发展。 

不管怎样,你可以将从图片库购买的照片视为购买保险,尤其是在有关人工智能图像的法律不断发展的情况下。大多数规避风险的大公司可能会继续通过图片库公司购买照片。

对于我们其他人来说,只要你花时间了解知识产权法,并在使用生成人工智能时运用常识,我们可能就会没事。

摄影已死? 

最后,我想向在场的摄影师和艺术家们致辞。 

摄影术的发明使许多艺术家失业。数码摄影的发明颠覆了传统摄影。 

库存图像的出现意味着您的照片售价只需几美元,而不是几百美元。免费库存图库的出现意味着您的照片售价只需几美分,而不是几美元。

这只是另一种进化而已。

是的,一些摄影师和艺术家可能会发现自己被取代了。但对于任何有技能和才华的人来说,不管你信不信,对于那些能够适应这个新世界的人来说,未来比以往任何时候都更加光明。

如何?

  • 加倍重视人性:专注于讲述故事的独特能力,而不仅仅是创造图像。不要只拍照或画画。
  • 将人工智能作为一种工具:将 Midjourney 或 Stable Diffusion 等人工智能视为可以提升您的创造力的盟友,而不是威胁。
  • 开发独特的风格:通过创作极具个性和定制风格的艺术作品,让自己与人工智能区分开来。通用内容不会在人工智能生成的作品中脱颖而出。
  • 成为一个讲故事的人:不要让你的艺术“为自己说话”。解释你的作品背后的过程和目的,特别是在 Behance 或 Dribbble 等平台上展示时。
  • 领先 AI 一步:当您尝试使用 AI 时,您很快就会发现它在最详细的长尾查询方面仍然很糟糕。在某些情况下,这仅仅是因为它还没有足够的训练数据;在其他情况下,再多的训练也无济于事。专注于 AI 难以处理的细节、特定概念和品牌工作。预测趋势并快速适应。
  • 量化您作品的价值:您可以肯定,营销人员会急于接受生成式人工智能作为“解决方案”,但从不理解他们应该解决的问题。艺术家需要能够表达其作品的更深层价值和影响,提醒营销人员艺术不仅仅是美学。
  • 不断创新:虽然人工智能最终可能会复制您的创新,但您的优势在于不断创造和突破界限。

生成式人工智能将继续存在

一些人会抵制它,而另一些人会变得过于依赖它。两者都会被抛在后面。

另一方面,那些将其作为工具但在此过程中不会丧失人性的人将在这个新世界中取得成功并蓬勃发展。

深入挖掘:高级图像 SEO:秘密手册


我们邀请投稿作者为 Search Engine Land 撰写内容,并根据他们的专业知识和对搜索社区的贡献进行选择。我们的投稿者在编辑人员的监督下工作并检查投稿的质量和与读者的相关性。他们表达的观点是他们自己的。


发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注