使用 AI 生成的内容进行 SEO 是否属于抄袭?


随着越来越多的人采用 AI 工具为 SEO 生成内容,灵感与抄袭之间的界限变得模糊。 

许多人都在问:在内容创作中使用人工智能是抄袭吗?还是这只是创意协作进化的下一步?

让我们探索一下。

人工智能如何创造内容

让我们看看人工智能如何生成内容,为本次讨论奠定基础。

人工智能使用机器学习 (ML)、自然语言处理 (NLP) 和自然语言生成 (NLG) 生成文本。

机器学习

ML 是人工智能的一个子集,涉及训练模型以识别模式并做出基于数据的决策。 

这是使 NLP 和 NLG 成为可能的基础。该过程大致如下: 

  • 收集由书籍、文章、网站等文本组成的海量数据集。
  • ML 模型在这些数据集上进行训练。 
  • 模型在分析数据时学习语言模式、上下文、语法和结构。

模型可以随着时间的推移而改进,而无需为特定任务明确编程。  

自然语言处理

NLP 通过理解和处理人类语言发挥作用。NLP 可以执行以下操作:

  • 将文本分解为单词或短语等更小的单位。
  • 分析句子的语法结构。
  • 识别和分类文本中的名称、日期和地点等实体。
  • 确定文本的情感基调。

自然语言生成

NLG 涉及使用在 ML 训练阶段学习到的模式和结构来生成文本。

NLG 包括: 

  • 决定在生成的文本中包含哪些信息。
  • 将内容组织成合理的顺序。
  • 将信息组合成连贯的句子。
  • 将结构化内容转换为语法正确的句子。

简而言之,机器学习模型获取预先存在的数据,对其进行分析并在此基础上生成新文本。 

什么是剽窃?

剽窃的传统定义是,未经过适当承认就使用他人的作品、想法或表达方式,并将其当作自己的作品。 

它可能涉及逐字复制文本、未经授权过度解释,甚至未经适当授权使用他人的想法或理论。 

原创性在评估抄袭时起着一定作用。原创作品是指通过自己的思考、分析和综合信息创作的内容。 

从技术上讲,当你使用 AI 工具来创建内容时,你依赖于 AI 对数据的分析——这些数据是从其他人的原创作品中输入的。

这听起来很像抄袭。但事实并非如此。

人工智能内容是根据他人的想法和喜好进行训练的

AI 内容是在海量数据集上进行训练的。换句话说,就是其他人的想法。

但从理论上讲,当人工智能生成文本时,文本是动态生成的,而不是从训练数据中直接复制任何特定文本。

因此,从这个意义上来说,人工智能生成的文本可以被视为原创,因为它是每次提示时新创建的。 

但这并非万无一失。

在某些情况下,人工智能生成的内容可能非常接近复制思想和句子,让人感觉像是抄袭。 

此外,人工智能工具还可以针对特定的写作风格或人物的相似性进行训练,尝试模仿其他人组合文字和想法的方式。 

那么,人工智能是否窃取了创意?从某些角度来看,答案是肯定的。 

例如,一位名叫乔迪·库克 (Jodie Cook) 的作家,当她提示 ChatGPT 撰写有关儿童创业精神的文章时,它使用了她在网上发表的一篇原创文章中的“多个完全相同的句子”。 

事实上,针对 OpenAI 侵犯版权的诉讼已经有很多,这表明库克并不是唯一一个这么做的人。 

例如,一些报纸作家对 OpenAI 提起诉讼,指控其成果被用于训练人工智能模型。

到目前为止,至少有一起案件,OpenAI 获得了对其有利的裁决。

人工智能也遇到了更多麻烦。一个例子是索尼,它希望公司停止使用索尼音乐和歌词来训练人工智能系统。

还有女演员斯嘉丽·约翰逊,她反对人工智能利用她的肖像来复制她的声音。 

所有这些都表明每个人都在试图弄清楚人工智能的道德使用和剽窃问题。

内容创作者不是一直在借鉴想法吗?

内容创作者总是从他人的作品中汲取灵感。即使是世界上最受欢迎的作家也受到文学的影响。 

在线上领域,内容创建者在撰写内容之前使用搜索结果来研究主题的情况并不少见。

但灵感和剽窃之间是有区别的。 

熟练的内容创作者将研究和综合来自各种来源的信息,添加自己的分析并提供引用。

即使是在借鉴他人的想法时,人们也期望会出现新的见解或观点。这就是原创、发人深省的内容的本质。

非原创内容的问题 

在没有专业知识的情况下发布的人工智能生成内容的一个主要问题是内容平淡、缺乏原创性。 

非原创内容算抄袭吗?有可能。 

如果您只是使用 AI 工具从网络上抓取他人的想法并将它们拼接在一起,而没有添加您的想法、分析和写作风格(也称为拼凑式或马赛克式抄袭),那么这可能就是抄袭。 

无论如何,这都是普通内容。没有帮助的内容,不会给对话增添任何新内容。 

谷歌搜索多年来一直在与非原创内容作斗争,而人工智能的出现只会让情况变得更糟。

例如,如果网站发布者过度依赖人工智能为其网站生成的内容,并且人工智能内容在搜索结果中排名靠前,那么一些人工智能工具就会在网络上搜索某个主题的数据时简单地重复人工智能的想法。  

作者玛吉·哈里森·杜普雷 (Maggie Harrison Dupré)指出

  • “当你将合成内容反馈给生成式人工智能模型时,奇怪的事情就开始发生了。这就像数据近亲繁殖,导致输出越来越混乱、平淡和糟糕。” 

这确实是一个令人不安的想法。

价值百万美元的问题是:使用人工智能生成的内容是否被视为抄袭?

事实证明,目前还没有人能给出明确的答案。不过,许多人正在尝试制定使用人工智能生成内容的指导方针。

例如,美联社和其他出版商正在制定有关人工智能的指南,大学也在制定自己的政策。

如果我们要自行管理人工智能的使用,那么我们能做的最好的事情就是依靠我们自己对情况的道德分析。

这很大程度上与我们对人工智能输出的处理有关。

当我们仅仅依赖人工智能生成的内容(没有任何人工参与和编辑)时,我们正在扼杀创造力并可能发布不准确的信息。 

从营销角度来看,问题是:它能让你从众多噪音中脱颖而出吗?如果答案是否定的,那么你可能需要重新考虑如何制作内容了。 

如何使用人工智能而不抄袭

人工智能是一种工具,而不是解决方案。它是您最好的内容创建者的得力助手,而不是替代品。

如果您可以找到合适的 AI 工具来协助您完成内容创建过程的正确部分,请接受它。 

(有关此主题的更多信息,请参阅我在 Search Engine Land 上发表的关于如何为 AI 生成的内容添加人性化元素的文章。)

以下是使用 AI 内容时避免抄袭的一些方法:

  • 确保文本是原创的,即它不是任何来源的直接复制。您可以使用各种抄袭检查器来提供帮助,但准确性取决于工具。  
  • 确保对 AI 生成的文本进行了额外的分析和编辑,以使其成为您自己的文本并融入您的专业知识。
  • 如果您没有对 AI 生成的文本进行大量编辑,则应披露其使用情况,并注明内容创建中使用的特定 AI 工具(就像您在研究期间使用的任何来源一样)。 

虽然人工智能可以成为内容创作的强大工具,但它无法取代人类的聪明才智和批判性思维。

原创的本质在于人类的洞察力和创造力为数据驱动的输出注入生命的过程。 

当我们拥抱人工智能时,让我们以负责任的方式去做,确保我们的创造符合道德规范并真正具有创新性。


我们邀请投稿作者为 Search Engine Land 撰写内容,并根据他们的专业知识和对搜索社区的贡献进行选择。我们的投稿者在编辑人员的监督下工作并检查投稿的质量和与读者的相关性。他们表达的观点是他们自己的。


发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注