人工智能检查器背后的真相:一个警示故事


如今浏览网页,您很可能会遇到人工智能创建的内容(无论您是否意识到这一点)。

人工智能和人类撰写的内容之间的界限正在迅速模糊,导致人们产生混淆,并对有缺陷的人工智能检测工具产生错误的信任。 

但这些所谓的电子守门人——旨在将人类制作的内容与人工智能内容区分开来——错误地将真正的人类写作标记为人工智能生成的。

尽管可靠性值得怀疑,但我们行业中的许多人仍将人工智能检查器视为误导性的盾牌,可能会根据有缺陷的分析限制他们自己的内容创作能力。 

讽刺吗?

这种恐慌在很大程度上是没有必要的,特别是考虑到谷歌明确支持在内容创作中负责任地使用人工智能。

我们看到,由于一个被夸大的问题而出现了很多骚动。

让我们面对现实:人工智能已经在内容营销领域站稳了脚跟。近一半的企业已经以某种形式在内容制作中采用了人工智能。在我们的机构,我们也不会回避它——但我们会负责任地使用它(稍后会详细介绍)。 

本文将揭穿 AI 检查器的迷思,向您展示如何有效地使用 AI,并指导您创建符合 Google 标准并让您的受众不断回来获取更多信息的内容。

让我们从一个令人大开眼界的案例研究开始,该研究以我们的联合合作伙伴之一 MediaFeed 和人工智能检查器 Phrasly 为主角。 

真实案例:我们与联合合作伙伴和 AI 检查员的合作经验

当 MediaFeed 将我们的一篇人工撰写的文章放入名为 Phrasly 的 AI 检查器中时,我们的内容团队遇到了意想不到的障碍。

该工具将此顶级漏斗内容片段(需要与经济和货币相关的清晰、简洁和具体的定义)标记为人工智能生成,这立即引发了人们对此类工具可靠性的担忧。

Phrasly 将我们人工编写的内容识别为 81% 由人工智能生成。
Phrasly 将我们人工编写的内容识别为 81% 由人工智能生成。

我们通过 GPTZero 运行了同一部分,以展示 AI 检查器的不一致性。

有趣的是,GPTZero 认定内容中有 93% 是人类撰写的,这与 Phrasly 的评估直接矛盾。

这种差异凸显了误报的可能性,以及不单纯依赖这些工具进行内容评估的重要性。

GPTZero 将我们人类撰写的内容识别为 93% 是人类生成的。
GPTZero 将我们人类撰写的内容识别为 93% 是人类生成的。

我们的内容创作流程

为了解决 MediaFeed 的担忧,我们详细分解了我们的内容制作流程,并负责任地融入了人工智能。

我们的流程从主题集群开发开始,我们的 SEO 团队在此确定要定位的关键字。然后,我们的内容团队使用此信息进行手动 SERP 研究和分析。他们还使用经过批准的 AI 工具帮助将他们的研究转化为全面、经过事实核查和来源来源的大纲。

然后,我们的作者以此大纲为基础,使用人工智能工具协助研究,并在需要时帮助重写特定部分。 

以下是我们的一位作家如何使用人工智能来帮助重写已被无数次写到的概念的定义的示例:

  • 原句:“汇率就是用一个国家的货币可以买多少另一个国家的货币。”
  • 人工智能辅助改写:“将汇率视为使用一个国家的现金购物时,一个国家货币的价格标签。这就像问‘这个汉堡能买多少个玉米饼?’,不过问的是货币而不是食物。”

然后,我们的作者会完善稿件,确保其符合我们严格的质量标准和客户的意见。稿件定稿后,我们的专业文字编辑和内容主管会分析草稿,确保其符合我们的最佳实践。

每篇内容在交付给客户之前都要经过四个阶段的内部审核:撰稿人、文案编辑、内容主管和客户服务。我们还使用 Copyscape 来验证原创性。

在过去的一年里,我们投入了大量时间研究和测试生成式人工智能工具,如 ChatGPT、Claude、Gemini、Jasper 和 Perplexity,以确定它们适合内容制作的用例。

这项研究与数十年的 SEO、内容营销和专业写作经验相结合,使我们能够正确、有效且合乎道德地使用生成式人工智能。 

主要经验

这次经历给我们带来了一些宝贵的启示:

  • AI 检查器的局限性:我们了解到 AI 检查器可能会产生不一致的结果,并且不应该成为确定内容质量或来源的唯一方法。
  • 透明度的重要性:关于我们流程的开放沟通有助于加强我们与 MediaFeed 的关系。
  • 人类专业知识的价值:我们的方法将人工智能辅助与人类的创造力和专业知识相结合,被证明能够有效地制作出高质量的原创内容。

MediaFeed 继续发布内容,没有再担心。这次经验也促使我们制定了更强大的策略来解决客户与 AI 相关的疑问,强调教育和流程透明度。

深入挖掘:你的 AI 内容糟糕的 7 个原因(以及如何解决)

为什么你不能相信人工智能检查工具

人工智能检测器承诺能够嗅出人工智能生成的内容,但就像我们的 Mediafeed 混乱一样,它们可能不准确且不可靠。 

一个很好的例子说明了它们有多么不可靠,那就是 ChatGPT 的创建者 OpenAI 于 2023 年 7 月关闭了其由 AI 编写的文本分类器,原因是其准确率低。 

Turnitin 是学术界最知名、使用最广泛的 AI 检测工具之一,其误报率不到 1%。然而,他们声称为了实现这一目标, 会漏掉 15% 的 AI 编写文本。

GPTZero 等工具似乎在准确性方面处于领先地位,在分析 Meta 的 Llama 3.1 LLM 中的文本时声称成功率高达 99%。我们的测试还表明,与 Phrasly 相比,GPTZero 能够正确识别我们人工生成的内容。 

但是,在具体的人工智能文本标识符(又名“水印”)尚不存在的情况下,该公司声称的“先进的算法精度”和“强大的训练数据”并不能保证准确性。 

技术限制

模式识别与理解

  • AI 检查器依赖于类似的训练数据集,这些数据集为 LLM 和模式识别提供支持,以寻找可能表明 AI 生成文本的统计异常。 
  • 这些工具寻找模式的一种方法是通过“困惑度”和“突发性”,这些特征通常可以区分人类书写的内容和人工智能生成的文本。 
  • 复杂度指的是写作的复杂性和不可预测性,而突发性则捕捉句子结构和节奏的变化。 
  • 这些细微的特征对于人工智能的持续复制和人工智能检查者的准确评估来说都是具有挑战性的。

误报和漏报

  • 这些工具在两个方向上都容易出错。 
  • 他们可能会将一个极具创意的作品标记为“人工智能生成”,仅仅因为它是独一无二的,或者满足过于简单的困惑度和突发性要求。 
  • 更糟糕的是,他们可能会错过经过巧妙调整的人工智能生成内容。这就像掷硬币,对于专业的内容评估来说还不够好。

人工智能文本“指纹识别”

落后于人工智能进步

  • 法学硕士 (LLM) 课程随处可见并以惊人的速度发展,而人工智能检查器却难以跟上其发展步伐。 

道德问题

人工智能检查器的问题不仅仅是技术问题。它们还引发了严重的道德问题:

名誉受损

  • 人工智能检查器的误报可能会带来严重后果。
  • 内容创作者可能会面临信誉丧失、专业关系受损的问题,在监管要求严格的行业中,甚至还会受到法律处罚。
  • 这就形成了一种真正的创造力可能受到不公平惩罚的环境。

偏见和歧视

  • 人工智能检查器可能会延续偏见,可能会歧视某些写作风格或声音。
  • 这可能会导致互联网变得平淡无奇、同质化,不同的声音被压制。这是我们想要的内容未来吗?

创造力杀手

  • 当作家知道这些有缺陷的工具会审查他们的作品时,他们可能会选择谨慎行事。不再有创作风险,也不再有独特的表达方式。 
  • 结果呢?内容枯燥、公式化,没人愿意读。

黑箱问题

  • 许多组织依赖人工智能检查器,却不了解它们的工作原理。 
  • 一些人工智能探测器公司甚至对其工具的运行并不透明。 

深入挖掘:当你使用人工智能工具处理内容时,如何在搜索结果中脱颖而出

获取搜索营销人员所依赖的新闻通讯。


依赖人工智能检查员的危险

你认为人工智能检测工具只是无害的工具吗?除了技术限制之外,过度依赖这些检测工具还可能导致意想不到的深远后果。

扭曲的内容策略

公司可能会痴迷于“通过”人工智能检查,并将其置于实际的 SEO 最佳实践之上。 

这就像为一个不存在的搜索引擎优化你的网站一样——你完全玩错了游戏。 

这种错误的关注可能会导致忽视用户意图。如果你过于专注于打败人工智能探测器,你可能会忽视你的受众想要什么。 

请记住,您的读者是人类,而不是算法。

在受监管的行业中,仅仅依靠人工智能检查员进行内容审批可能会产生虚假的合规感,从而忽视关键问题。 

这些工具并非为理解复杂的监管要求而设计的。 

市场和竞争劣势

由于害怕被发现而避免使用人工智能辅助内容创作可能会导致您错过竞争对手正在利用的效率提升。 

在不可靠的人工智能检测工具上投入大量资金意味着用于实际改善内容的预算减少,例如主题专家(SME)作家或审阅者或专业编辑。 

此外,不断地通过人工智能检查器运行内容并处理误报可能会显著减慢您的内容制作流程。

长期行业影响

随着人工智能检查器变得越来越普及,它们可能会为试图进入内容市场的新作家或小型组织设置额外的进入门槛。 

还有一种风险是,组织更看重“通过人工智能测试的能力”而不是实际的写作技能,这可能会无意中改变招聘实践。 

如果每个人都试图创作通过相同 AI 检查的内容,我们就会面临回音室效应的风险,即放大某些声音或风格,同时压制其他声音或风格。这将导致内容生态系统缺乏多样性。

请记住,我们的目标不是完全避免使用人工智能,而是负责任地使用人工智能,同时保持人性化,使内容真正有价值。 

过度依赖人工智能检查器可能会适得其反地使我们离这个目标越来越远。

那么,还有什么其他选择呢?我们如何才能确保内容质量而不落入人工智能检查器的陷阱?

深入挖掘:使用 AI 生成的内容进行 SEO 是否构成抄袭?

确保内容质量的替代策略

人工智能检查器并不是分析内容质量或来源的解决方案。让我们探索更有效且切实可行的策略。

拥抱人类的专业知识

熟练的人工编辑无可替代。他们可以捕捉到人工智能检查器遗漏的细微差别、不一致之处和语气问题。人类专家还可以更好地评估内容的困惑度和突发性。

对于专业内容,请 SME 撰稿人或审阅者参与,以确保准确性和深度。他们的领域知识使他们能够识别人工智能生成器和检查器可能遗漏的细微错误或过度简化。 

考虑组建不同的审查团队来发现语气、文化敏感性和受众相关性方面的潜在问题。 

这些团队还可以评估困惑度和突发性在不同内容类型和主题领域中的表现,从而对内容真实性和质量进行更全面的评估。

利用更可靠的工具

像 Copyscape 这样的抄袭检测工具仍然很有价值,值得信赖。虽然并不完美,但它们在识别抄袭文本方面比人工智能内容检测器可靠得多。 

可读性分析器(例如 Hemingway Editor)可帮助评估阅读水平、句子结构和清晰度,确保您的内容可以被目标受众理解。 

Semrush Writing Assistant 等 SEO 工具也可以帮助您针对实际搜索引擎和用户意图进行优化,而不是 AI 检测器。

但这些由人工智能驱动的可读性和 SEO 工具也存在一个问题,就像人工智能检测器一样。过度依赖它们进行文案修改也可能导致写作的同质化,尤其是在句子流畅度和词汇选择方面。 

当每个人都使用相同的工具来衡量写作质量和有效性时,它同样会降低内容的质量。专家很重要,朋友们!

实施健全的流程

制定全面的内容指南,以反映您的品牌声音、风格和质量标准。这将为人工和人工智能辅助内容提供一致的框架。 

实施分级审核流程,从自我编辑开始,然后是同行评审,最后是专业编辑。定期收集和分析用户对内容的反馈也很重要,以评估其有效性和价值。

注重价值和原创性

通过开展自己的调查、访谈或数据分析,优先考虑原创研究。这可确保独特性并为您的受众带来真正的价值。 

无论是否使用人工智能辅助,都要融入独特的见解和经验。专注于创作更少但更高质量的内容,而不是为了满足算法的需求而大规模地生产内容。

深入挖掘:人工智能无法编写这些内容:未来几年内让你的内容经得起人工智能检验的 10 种方法

教育你的内容团队

确保您的内容团队了解 AI 在内容创作方面的能力和局限性。制定明确的政策,说明如何以及何时在内容流程中使用 AI。 

此外,由于情况瞬息万变,请随时了解 AI 发展以及内容创建和 SEO 方面的最佳实践。

更大的图景

尽管出于良好的意图,人工智能检查器由于依赖于模式识别而不是真正的理解,因此往往会产生不可靠的结果。 

由于可能出现误报和漏报,以及道德问题,它们成为审查内容质量的不完美解决方案。

我们不依赖它们,而是概述了更有效的方法来确保内容质量,包括使用成熟的抄袭检查器,并在内容创建和审查过程中引入人工专业知识。 

我们与 MediaFeed 合作的经验也证明了透明度和将人工智能辅助与人类创造力相结合的平衡方法的价值。

展望未来,以平衡的视角看待内容创作中的人工智能至关重要。

如果负责任地使用,人工智能工具可以显著增强内容,但它们应该被视为人类创造力的辅助工具,而不是替代品。

目标是找到一个中间立场,让技术能够增强我们的创造能力。

作为内容创作者、营销人员和商业领袖,我们还必须随时了解人工智能的发展情况,并不断完善我们的战略。我们应该对利用新技术持开放态度,同时认识到人类专业知识、创造力和道德判断的持久价值。

内容创作的未来取决于我们能否将人工智能工具巧妙地融入到人类主导的创作过程中。

这将使我们能够制作在搜索排名中表现良好、真正服务和吸引观众的内容——这是内容成功的真正衡量标准。

深入挖掘:生成式人工智能来创造内容:用还是不用?


我们邀请投稿作者为 Search Engine Land 撰写内容,并根据他们的专业知识和对搜索社区的贡献进行选择。我们的投稿者在编辑人员的监督下工作并检查投稿的质量和与读者的相关性。他们表达的观点是他们自己的。


发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注