为什么 AI 在处理新闻方面如此糟糕

托马斯·史密斯

插画来源：Ideogram

新闻流淌在我的血液里。我的日常工作是一家新闻摄影机构的负责人，而我的主网站是一个专注于旧金山湾区新闻的站点。

我与新闻内容息息相关，所以我对 AI 在处理新闻方面的糟糕表现感受尤为深刻。

哥伦比亚新闻评论（Columbia Journalism Review）的一项新研究表明，像 Perplexity 这样的 AI 搜索引擎，以及像 Gemini 这样的聊天机器人，在正确报道和引用新闻故事方面一贯表现不佳。

该研究调查的其中一个聊天机器人------埃隆·马斯克的 X 推出的 Grok 3，在超过 90% 的情况下错误报道新闻。

这些机器人会自信满满地填充错误信息，引用 Yahoo! News 等平台上的转载版本，而不是原始来源，甚至会违反出版商的服务条款，爬取那些明令禁止 AI 访问的网站。

最终的结果是什么？任何希望通过 AI 机器人获取新闻内容的人，最终都会感到失望------甚至可能接触到有害的错误信息。

沉重的天平

为什么 AI 机器人在处理新闻方面表现如此糟糕？问题归结于它们的训练方式。

像 Perplexity、ChatGPT 和 Gemini 这样的聊天机器人，都是在数十亿页的文本数据上进行训练的，其中一些数据甚至可以追溯到几百年前。

它们的主要目标是从这些训练数据中找到模式，这使它们能够相当准确地回答许多问题。

但新闻的问题在于，它从定义上来说就是"新的"。聊天机器人在此前从未见过新闻文章中的信息，因此，它们很难准确理解并呈现这些信息。

想象一下一个老式的天平秤。一边放着数十亿页的数据------来源包括所有出版过的书籍、互联网上的所有网站，甚至是从 Reddit 这类公司购买的原始对话数据。

另一边则只有一篇新闻文章的单一数据点。

当 LLM（大语言模型）在回答用户关于某篇新闻报道的查询时，你认为哪一边会占据主导地位？

答案显然是那一侧庞大的训练数据。LLM 根本无法超越其训练数据，准确地将新闻文章整合进它们的回答中。

创作者的胜利

这暴露了像 OpenAI 和 Perplexity 这样的公司存在的一个重大缺陷。但与此同时，这也为创作者带来了一个巨大机会。

在过去一年多的时间里，谷歌等传统搜索引擎似乎一直在努力------且有系统地------打压独立博客的内容。许多博主的自然搜索流量下降了 95%，甚至像《太阳报》（The Sun）这样的大型网站也遭遇了 50% 以上的流量损失。

这一切很大程度上归因于 AI。谷歌推出了极其成功的 AI 概览（AI Overviews），直接在搜索结果页面提供 AI 生成的答案。这些答案往往取代了本应指向独立博客的搜索结果。

然而，现在谷歌似乎正在朝着相反的方向转变。就在昨天，该公司发布了其核心算法更新（Core Update）。在发布说明中，谷歌表示，此次更新------以及今年晚些时候的更多更新------专门旨在提升创作者的内容。

他们是这样说的：

"这是一项常规更新，旨在更好地展现来自各种类型网站的相关且令人满意的内容。今年，我们还将继续通过一系列改进来提高创作者内容的可见度。"

在我的网站上，我亲眼看到谷歌在特意提升新闻内容。我主网站上高质量、由人撰写的新闻内容流量本月增长了 200% 以上，其他人也开始报告类似的增长。

为什么？谷歌几乎可以肯定不是出于善意才这样做的。

相反，他们可能已经开始意识到------考虑到 AI 驱动的竞争对手在处理新闻方面表现得有多糟糕------他们自己在理解和呈现新闻内容方面的专业能力，是一个巨大的优势。

在过去一年里，谷歌的市场份额一直在下降。离开谷歌的用户通常会转向 Perplexity 或 ChatGPT 这样的聊天机器人。

这主要是因为，在回答诸如"牛排要煎到几度才能达到五分熟？"这样的基础问题时，谷歌并不比这些 AI 驱动的服务做得更好。

事实上，在许多情况下，谷歌自己的 AI 概览（AI Overviews）甚至比 ChatGPT 这类工具的 AI 答案更糟糕。

谷歌的转向

但谷歌能做到一些这些工具做不到的事情------它可以提供来自独立创作者和博主的准确、及时、原创的新闻内容。

谷歌自 2002 年以来就运营着一个新闻部门，拥有数十年的新闻内容理解经验。而许多新闻机构明确阻止 Perplexity 之类的 AI 聊天机器人抓取他们的内容，但几乎所有人都欢迎谷歌的爬虫，因为大家都想要从谷歌搜索引擎获取高价值的自然流量。

这种广泛的访问权限让谷歌拥有一个独特的突发新闻数据库可以利用。而它的 AI 竞争对手由于缺乏这种访问权限，自然就错过了这些数据。

从这次更新的官方目标来看，谷歌似乎终于意识到，自己几十年的经验和庞大的数据储备给了它巨大的竞争优势。

与其继续打压独立博主和新闻来源，这家公司似乎正积极转向拥抱这些内容。

去年，谷歌甚至邀请了 20 位博主前往其山景城总部，向他们取经，探讨如何更好地支持独立创作者。几位参会者离开后都表示，他们感觉谷歌终于开始认真对待创作者内容的问题了。

当然，谷歌绝不会完全放弃 AI 生成的内容。AI 概览的经济效益------让用户留在谷歌自己的平台上，而不是引导他们前往外部网站------实在是太诱人了，不可能被忽视。

但它很可能会做的事情是，开始加强（甚至替换）新闻相关查询中的 AI 概览，改用原创创作者内容。

接下来该做什么？

对于创作者来说，信息已经很明确了------如果你想在谷歌上获得好的排名（以及在较小程度上，在 Bing 这样的传统搜索引擎上），你应该减少对常规信息类内容的关注，而更多地专注于新闻。

至关重要的是，新闻内容不一定要是关于本地事件、政治公告或其他传统的"硬新闻"话题（尽管这些内容确实表现良好）。你可以在任何领域或主题中找到适合的新闻内容。

比如，一个美食创作者可以报道当前流行的新食材。例如，"迪拜巧克力"最近正在流行，关于它的报道完全可以归入"新闻"类别。

同样，新闻内容通常聚焦于从现实世界收集的新信息。

这一点再次对创作者有利。许多独立创作者对自己所关注的领域充满热情，他们真的亲身参与其中，实际观察、发现新事物。

这给予创作者一个 AI 永远无法拥有的优势。

AI 也许能很好地总结不同类型的编织针，但它没办法亲自去手工艺展会，发现编织领域的新趋势（比如智能纺织品和导电纱线），并在当天就带回报道，附上专家评论和分析。

"一个可喜的变化"

对我个人而言，谷歌向新闻内容的转向让人耳目一新。

长期以来，作为一名内容创作者，感觉就像是在把自己变成一台机器------写那些毫无生气的 3000+ 字"信息型"文章，话题来源全靠关键词研究工具。

这简直让人窒息。

而新闻内容则完全相反。它充满活力，它让你走向世界。你可以用更吸引人、更有冲击力的方式写作（事实上，你通常必须这样做）。你可以快速尝试新事物，当某个尝试失败时也能轻松放手------毕竟，明天总会有新的新闻可以报道。

AI 可能在处理新闻方面一塌糊涂，但人类创作者擅长这件事。

作为创作者，让我们好好利用这一优势吧。