提问量暴跌 80% ,Stack Overflow 却赚翻了?

Stack Overflow(后文简称SO)作为全球最大的程序员问答社区,巅峰时每月提问量超过 20w 条。

但在 AI 的冲击下,这一数据上个月仅为 3,862 条。

这是要凉的节奏?

恰恰相反,其母公司Prosus的财报显示,SO 24 财年的营收约为 9800w刀,同比增长 4%。

怎么做到的?核心原因在于业务重心的结构性位移。

目前,SO的收入增长主要由两个方向驱动:

  1. 企业级知识管理(Stack Internal) :基于企业内容知识库 + SO的高质量问答数据构建问答知识库。目前被全球约 25,000 家公司使用

  2. 数据授权:以授权形式将高质量开发者问答数据提供给 AI 公司用于模型训练

抛开免费的公共问答社区 这一光环,SO的商业逻辑可以简单概括为:

  1. 有人提问,有人回答

  2. 大量志愿者版主用爱发电,人肉过滤问题和答案(关闭/删除垃圾问题、答案)

  3. SO将这些数据打包出售

高质量数据通常需要人类打标或者模型合成(用先进模型生成数据用于训练)。

SO赚的其实是白嫖社区打标的钱。

这种卖数据 的模式并非SO独创,Reddit已经走通了这条路。

24 年初,RedditGoogle 签署了约 6,000w美元/年 的授权协议,允许其数据用于Gemini等模型的训练及搜索引用。

OpenAI 每年也会向 Reddit 支付约 7,000 w美元

这两项授权收入合计约 1.3 亿美元,占 Reddit 年收入的 10% 左右。

对于 AI 巨头而言,相比于从全网抓取低质量的垃圾信息,直接付费购买像 Reddit 的情感数据或 SO 的代码数据,是缓解模型幻觉最经济的手段。

共识与利益的冲突

在这种商业模式下,社区共识与商业利益的冲突不可避免。

23 年 6 月,SO爆发了大规模的"版主罢工"。

起因是 ------ SO要求版主停止基于检测工具对 AI生成的回答进行删除,理由是检测工具误报率高。

但版主群体认为,放宽AI生成的回答会导致平台被 AI 回答淹没,损害社区长期建立的信任体系。

罢工期间,SO主站超过 70% 的版主参加。这导致站内标记积压一度超过 1w 条,审核效率大幅下降。

后记

SO没有像许多人预测的那样走向倒闭,它正通过卖数据来换取生存空间。

然而,这并不是一门长久生意 ------ AI 依靠吸收SO的历史数据变强,变强后的 AI 抢走了原本属于 SO 的新用户,导致平台不再产生新的高质量数据。

为了维持商业模式,SO必须保持新增数据,所以必须放宽对AI回答问题的限制。

这会导致社区调性的流失,以及数据质量下降。

最终,SO会变成充斥 AI 问答 的死寂社区。

相关推荐
大橙子额3 小时前
【解决报错】Cannot assign to read only property ‘exports‘ of object ‘#<Object>‘
前端·javascript·vue.js
打工的小王3 小时前
Spring Boot(三)Spring Boot整合SpringMVC
java·spring boot·后端
爱喝白开水a5 小时前
前端AI自动化测试:brower-use调研让大模型帮你做网页交互与测试
前端·人工智能·大模型·prompt·交互·agent·rag
董世昌415 小时前
深度解析ES6 Set与Map:相同点、核心差异及实战选型
前端·javascript·es6
80530单词突击赢5 小时前
JavaWeb进阶:SpringBoot核心与Bean管理
java·spring boot·后端
爬山算法5 小时前
Hibernate(87)如何在安全测试中使用Hibernate?
java·后端·hibernate
皮卡丘不断更5 小时前
告别“金鱼记忆”:SwiftBoot v0.1.5 如何给 AI 装上“永久项目大脑”?
人工智能·系统架构·ai编程
WeiXiao_Hyy5 小时前
成为 Top 1% 的工程师
java·开发语言·javascript·经验分享·后端
苏渡苇6 小时前
优雅应对异常,从“try-catch堆砌”到“设计驱动”
java·后端·设计模式·学习方法·责任链模式
吃杠碰小鸡6 小时前
高中数学-数列-导数证明
前端·数学·算法