提问量暴跌 80% ,Stack Overflow 却赚翻了?

Stack Overflow(后文简称SO)作为全球最大的程序员问答社区,巅峰时每月提问量超过 20w 条。

但在 AI 的冲击下,这一数据上个月仅为 3,862 条。

这是要凉的节奏?

恰恰相反,其母公司Prosus的财报显示,SO 24 财年的营收约为 9800w刀,同比增长 4%。

怎么做到的?核心原因在于业务重心的结构性位移。

目前,SO的收入增长主要由两个方向驱动:

  1. 企业级知识管理(Stack Internal) :基于企业内容知识库 + SO的高质量问答数据构建问答知识库。目前被全球约 25,000 家公司使用

  2. 数据授权:以授权形式将高质量开发者问答数据提供给 AI 公司用于模型训练

抛开免费的公共问答社区 这一光环,SO的商业逻辑可以简单概括为:

  1. 有人提问,有人回答

  2. 大量志愿者版主用爱发电,人肉过滤问题和答案(关闭/删除垃圾问题、答案)

  3. SO将这些数据打包出售

高质量数据通常需要人类打标或者模型合成(用先进模型生成数据用于训练)。

SO赚的其实是白嫖社区打标的钱。

这种卖数据 的模式并非SO独创,Reddit已经走通了这条路。

24 年初,RedditGoogle 签署了约 6,000w美元/年 的授权协议,允许其数据用于Gemini等模型的训练及搜索引用。

OpenAI 每年也会向 Reddit 支付约 7,000 w美元

这两项授权收入合计约 1.3 亿美元,占 Reddit 年收入的 10% 左右。

对于 AI 巨头而言,相比于从全网抓取低质量的垃圾信息,直接付费购买像 Reddit 的情感数据或 SO 的代码数据,是缓解模型幻觉最经济的手段。

共识与利益的冲突

在这种商业模式下,社区共识与商业利益的冲突不可避免。

23 年 6 月,SO爆发了大规模的"版主罢工"。

起因是 ------ SO要求版主停止基于检测工具对 AI生成的回答进行删除,理由是检测工具误报率高。

但版主群体认为,放宽AI生成的回答会导致平台被 AI 回答淹没,损害社区长期建立的信任体系。

罢工期间,SO主站超过 70% 的版主参加。这导致站内标记积压一度超过 1w 条,审核效率大幅下降。

后记

SO没有像许多人预测的那样走向倒闭,它正通过卖数据来换取生存空间。

然而,这并不是一门长久生意 ------ AI 依靠吸收SO的历史数据变强,变强后的 AI 抢走了原本属于 SO 的新用户,导致平台不再产生新的高质量数据。

为了维持商业模式,SO必须保持新增数据,所以必须放宽对AI回答问题的限制。

这会导致社区调性的流失,以及数据质量下降。

最终,SO会变成充斥 AI 问答 的死寂社区。

相关推荐
修己xj几秒前
打造专属博文封面神器:一个开源免费的博文封面生成器ThisCover
前端
kyriewen4 分钟前
面试8家前端岗位后,我发现了一个残酷的事实:AI不是加分项,是门槛
前端·javascript·面试
ruxingli15 分钟前
Golang iota详解
开发语言·后端·golang
console.log('npc')21 分钟前
AtomCode 前端开发实战教程
ai编程·deepseek·atomcode
Fighting_p21 分钟前
【面试 - el-select问题及解决】wujie 微前端下子系统 el-select 多选 filterable 过滤失效
前端
吃口巧乐兹22 分钟前
AI 全栈时代,为什么要服务端使用 NestJs
前端
yingyima27 分钟前
Redis 延迟任务队列:凌晨3点服务器报警的救星
前端
weiggle29 分钟前
第三篇:可组合函数(Composable)——Compose 的基石
android·前端
前端环境观察室31 分钟前
别只看 task success:AI Agent 浏览器自动化真正要补的是环境证据链
前端·后端
huakoh31 分钟前
LangChain 实战:用混合检索啃下 1000 页 PDF,搭一个长文档问答 Agent
前端