提问量暴跌 80% ,Stack Overflow 却赚翻了?

Stack Overflow(后文简称SO)作为全球最大的程序员问答社区,巅峰时每月提问量超过 20w 条。

但在 AI 的冲击下,这一数据上个月仅为 3,862 条。

这是要凉的节奏?

恰恰相反,其母公司Prosus的财报显示,SO 24 财年的营收约为 9800w刀,同比增长 4%。

怎么做到的?核心原因在于业务重心的结构性位移。

目前,SO的收入增长主要由两个方向驱动:

  1. 企业级知识管理(Stack Internal) :基于企业内容知识库 + SO的高质量问答数据构建问答知识库。目前被全球约 25,000 家公司使用

  2. 数据授权:以授权形式将高质量开发者问答数据提供给 AI 公司用于模型训练

抛开免费的公共问答社区 这一光环,SO的商业逻辑可以简单概括为:

  1. 有人提问,有人回答

  2. 大量志愿者版主用爱发电,人肉过滤问题和答案(关闭/删除垃圾问题、答案)

  3. SO将这些数据打包出售

高质量数据通常需要人类打标或者模型合成(用先进模型生成数据用于训练)。

SO赚的其实是白嫖社区打标的钱。

这种卖数据 的模式并非SO独创,Reddit已经走通了这条路。

24 年初,RedditGoogle 签署了约 6,000w美元/年 的授权协议,允许其数据用于Gemini等模型的训练及搜索引用。

OpenAI 每年也会向 Reddit 支付约 7,000 w美元

这两项授权收入合计约 1.3 亿美元,占 Reddit 年收入的 10% 左右。

对于 AI 巨头而言,相比于从全网抓取低质量的垃圾信息,直接付费购买像 Reddit 的情感数据或 SO 的代码数据,是缓解模型幻觉最经济的手段。

共识与利益的冲突

在这种商业模式下,社区共识与商业利益的冲突不可避免。

23 年 6 月,SO爆发了大规模的"版主罢工"。

起因是 ------ SO要求版主停止基于检测工具对 AI生成的回答进行删除,理由是检测工具误报率高。

但版主群体认为,放宽AI生成的回答会导致平台被 AI 回答淹没,损害社区长期建立的信任体系。

罢工期间,SO主站超过 70% 的版主参加。这导致站内标记积压一度超过 1w 条,审核效率大幅下降。

后记

SO没有像许多人预测的那样走向倒闭,它正通过卖数据来换取生存空间。

然而,这并不是一门长久生意 ------ AI 依靠吸收SO的历史数据变强,变强后的 AI 抢走了原本属于 SO 的新用户,导致平台不再产生新的高质量数据。

为了维持商业模式,SO必须保持新增数据,所以必须放宽对AI回答问题的限制。

这会导致社区调性的流失,以及数据质量下降。

最终,SO会变成充斥 AI 问答 的死寂社区。

相关推荐
rocky1912 小时前
什么,你还没用 claude,out 了吧!
前端·程序员
Younglina2 小时前
想提升专注力?我做了一个web端的训练工具
前端·vue.js·游戏
FAFU_kyp2 小时前
Rust 字符串与切片
开发语言·后端·rust
Java水解2 小时前
Nginx 配置文件完全指南
后端·nginx
NEXT062 小时前
CSS 选择器深度实战:从“个十百千”权重法到零 DOM 动画的降维打击
前端·css
好想来前端2 小时前
私有化部署 LLM 时,别再用 Nginx 硬扛流式请求了 —— 推荐一个专为 vLLM/TGI 设计的高性能网关
后端·架构·github
Mapmost2 小时前
防患未“燃”:掌握森林火灾仿真分析,精准把控火势蔓延趋势
前端
半世轮回半世寻2 小时前
前端开发里最常用的5种本地存储
前端·javascript
OpenTiny社区2 小时前
TinyPro v1.4.0 正式发布:支持 Spring Boot、移动端适配、新增卡片列表和高级表单页面
java·前端·spring boot·后端·开源·opentiny