提问量暴跌 80% ,Stack Overflow 却赚翻了?

Stack Overflow(后文简称SO)作为全球最大的程序员问答社区,巅峰时每月提问量超过 20w 条。

但在 AI 的冲击下,这一数据上个月仅为 3,862 条。

这是要凉的节奏?

恰恰相反,其母公司Prosus的财报显示,SO 24 财年的营收约为 9800w刀,同比增长 4%。

怎么做到的?核心原因在于业务重心的结构性位移。

目前,SO的收入增长主要由两个方向驱动:

  1. 企业级知识管理(Stack Internal) :基于企业内容知识库 + SO的高质量问答数据构建问答知识库。目前被全球约 25,000 家公司使用

  2. 数据授权:以授权形式将高质量开发者问答数据提供给 AI 公司用于模型训练

抛开免费的公共问答社区 这一光环,SO的商业逻辑可以简单概括为:

  1. 有人提问,有人回答

  2. 大量志愿者版主用爱发电,人肉过滤问题和答案(关闭/删除垃圾问题、答案)

  3. SO将这些数据打包出售

高质量数据通常需要人类打标或者模型合成(用先进模型生成数据用于训练)。

SO赚的其实是白嫖社区打标的钱。

这种卖数据 的模式并非SO独创,Reddit已经走通了这条路。

24 年初,RedditGoogle 签署了约 6,000w美元/年 的授权协议,允许其数据用于Gemini等模型的训练及搜索引用。

OpenAI 每年也会向 Reddit 支付约 7,000 w美元

这两项授权收入合计约 1.3 亿美元,占 Reddit 年收入的 10% 左右。

对于 AI 巨头而言,相比于从全网抓取低质量的垃圾信息,直接付费购买像 Reddit 的情感数据或 SO 的代码数据,是缓解模型幻觉最经济的手段。

共识与利益的冲突

在这种商业模式下,社区共识与商业利益的冲突不可避免。

23 年 6 月,SO爆发了大规模的"版主罢工"。

起因是 ------ SO要求版主停止基于检测工具对 AI生成的回答进行删除,理由是检测工具误报率高。

但版主群体认为,放宽AI生成的回答会导致平台被 AI 回答淹没,损害社区长期建立的信任体系。

罢工期间,SO主站超过 70% 的版主参加。这导致站内标记积压一度超过 1w 条,审核效率大幅下降。

后记

SO没有像许多人预测的那样走向倒闭,它正通过卖数据来换取生存空间。

然而,这并不是一门长久生意 ------ AI 依靠吸收SO的历史数据变强,变强后的 AI 抢走了原本属于 SO 的新用户,导致平台不再产生新的高质量数据。

为了维持商业模式,SO必须保持新增数据,所以必须放宽对AI回答问题的限制。

这会导致社区调性的流失,以及数据质量下降。

最终,SO会变成充斥 AI 问答 的死寂社区。

相关推荐
a1117764 小时前
医院挂号预约系统(开源 Fastapi+vue2)
前端·vue.js·python·html5·fastapi
0思必得05 小时前
[Web自动化] Selenium处理iframe和frame
前端·爬虫·python·selenium·自动化·web自动化
计算机毕设VX:Fegn08955 小时前
计算机毕业设计|基于springboot + vue蛋糕店管理系统(源码+数据库+文档)
数据库·vue.js·spring boot·后端·课程设计
没差c6 小时前
springboot集成flyway
java·spring boot·后端
三水不滴6 小时前
Redis 过期删除与内存淘汰机制
数据库·经验分享·redis·笔记·后端·缓存
曹牧6 小时前
AI编程助手
ai编程
行走的陀螺仪6 小时前
uni-app + Vue3编辑页/新增页面给列表页传参
前端·vue.js·uni-app
笨蛋不要掉眼泪7 小时前
Spring Boot集成LangChain4j:与大模型对话的极速入门
java·人工智能·后端·spring·langchain
We་ct7 小时前
LeetCode 205. 同构字符串:解题思路+代码优化全解析
前端·算法·leetcode·typescript
2301_812731418 小时前
CSS3笔记
前端·笔记·css3