一组社交媒体数据集示例,每个包含超过 1,000 条记录。

这些社交媒体数据集示例总计包含数千条记录。所有数据集均使用 Bright Data API 提取。
部分数据字段包括:
url: 包含评论的页面或帖子的 URLpost_id: 每条帖子的唯一标识符post_url: 该帖子的 URLcomment_id: 每条评论的唯一标识符user_name: 发表评论的用户名user_id: 每位用户的唯一标识符user_url: 用户个人主页的 URLdate_created: 评论创建的日期和时间comment_text: 评论的实际文本内容num_likes: 评论收到的点赞或反应数num_replies: 对该评论的直接回复数attached_files: 与评论关联的任何文件或附件video_length: 如适用,视频内容时长source_type: 来源类型(例如:Facebook、外部链接)subtype: 帖子或评论的子类别或具体类型type: 帖子或评论的通用类别user_posted: 帖子创建者的用户名description: 帖子文本描述hashtags: 帖子中使用的标签num_comments: 评论数量date_posted: 帖子发布时间likes: 点赞数量photos: 附加照片的 URLvideos: 附加视频的 URLlocation: 地理位置latest_comments: 最新评论post_id: 唯一帖子标识符discovery_input: 发现输入值
以及更多。
这些是示例数据集,以及从数十个包含数百万条记录的**社交媒体数据集(公共数据)**中派生的子集。
可用的数据集文件格式:
- JSON 、NDJSON 、JSON Lines 、CSV 或 Parquet
- 可选支持将文件压缩为
.gz
数据集交付方式:
- 电子邮件 、API 下载 、Webhook 、Amazon S3 、Google Cloud Storage 、Microsoft Azure 、Snowflake 、SFTP
更新频率:
- 一次 、每日 、每周 、每月 、每季度 ,或自定义间隔
数据富化:
- 可根据具体需求补充与富化更多数据字段。
社交媒体数据集有哪些用例?
1. 社交媒体影响力
利用我们的社交媒体数据集,通过分析互动度、品牌关联与粉丝画像等指标,识别具有显著社会影响力的创作者/意见领袖。与最契合、最能高效推广您品牌的合作伙伴建立合作。
2. 监测消费者情绪
通过分析社交媒体数据洞察用户情绪。监测点赞、分享、评论、标签、提及等指标,快速识别热度与品牌认知的变化。
3. 品牌监测与认知
跨社交网络跟踪线上讨论,利用社交媒体数据捕捉正面与负面提及。主动回应客户反馈、及时处理问题,维护品牌声誉。
面向研究人员与公益组织的免费访问
Bright Initiative 为从事环境或社会公益的高校院系、研究人员、NGO 和 NPO 提供免费的**Web Scraper API与 即用型数据集**。在此提交申请:链接。