哔哩哔哩(B 站)的 item_search_video 接口是通过关键词批量检索平台视频列表的核心工具,支持按分区、发布时间、播放量、UP 主类型等多维度筛选,返回视频基础信息、互动数据、UP 主信息等关键内容。该接口广泛适用于内容聚合平台搭建、视频选题调研、行业数据分析、舆情监测等场景。
本攻略从接口认知、前置准备、实操对接、调试优化到合规上线,提供结构化的全流程指导,兼顾入门易用性与生产级稳定性,助力开发者高效完成对接。
一、接口核心认知:功能与适配场景
1. 接口定位与核心价值
- 核心功能 :输入搜索关键词(支持多关键词组合),筛选 B 站全品类视频(番剧、UP 主自制、直播回放等),支持分区过滤、时间范围筛选、排序规则自定义,返回分页视频列表;可联动
item_get_video接口获取单视频精细化详情。 - B 站平台特性
- 数据覆盖:收录 B 站 90% 以上公开视频,涵盖游戏、知识、生活、娱乐等 30 + 分区,新视频收录延迟 5-10 分钟;
- 专属筛选维度 :支持按分区(如游戏 - 原神)、UP 主认证类型(个人 / 企业 / 官方)、视频类型(原创 / 转载) 筛选,适配精细化检索需求;
- 互动数据前置:搜索结果直接返回播放量、点赞数、弹幕数等核心互动指标,无需二次调用;
- 多关键词逻辑 :支持空格分隔(AND 逻辑,同时含多个关键词)、竖线
|分隔(OR 逻辑,含任一关键词)。
- 典型应用场景
- 内容聚合工具:搭建垂直领域视频平台(如 "Python 教程""美食探店" 专区),按关键词聚合 B 站相关视频;
- 选题调研:UP 主通过关键词检索,分析同类视频的热度、标签、互动数据,辅助确定创作方向;
- 行业数据分析:按行业关键词(如 "新能源汽车评测")采集视频数据,统计分区热度、用户偏好;
- 舆情监测:追踪品牌 / 事件关键词相关视频,实时监控播放量、评论数变化,掌握舆论走向。
2. 核心参数与返回字段
(1)请求参数(必填 + 可选,按优先级排序)
| 参数名称 | 类型 | 是否必填 | 说明 | 应用示例 | ||
|---|---|---|---|---|---|---|
| appkey | string | 是 | 接口调用密钥,由 B 站开放平台 / 合规服务商分配 | bilibili_abc123 |
||
| secret | string | 是 | 签名密钥,用于请求合法性校验(不可泄露) | bilibili_def456 |
||
| keyword | string | 是 | 搜索关键词,支持多关键词组合(AND 用空格,OR 用 ` | `) | Python教程 零基础、` 旅行 vlog |
美食探店 ` |
| category | string | 否 | 视频分区筛选,值为分区英文名(需参考 B 站分区字典) | game(游戏)、knowledge(知识)、life(生活) |
||
| time_range | string | 否 | 发布时间范围,默认all(全部) |
1day(1 天内)、7days(7 天内)、30days(30 天内)、custom(自定义,需配合 start/end_date) |
||
| start_date | string | 否 | 自定义开始日期(time_range=custom 时必填),格式YYYY-MM-DD |
2025-01-01 |
||
| end_date | string | 否 | 自定义结束日期(time_range=custom 时必填),格式YYYY-MM-DD |
2025-12-31 |
||
| sort_type | string | 否 | 排序方式,默认relevance(相关度优先) |
play(播放量倒序)、pubtime(发布时间倒序)、like(点赞数倒序)、danmaku(弹幕数倒序) |
||
| up_type | string | 否 | UP 主认证类型,默认all(全部) |
personal(个人认证)、enterprise(企业认证)、official(官方认证) |
||
| copyright | int | 否 | 版权类型,默认0(全部) |
1(原创)、2(转载) |
||
| page_no | int | 否 | 页码,默认1,最大支持100页 |
1、5、10 |
||
| page_size | int | 否 | 每页视频数,默认20,最大支持50 |
20、30、50 |
||
| timestamp | long | 是 | 请求时间戳(毫秒级,有效期 5 分钟,避免重复请求) | 1735689600000 |
||
| sign | string | 是 | 签名值(按 B 站规则生成,核心校验项) | 32 位 MD5 大写串 |
注意事项
- 分区参数
category需与 B 站官方分区英文名一致,可通过服务商文档获取分区字典;- 时间范围优先级:
custom模式下,start_date和end_date必须同时传入,且时间跨度不超过 1 年;- 排序方式
play对应的是近 30 天播放量,非累计播放量,适配爆款视频筛选。
(2)返回核心字段(按业务场景分类)
| 字段分类 | 核心字段 | 说明 |
|---|---|---|
| 视频基础信息 | bvid | 视频 BV 号(对外唯一标识) |
| title | 视频标题(含分区前缀、营销文案) | |
| cover_url | 视频封面图 URL(高清) | |
| duration | 视频时长(秒) | |
| pubdate | 发布时间(时间戳 / 格式化字符串) | |
| category | 视频分区(如 "游戏 - 原神") | |
| tags | 视频标签列表(如 "Python""教程""零基础") | |
| copyright | 版权类型(1 = 原创,2 = 转载) | |
| state | 视频状态(0 = 正常,-1 = 审核中,-2 = 已下架) | |
| 互动数据 | view | 近 30 天播放量 |
| like | 点赞数 | |
| danmaku | 弹幕数 | |
| favorite | 收藏数 | |
| coin | 投币数 | |
| share | 转发数 | |
| UP 主信息 | up_id | UP 主 ID |
| up_name | UP 主昵称 | |
| up_avatar | UP 主头像 URL | |
| up_type | UP 主认证类型 | |
| up_fans | UP 主粉丝数(部分接口需企业权限) | |
| 分页信息 | total | 关键词匹配视频总数 |
| page_no | 当前页码 | |
| page_total | 总页码 |
3. 接口限制与注意事项
-
调用频率限制
账号类型 调用频率 适用场景 个人开发者 5 次 / 分钟 个人选题调研、小型数据分析 企业开发者 30 次 / 分钟 商业内容聚合、舆情监测系统 -
数据缓存规则 :搜索结果缓存 30 分钟,热门关键词(如 "原神""演唱会")缓存缩短至 10 分钟;企业用户可申请
refresh=1强制刷新(需额外权限); -
内容限制:已下架 / 违规视频、隐私视频(仅粉丝可见)、未过审视频不会返回;番剧等版权内容仅返回基础信息,无播放链接;
-
合规要求:禁止通过接口批量抓取视频源文件,搜索结果需标注 "数据来源:哔哩哔哩",二次传播需遵守 B 站版权规则。
二、对接前准备:权限与环境搭建
1. 获取接口权限(两种接入方式)
B 站 item_search_video 接口无公开免费接入渠道,需通过官方开放平台 或合规第三方服务商获取权限,具体对比如下:
| 接入方式 | 操作步骤 | 优缺点 |
|---|---|---|
| B 站开放平台(官方) | 1. 登录 B站开放平台;2. 完成账号认证(个人实名认证 / 企业营业执照认证);3. 创建应用,选择 "内容数据 / 视频搜索" 类目;4. 提交 item_search_video 接口申请,附业务用途说明;5. 审核通过后,在应用详情页获取 appkey 和 secret |
优点:数据权威、字段完整、合规性强;缺点:审核严格(企业需提供业务证明)、周期长(3-7 个工作日)、部分字段需专项授权 |
| 第三方合规服务商 | 1. 选择口碑合规的服务商(如聚合数据、APISpace);2. 注册账号并完成实名认证;3. 购买 B 站视频搜索接口套餐;4. 在服务商后台获取 appkey 和接口调用地址 |
优点:接入快(10 分钟完成)、无需复杂资质、调试工具完善;缺点:部分进阶字段(如 UP 主粉丝数)需付费升级、调用次数有配额限制 |
风险提示:严禁使用非法爬虫接口,违反 B 站《用户协议》及《网络安全法》,存在账号封禁、法律追责风险。
2. 技术环境准备
(1)支持语言与协议
- 协议:HTTPS(强制,保障数据传输安全);
- 开发语言:支持 Python、Java、PHP、Go 等所有主流语言,推荐 Python(数据处理便捷,适配批量检索场景)。
(2)必备工具与依赖
| 工具类型 | 推荐工具 | 用途 |
|---|---|---|
| 调试工具 | Postman | 快速验证接口可用性,排除代码逻辑干扰 |
| 在线 MD5 工具 | 校验签名生成正确性 | |
| B 站分区字典查询工具 | 获取category参数的正确取值 |
|
| 开发依赖 | requests(Python) | 发送 HTTP 请求 |
| hashlib(Python) | 生成接口签名 | |
| pandas(Python) | 批量整理视频列表数据 | |
| jsonpath-ng | 快速解析嵌套 JSON 响应 | |
| 辅助工具 | Redis | 缓存搜索结果,减少重复请求 |
| logging | 记录接口调用日志,便于问题追溯 |
三、实操步骤:接口对接全流程(Python 示例)
步骤 1:理解 B 站接口签名规则
B 站官方接口与第三方服务商接口均采用 MD5 加密签名 ,核心逻辑为参数排序 + 拼接密钥 + MD5 加密,具体步骤如下:
- 剔除参数中的
sign字段(若存在); - 将剩余参数按 参数名 ASCII 升序 排序;
- 拼接成
key1=value1&key2=value2&...的字符串; - 在字符串末尾拼接
&secret=你的secret; - 对拼接后的字符串进行 MD5 加密,生成 32 位大写字符串,即为
sign。
签名示例
假设参数:appkey=bilibili_abc123、keyword=Python教程、sort_type=play、timestamp=1735689600000、secret=bilibili_def456
- 排序后参数:
appkey、keyword、sort_type、timestamp; - 拼接字符串:
appkey=bilibili_abc123&keyword=Python%E6%95%99%E7%A8%8B&sort_type=play×tamp=1735689600000&secret=bilibili_def456; - MD5 加密后得到
sign:3A9F7C2D1E0B86453210FEDCBA789654。
步骤 2:完整代码实现(Python)
(1)依赖安装
bash
pip install requests pandas jsonpath-ng
(2)核心代码(含签名生成、接口调用、数据保存)
python
import requests
import hashlib
import time
import json
import pandas as pd
from urllib.parse import urlencode
import logging
# 封装好API供应商demo url=https://console.open.onebound.cn/console/?i=Lex
# 日志配置(记录接口调用与错误信息)
logging.basicConfig(
level=logging.INFO,
format="%(asctime)s - %(levelname)s - %(message)s",
handlers=[logging.FileHandler("bilibili_item_search_video.log"), logging.StreamHandler()]
)
# 接口配置(替换为自身的appkey、secret、接口地址)
CONFIG = {
"appkey": "你的appkey",
"secret": "你的secret",
"api_url": "https://api.example.com/bilibili/item_search_video", # 官方/服务商接口地址
"save_path": "B站视频搜索列表.xlsx"
}
def generate_sign(params: dict, secret: str) -> str:
"""生成B站接口签名(MD5 32位大写)"""
# 1. 移除sign字段
params.pop("sign", None)
# 2. 按参数名ASCII升序排序
sorted_params = sorted(params.items(), key=lambda x: x[0])
# 3. 拼接参数字符串并追加secret
param_str = urlencode(sorted_params, encoding="utf-8") + f"&secret={secret}"
# 4. MD5加密
md5 = hashlib.md5()
md5.update(param_str.encode("utf-8"))
return md5.hexdigest().upper()
def standardize_video_data(raw_video: dict) -> dict:
"""标准化视频数据,统一输出格式"""
# 格式化发布时间
pubdate = raw_video.get("pubdate", 0)
pubdate_str = time.strftime("%Y-%m-%d %H:%M:%S", time.localtime(pubdate)) if pubdate else ""
# 格式化视频时长
duration = raw_video.get("duration", 0)
duration_str = f"{duration//60}:{duration%60:02d}"
return {
"搜索关键词": raw_video.get("keyword", ""),
"BV号": raw_video.get("bvid", ""),
"视频标题": raw_video.get("title", ""),
"封面链接": raw_video.get("cover_url", ""),
"视频时长": duration_str,
"发布时间": pubdate_str,
"视频分区": raw_video.get("category", ""),
"视频标签": ",".join(raw_video.get("tags", [])) if raw_video.get("tags") else "",
"版权类型": "原创" if raw_video.get("copyright", 2) == 1 else "转载",
"视频状态": "正常" if raw_video.get("state", 0) == 0 else "已下架/违规",
"近30天播放量": raw_video.get("view", 0),
"点赞数": raw_video.get("like", 0),
"弹幕数": raw_video.get("danmaku", 0),
"收藏数": raw_video.get("favorite", 0),
"投币数": raw_video.get("coin", 0),
"转发数": raw_video.get("share", 0),
"UP主ID": raw_video.get("up_id", ""),
"UP主昵称": raw_video.get("up_name", ""),
"UP主认证类型": raw_video.get("up_type", ""),
"UP主粉丝数": raw_video.get("up_fans", 0),
"请求时间": time.strftime("%Y-%m-%d %H:%M:%S", time.localtime())
}
def bilibili_item_search_video(
keyword: str,
category: str = None,
time_range: str = "all",
start_date: str = None,
end_date: str = None,
sort_type: str = "relevance",
up_type: str = "all",
copyright: int = 0,
page_no: int = 1,
page_size: int = 20
) -> dict:
"""
调用B站item_search_video接口,获取关键词视频列表
:param keyword: 搜索关键词
:param category: 视频分区
:param time_range: 发布时间范围
:param start_date: 自定义开始日期
:param end_date: 自定义结束日期
:param sort_type: 排序方式
:param up_type: UP主认证类型
:param copyright: 版权类型
:param page_no: 页码
:param page_size: 每页条数
:return: 标准化的视频列表数据
"""
# 1. 校验参数合法性
if time_range == "custom" and not (start_date and end_date):
logging.error("time_range=custom时,start_date和end_date为必填参数")
return {"success": False, "error_msg": "缺少自定义时间参数"}
# 2. 构建基础参数
params = {
"appkey": CONFIG["appkey"],
"keyword": keyword,
"time_range": time_range,
"sort_type": sort_type,
"up_type": up_type,
"copyright": copyright,
"page_no": page_no,
"page_size": page_size,
"timestamp": int(time.time() * 1000)
}
# 3. 补充可选参数
if category:
params["category"] = category
if time_range == "custom":
params["start_date"] = start_date
params["end_date"] = end_date
# 4. 生成签名
params["sign"] = generate_sign(params, CONFIG["secret"])
try:
# 5. 发送POST请求
response = requests.post(
url=CONFIG["api_url"],
data=json.dumps(params),
headers={"Content-Type": "application/json"},
timeout=15,
verify=True
)
response.raise_for_status() # 抛出HTTP异常
result = response.json()
# 6. 解析响应结果
if result.get("code") == 0 or result.get("status") == "success":
raw_data = result.get("data", {})
video_list = raw_data.get("item_list", [])
total = raw_data.get("total", 0)
page_total = raw_data.get("page_total", 1)
# 标准化视频数据
standard_videos = []
for video in video_list:
video["keyword"] = keyword # 补充关键词字段
standard_videos.append(standardize_video_data(video))
return {
"success": True,
"data": standard_videos,
"total": total,
"page_no": page_no,
"page_total": page_total,
"error_msg": ""
}
else:
error_msg = result.get("msg", result.get("message", "接口调用失败"))
logging.error(f"接口返回错误(关键词:{keyword}):{error_msg}(code={result.get('code')})")
return {"success": False, "error_msg": error_msg}
except requests.exceptions.RequestException as e:
logging.error(f"网络请求异常(关键词:{keyword}):{str(e)}")
return {"success": False, "error_msg": f"网络异常:{str(e)}"}
except Exception as e:
logging.error(f"数据解析异常(关键词:{keyword}):{str(e)}")
return {"success": False, "error_msg": f"解析异常:{str(e)}"}
def batch_get_video_list(
keyword: str,
max_page: int = 5,
**kwargs
) -> list:
"""批量获取多页视频列表,控制调用频率"""
all_videos = []
page_no = 1
while True:
logging.info(f"正在获取关键词「{keyword}」第 {page_no} 页视频")
result = bilibili_item_search_video(keyword=keyword, page_no=page_no, **kwargs)
if not result["success"]:
logging.error(f"第 {page_no} 页获取失败:{result['error_msg']}")
break
page_videos = result["data"]
if not page_videos:
logging.info(f"第 {page_no} 页无视频数据,批量获取结束")
break
all_videos.extend(page_videos)
logging.info(f"第 {page_no} 页获取成功,新增 {len(page_videos)} 条数据(累计 {len(all_videos)} 条)")
# 终止条件:达到最大页码或总页码
if page_no >= max_page or page_no >= result["page_total"]:
break
page_no += 1
# 控制频率(个人用户间隔12秒,企业用户间隔2秒)
time.sleep(12)
return all_videos
def save_video_list(videos: list, save_path: str = CONFIG["save_path"]):
"""将视频列表保存为Excel文件,支持增量去重"""
if not videos:
logging.warning("无视频数据可保存")
return
df = pd.DataFrame(videos)
# 按BV号去重
df = df.drop_duplicates(subset=["BV号"])
# 增量保存
try:
history_df = pd.read_excel(save_path, engine="openpyxl")
df = pd.concat([history_df, df], ignore_index=True).drop_duplicates(subset=["BV号"])
except FileNotFoundError:
pass
df.to_excel(save_path, index=False, engine="openpyxl")
logging.info(f"视频列表已保存至 {save_path}(共 {len(df)} 条数据)")
# 封装好API供应商demo url=https://console.open.onebound.cn/console/?i=Lex
# 调用示例
if __name__ == "__main__":
# 单页获取示例:搜索"Python教程 零基础",按播放量排序,知识分区,近30天
single_page_result = bilibili_item_search_video(
keyword="Python教程 零基础",
category="knowledge",
time_range="30days",
sort_type="play",
page_size=20
)
if single_page_result["success"]:
print(f"获取到 {len(single_page_result['data'])} 条视频数据")
for video in single_page_result["data"][:5]: # 打印前5条
print(f"标题:{video['视频标题']} | 播放量:{video['近30天播放量']} | UP主:{video['UP主昵称']}")
else:
print(f"单页获取失败:{single_page_result['error_msg']}")
# 批量获取示例:获取前5页数据并保存
# batch_videos = batch_get_video_list(
# keyword="Python教程 零基础",
# category="knowledge",
# time_range="30days",
# sort_type="play",
# max_page=5
# )
# save_video_list(batch_videos)
四、调试与问题排查:快速解决对接异常
1. 优先用 Postman 调试(排除代码逻辑干扰)
- 构造请求 :新建 POST 请求,填写接口 URL,请求头设置
Content-Type: application/json; - 填写参数 :在请求体中输入
appkey、keyword、timestamp等必填项,按需补充筛选参数; - 生成签名 :用在线 MD5 工具手动计算
sign,填入参数; - 发送请求:查看响应结果,验证接口是否正常返回数据。
2. 高频问题排查表
| 问题现象 | 常见原因 | 解决方案 |
|---|---|---|
| 签名错误(401) | 1. 参数排序错误;2. secret不匹配;3. 时间戳过期;4. 中文未 URL 编码 |
1. 按 ASCII 升序排序参数并打印验证;2. 核对secret与后台一致;3. 校准本地时间(误差≤5 分钟);4. 确保urlencode处理特殊字符 |
| 权限不足(403) | 1. 未申请item_search_video接口权限;2. 普通账号使用企业字段(如 UP 主粉丝数);3. 调用频率超限 |
1. 在开放平台确认接口已开通;2. 移除企业专属参数或升级账号;3. 增加请求间隔,降低调用频率 |
| 参数错误(400) | 1. category取值错误(非官方分区名);2. time_range=custom未传日期;3. sort_type取值非法 |
1. 查阅服务商文档获取正确分区字典;2. 补充start_date和end_date;3. 核对sort_type取值(参考参数表) |
| 无视频数据返回 | 1. 关键词过于精准 / 无匹配视频;2. 筛选条件过于严格;3. 视频未被接口收录 | 1. 放宽关键词(如 "Python 零基础" 改为 "Python 教程");2. 移除分区 / 时间等筛选条件;3. 在 B 站官网搜索关键词,确认是否有相关视频 |
| 字段缺失(如无 UP 主粉丝数) | 1. 账号无企业权限;2. 接口版本不支持;3. UP 主隐私设置隐藏粉丝数 | 1. 升级为企业账号或申请专项权限;2. 联系服务商升级接口版本;3. 忽略该字段,仅保留基础信息 |
五、进阶优化:生产级稳定性提升
1. 性能优化
- 异步并发请求 :多关键词 / 多页码批量获取时,使用
aiohttp实现异步请求,控制并发数≤5(避免频率超限),效率比同步提升 4-6 倍; - 智能缓存策略 :用 Redis 缓存
关键词+筛选条件组合的搜索结果,缓存 key=bilibili_search_关键词_时间范围_分区,有效期 30 分钟;对无结果的关键词,缓存空结果(有效期 10 分钟),避免无效请求; - 分页智能停止 :获取第 1 页后,根据
page_total计算总页码,仅请求有效页码,避免page_no超过总页码的无效请求。
2. 数据质量优化
- 数据去重 :按
BV号去重,避免同一视频多次入库; - 异常值过滤:过滤播放量为 0、状态为下架的无效数据;
- 关键词扩展:结合 jieba 分词对核心关键词进行扩展(如 "Python 教程" 扩展为 "Python 零基础教程、Python 进阶教程"),提升搜索覆盖率。
3. 合规与安全
- 密钥管理 :生产环境中,将
appkey和secret存储在环境变量或配置中心(如 Nacos),禁止硬编码;定期轮换密钥(每 3 个月一次); - 数据合规:搜索结果仅用于合规业务,禁止商业化售卖;引用视频数据时标注来源,二次创作需获得 UP 主授权;
- 日志审计:详细记录每次接口调用的参数、响应、错误信息,保留至少 7 天日志,便于合规审计与问题追溯。
六、扩展场景:接口联动与功能升级
- 联动
item_get_video接口 :通过item_search_video获取bvid列表后,批量调用item_get_video获取视频分 P、字幕、播放链接等精细化详情; - 爆款视频分析模型 :结合
播放量、点赞率(点赞 / 播放)、弹幕率等指标,构建爆款评分公式,自动筛选优质视频; - 实时关键词监测 :使用
APScheduler定时调用接口,监控目标关键词的视频新增量、播放量变化,触发舆情 / 爆款告警