php新手实战:自定义书源下载api

网上有很多第三方小说网站提供小说下载,而下载的过程无非就是搜索书籍,然后找到下载链接点击下载即可。只是类似这种"良心"的小说网站实在是太少。大多数仅支持在线阅读。而如今,我却要利用这种为数不多的"良心"小说站点提供的书源来作为自己的书源接口。真是....让人唏嘘啊。希望大家还是抱着学习的心态来。本次主要是分享这种二次简易包装接口的方法。从而管中窥豹,举一反三。

tips:本次分享主要以学习交流为主,尊重书籍正版授权。

1.书源网站

这次示范的网站为一个第三方小说站点。通过站内搜索返回的内容知道返回的是html内容。当然,如果是直接返回json数据的话我也就没必要写这篇博文了。不过返回的html也是有操作空间的。

2.解析网页构建接口

先看本地php运行效果吧。单php文件:index.php

主要用到了php的DOMDocument和DOMXPath来解析网页内容,然后构建json数据返回。具体的代码中已做注释。闲话少叙,直接上代码。

php 复制代码
<?php
// 创建 cURL 句柄
$ch = curl_init();

// 设置 cURL 选项
curl_setopt($ch, CURLOPT_URL, 'http://www.aixiashu.info/modules/article/search.php'); // 设置要访问的 URL
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); // 将响应保存为字符串而不直接输出
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true); // 跟随重定向

// 设置 POST 参数
$postData = array(
    'searchkey' => $_GET['book'], // 第一个参数及其值
    'searchtype' => 'articlename' // 第二个参数及其值
);
curl_setopt($ch, CURLOPT_POST, true); // 设置为 POST 请求
curl_setopt($ch, CURLOPT_POSTFIELDS, $postData); // 设置 POST 参数

// 执行 cURL 请求并获取响应
$response = curl_exec($ch);

// 检查是否有错误发生
if (curl_errno($ch)) {
    echo 'cURL Error: ' . curl_error($ch);
    exit;
}

// 关闭 cURL 句柄
curl_close($ch);

// 输出响应内容
// echo $response;

// 创建一个 DOMDocument 对象
$dom = new DOMDocument();
$html = $response;
// 禁用标准的 libxml 错误,并启用用户错误处理
$libxml_previous_state = libxml_use_internal_errors(true);
// 解析
$dom->loadHTML($html);
// 清空 libxml 错误缓冲
libxml_clear_errors();
// 还原之前设置
libxml_use_internal_errors($libxml_previous_state);

 $xpath = new DOMXPath($dom);
 $autherElements =$xpath->query('//tr/td[contains(@class, "even")][2]');
 $links = $xpath->query('//td[contains(@class, "even")]/a');
// 创建一个数组来存储结果对象
$resultArray = array();

// 遍历查询结果并将 href 属性和文本值组成数组对象
foreach ($links as $index => $anchor) {
    $href = $anchor->getAttribute('href');
    $bookId = extractBookId($href);
    // 获取对应书的作者名
    $autherElement = $autherElements->item($index);
    $auther = $autherElement ? $autherElement->nodeValue : '';
    
    $resultArray[] = array(
        'href' => $href,
        'text' => $anchor->nodeValue,
        'bookid' => 'http://txt.aixiashu.info/modules/article/txtarticle.php?id='.$bookId,
        'auther' => $auther
    );
}

// 将数组转换为 JSON 格式
$jsonArray = json_encode($resultArray);

// 输出 JSON 数组
echo $jsonArray;


// 从 href 地址中提取 bookid 的函数
function extractBookId($href) {
    $pattern = '/\/(\d+)\/$/';
    preg_match($pattern, $href, $matches);
    return isset($matches[1]) ? $matches[1] : null;
}

?>

将该php文件放到php站点运行,就相当于提供了一个书源查询下载的接口。怎么样,是不是很简单。这种利用第三方的接口二次"包装"作为自定义使用接口。我只能说,香是真滴香。但是,不道德。所以,只是提供给大家这种写自用接口的思路。不推荐使用哈。

相关推荐
百流22 分钟前
scala文件编译相关理解
开发语言·学习·scala
Evand J1 小时前
matlab绘图——彩色螺旋图
开发语言·matlab·信息可视化
深度混淆2 小时前
C#,入门教程(04)——Visual Studio 2022 数据编程实例:随机数与组合
开发语言·c#
雁于飞2 小时前
c语言贪吃蛇(极简版,基本能玩)
c语言·开发语言·笔记·学习·其他·课程设计·大作业
wenxin-3 小时前
NS3网络模拟器中如何利用Gnuplot工具像MATLAB一样绘制各类图形?
开发语言·matlab·画图·ns3·lr-wpan
数据小爬虫@5 小时前
深入解析:使用 Python 爬虫获取苏宁商品详情
开发语言·爬虫·python
健胃消食片片片片5 小时前
Python爬虫技术:高效数据收集与深度挖掘
开发语言·爬虫·python
王老师青少年编程6 小时前
gesp(C++五级)(14)洛谷:B4071:[GESP202412 五级] 武器强化
开发语言·c++·算法·gesp·csp·信奥赛
一只小bit7 小时前
C++之初识模版
开发语言·c++