php新手实战:自定义书源下载api

网上有很多第三方小说网站提供小说下载,而下载的过程无非就是搜索书籍,然后找到下载链接点击下载即可。只是类似这种"良心"的小说网站实在是太少。大多数仅支持在线阅读。而如今,我却要利用这种为数不多的"良心"小说站点提供的书源来作为自己的书源接口。真是....让人唏嘘啊。希望大家还是抱着学习的心态来。本次主要是分享这种二次简易包装接口的方法。从而管中窥豹,举一反三。

tips:本次分享主要以学习交流为主,尊重书籍正版授权。

1.书源网站

这次示范的网站为一个第三方小说站点。通过站内搜索返回的内容知道返回的是html内容。当然,如果是直接返回json数据的话我也就没必要写这篇博文了。不过返回的html也是有操作空间的。

2.解析网页构建接口

先看本地php运行效果吧。单php文件:index.php

主要用到了php的DOMDocument和DOMXPath来解析网页内容,然后构建json数据返回。具体的代码中已做注释。闲话少叙,直接上代码。

php 复制代码
<?php
// 创建 cURL 句柄
$ch = curl_init();

// 设置 cURL 选项
curl_setopt($ch, CURLOPT_URL, 'http://www.aixiashu.info/modules/article/search.php'); // 设置要访问的 URL
curl_setopt($ch, CURLOPT_RETURNTRANSFER, true); // 将响应保存为字符串而不直接输出
curl_setopt($ch, CURLOPT_FOLLOWLOCATION, true); // 跟随重定向

// 设置 POST 参数
$postData = array(
    'searchkey' => $_GET['book'], // 第一个参数及其值
    'searchtype' => 'articlename' // 第二个参数及其值
);
curl_setopt($ch, CURLOPT_POST, true); // 设置为 POST 请求
curl_setopt($ch, CURLOPT_POSTFIELDS, $postData); // 设置 POST 参数

// 执行 cURL 请求并获取响应
$response = curl_exec($ch);

// 检查是否有错误发生
if (curl_errno($ch)) {
    echo 'cURL Error: ' . curl_error($ch);
    exit;
}

// 关闭 cURL 句柄
curl_close($ch);

// 输出响应内容
// echo $response;

// 创建一个 DOMDocument 对象
$dom = new DOMDocument();
$html = $response;
// 禁用标准的 libxml 错误,并启用用户错误处理
$libxml_previous_state = libxml_use_internal_errors(true);
// 解析
$dom->loadHTML($html);
// 清空 libxml 错误缓冲
libxml_clear_errors();
// 还原之前设置
libxml_use_internal_errors($libxml_previous_state);

 $xpath = new DOMXPath($dom);
 $autherElements =$xpath->query('//tr/td[contains(@class, "even")][2]');
 $links = $xpath->query('//td[contains(@class, "even")]/a');
// 创建一个数组来存储结果对象
$resultArray = array();

// 遍历查询结果并将 href 属性和文本值组成数组对象
foreach ($links as $index => $anchor) {
    $href = $anchor->getAttribute('href');
    $bookId = extractBookId($href);
    // 获取对应书的作者名
    $autherElement = $autherElements->item($index);
    $auther = $autherElement ? $autherElement->nodeValue : '';
    
    $resultArray[] = array(
        'href' => $href,
        'text' => $anchor->nodeValue,
        'bookid' => 'http://txt.aixiashu.info/modules/article/txtarticle.php?id='.$bookId,
        'auther' => $auther
    );
}

// 将数组转换为 JSON 格式
$jsonArray = json_encode($resultArray);

// 输出 JSON 数组
echo $jsonArray;


// 从 href 地址中提取 bookid 的函数
function extractBookId($href) {
    $pattern = '/\/(\d+)\/$/';
    preg_match($pattern, $href, $matches);
    return isset($matches[1]) ? $matches[1] : null;
}

?>

将该php文件放到php站点运行,就相当于提供了一个书源查询下载的接口。怎么样,是不是很简单。这种利用第三方的接口二次"包装"作为自定义使用接口。我只能说,香是真滴香。但是,不道德。所以,只是提供给大家这种写自用接口的思路。不推荐使用哈。

相关推荐
Dxy12393102162 分钟前
Python线程锁:为什么多线程会“打架“,以及怎么解决
开发语言·前端·python
guygg8814 分钟前
人行走作用下板的振动响应 MATLAB 仿真
开发语言·matlab
小二·36 分钟前
Next.js 15 全栈开发实战
开发语言·javascript·ecmascript
fox_lht37 分钟前
15.3.改进我们之前的输入、输出项目
开发语言·后端·学习·rust
java1234_小锋1 小时前
LangChain4j 开发Java Agent智能体- 多模态支持
java·开发语言·langchain4j
凡人叶枫1 小时前
Effective C++ 条款23:宁以 non-member、non-friend 替换 member 函数
linux·开发语言·c++·嵌入式开发
张忠琳1 小时前
【Go 1.26.4】Golang Channel 深度解析
开发语言·后端·golang
盈建云系统1 小时前
B2B产品展示网站怎么做?从产品目录到询盘表单,企业获客页面搭建流程
开发语言·网站搭建·开发网站
不会C语言的男孩1 小时前
Linux 系统编程 · 第 4 章:文件属性与元数据
linux·c语言·开发语言
kernelcraft1 小时前
Boto3:Python 操作 AWS 的官方 SDK
开发语言·python·其他·aws