有道词典网页版接口分析与爬虫研究

说明:仅供学习使用,请勿用于非法用途,若有侵权,请联系博主删除

作者:zhu6201976

一、目标站点

有道词典网页版:网易有道

二、目标接口

url:https://dict.youdao.com/jsonapi_s?doctype=json&jsonversion=4

method:POST

formdata:

如图所示,需要解决参数sign、t的算法逆向,难度:中

三、部分样例代码

1. sign、t参数生成逻辑

python 复制代码
    def generate_sign_t(q, w):
        """
        sign/t 生成
        :params q: 搜索词
        :params w: 网页中获取
        return: sign, t
        """
        time_ = len(f'{q}webdict') % 10
        r = f'{q}webdict'
        o = hashlib.md5(r.encode('utf-8')).hexdigest()
        n = f'web{q}{time_}{w}{o}'
        f = hashlib.md5(n.encode('utf-8')).hexdigest()
        return f, time_

2. 搜索接口请求构造

python 复制代码
            url = f'{self.root_url}/jsonapi_s?doctype=json&jsonversion=4'
            headers = {
                'Content-Type': 'application/x-www-form-urlencoded',
                'Referer': 'https://www.youdao.com/',
            }
            sign, t = self.generate_sign_t(q)
            data = {
                'q': q,
                'le': 'en',
                't': f'{t}',
                'client': 'web',
                'sign': f'{sign}',
                'keyfrom': 'webdict'
            }
            yield scrapy.FormRequest(url, headers=headers, formdata=data, method='POST', callback=self.parse)
相关推荐
糕冷小美n11 小时前
elementuivue2表格不覆盖整个表格添加固定属性
前端·javascript·elementui
小哥不太逍遥11 小时前
Technical Report 2024
java·服务器·前端
沐墨染11 小时前
黑词分析与可疑对话挖掘组件的设计与实现
前端·elementui·数据挖掘·数据分析·vue·visual studio code
anOnion12 小时前
构建无障碍组件之Disclosure Pattern
前端·html·交互设计
threerocks12 小时前
前端将死,Agent 永生
前端·人工智能·ai编程
问道飞鱼12 小时前
【前端知识】Vite用法从入门到实战
前端·vite·项目构建
爱上妖精的尾巴13 小时前
8-10 WPS JSA 正则表达式:贪婪匹配
服务器·前端·javascript·正则表达式·wps·jsa
shadow fish13 小时前
react学习记录(三)
javascript·学习·react.js
小疙瘩14 小时前
element-ui 中 el-upload 多文件一次性上传的实现
javascript·vue.js·ui
Aliex_git14 小时前
浏览器 API 兼容性解决方案
前端·笔记·学习