scrapy post请求——百度翻译(十四)

scrapy处理 post 请求

爬取百度翻译界面

目录

1.创建项目及爬虫文件

2.发送post请求


1.创建项目及爬虫文件

scrapy startproject scrapy_104

scrapy genspider translate fanyi.baidu.com

2.发送请求

post请求需要传递参数,所以就不能用start_urls和parse函数了,这里使用start_requests函数给url添加参数。

python 复制代码
class TranslateSpider(scrapy.Spider):
    name = 'translate'
    allowed_domains = ['fanyi.baidu.com']
    # start_urls = ['http://fanyi.baidu.com/']

    def start_requests(self):
        url = 'http://fanyi.baidu.com/sug'

        data = {
            'kw':'spider'
        }

        yield scrapy.FormRequest(url=url, formdata=data,callback=self.parse_second)

    def parse_second(self, response):
        content = response.text
        # print(content)  # 存在编码问题
        obj = json.loads(content,encoding='utf-8')
        print(obj)

这样就获取到了

相关推荐
强化试剂瓶3 天前
全面掌握Ergosterol-PEG-Biotin,麦角甾醇PEG生物素的使用与注意事项
python·scrapy·flask·scikit-learn·pyqt
深蓝电商API11 天前
Scrapy 爬虫监控:结合 Prometheus+Grafana 实践
爬虫·python·scrapy
林智勇(小学信息技术高级教师)11 天前
学习 Scratch 最好的方式
学习·scrapy
深蓝电商API12 天前
Scrapy 自定义命令与扩展:打造专属爬虫工具
爬虫·python·scrapy
深蓝电商API13 天前
Scrapy杜绝重复请求:Rfpdupfilter源码分析与优化
爬虫·python·scrapy
深蓝电商API13 天前
Scrapy LinkExtractor参数详解与复杂链接提取
爬虫·python·scrapy
爱吃提升13 天前
Scrapy 从入门到实战,爬取网页数据全流程
scrapy
深蓝电商API14 天前
Scrapy爬虫部署到Scrapyd服务端详解
爬虫·python·scrapy
深蓝电商API14 天前
Scrapy Feed Exports 进阶:多种格式导出配置
爬虫·python·scrapy
深蓝电商API14 天前
Scrapy信号机制:监控爬虫全生命周期
爬虫·python·scrapy