通过爬虫反查IP地址

加入你知道 对方的网络IP

71.112.190.213

抓取的链接: https://site.ip138.com/71.112.190.213/

python 复制代码
# !/usr/bin/env python
# -*-coding:utf-8 -*-

"""
# File       : two_spider_ip.py
# Time       :2024/1/30 9:34
# Author     :Jewel
# version    :python 3.9.8
# Description:
"""
import time

import pandas as pd
import requests
from icecream import ic
import re

def get_address(ip):
    ic(ip)
    url = f'https://site.ip138.com/{ip}/'

    data = {
        # 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/119.0.0.0 Safari/537.36',
        'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/116.0.0.0 Safari/537.36',
    }
    response = requests.get(url, headers=data)
    html_str = response.text
    address = re.findall('<h3>(.*?)</h3>', html_str)
    print(address)  # ['美国 犹他 盐湖城 Level3']
    return address[0]





if __name__ == '__main__':

    df_ips = pd.read_csv('./email_null.csv')

    df_all=df_ips.reset_index(drop=True)
    for ids, value in df_all.iterrows():
        ic(value)
        ip = value['user_ip'].split(',')[0]
        ips = get_address(ip)
        df_all.loc[ids, 'pi'] = ips
        time.sleep(1)

    df_all.to_csv('./two_ips.csv', index=False)


相关推荐
SUGERBOOM3 小时前
【网络安全】网络基础第一阶段——第二节:网络协议基础---- 路由和ARP协议
网络·网络协议
~yY…s<#>3 小时前
【计算机网络】传输层协议TCP
linux·开发语言·网络·c++·网络协议·tcp/ip·计算机网络
Smartdaili China4 小时前
使用 Puppeteer-Cluster 和代理进行高效网络抓取: 完全指南
大数据·开发语言·网络·爬虫·php·puppeteer·代理服务器
Kusunoki_D5 小时前
传输层 IV(TCP协议——流量控制、拥塞控制)【★★★★】
网络·网络协议·tcp/ip·计算机网络
码农派大星。5 小时前
网络原理 HTTP与HTTPS协议
网络·网络协议·http·https
知本知至5 小时前
基于open-gpu-kernel-modules的p2p vram映射bar1提高通信效率
网络·网络协议·p2p
月临水6 小时前
JavaEE: 深入探索TCP网络编程的奇妙世界(二)
网络·tcp/ip·java-ee
听我一言8 小时前
ESP32-WROOM-32 [ESP连接路由器+TCP Client 透传 + TCP Server数据发送]
网络·网络协议·tcp/ip·esp32
AIwenIPgeolocation8 小时前
万兆时代 TCP/IP如何赋能以太网飞跃
网络协议·tcp/ip·php
WpfJya9 小时前
某省公共资源交易电子平台爬虫逆向
爬虫