【网络安全带你练爬虫-100练】第17练:分割字符串

目录

一、目标1:使用函数分割

二、目标2:使用函数模块

三、目标3:使用正则匹配


一、目标1:使用函数分割

目标:x.x.x.x[中国北京 xx云]

方法:split函数+replace函数


1、分割:使用split()方法将其按照"["进行分割,得到一个列表split_ip

2、元素:列表的第一个元素就是IP地址部分,第二个元素是包含位置信息的字符串。

3、获取目标:通过索引split_ip[0]获取IP地址部分,将其赋值给变量ip。通过split_ip[1]获取位置信息部分

4、使用replace()方法去掉末尾的"]",将得到的结果赋值给变量location

python 复制代码
ip_address = "x.x.x.x[中国北京 xx云]"
split_ip = ip_address.split("[")
ip = split_ip[0]
location = split_ip[1].replace("]", "")

print("IP: ", ip)
print("Location: ", location)


二、目标2:使用函数模块

urlparse函数(urllib模块):可以解析URL并将其拆分为各个组成部分。然后将要截取域名的URL赋值给url变量

python 复制代码
from urllib.parse import urlparse

url = "https://www.example.com/path/page.html"

parsed_url = urlparse(url)
domain = parsed_url.netloc

print(domain) # 输出:"www.example.com"

三、目标3:使用正则匹配

正则匹配根据具体情况具体分析

python 复制代码
import re

# 假设data是你的数据包内容,可以是一个字符串或文本文件等
data = "This is a sample text with URLs like http://example.com and https://www.google.com"

# 定义URL匹配的正则表达式模式
pattern = r'(https?://\S+)'

# 使用findall()函数匹配所有URL
urls = re.findall(pattern, data)

# 打印提取到的URL
for url in urls:
    print(url)
相关推荐
Larcher5 分钟前
Python List、切片与大模型:从入门到实践的优雅之旅
python·ai编程
用户63371973590112 分钟前
_winapi.CreateProcess....FileNotFoundError: [WinError 2] 系统找不到指定的文件
python
清水白石00812 分钟前
Python 数据建模指南:dataclass、TypedDict 与 Pydantic 的选型博弈
前端·javascript·python
小郑加油13 分钟前
python_综合训练
开发语言·python
葬送的代码人生13 分钟前
Notebook环境下的List、Slice与LLM大冒险
python·jupyter·api
多彩电脑14 分钟前
Kivy的事件向方法传递的event是什么?
开发语言·python
hnxaoli16 分钟前
统信小程序(十四)支持拖拽的旋图程序
python·小程序
2601_9601020416 分钟前
什么是蜘蛛池?百度快速录入
爬虫·搜索引擎·百度·蜘蛛池
惊梢鸟21 分钟前
一天学会三个实用Python技巧:切片、strip()和LLM接口调用
python
小林ixn26 分钟前
从 List 切片到 LLM 调用:一篇搞定 Python 基础与 AI 接口
python·ai编程