
问题:1.不知道怎么输入
2.判断网页的正则表达式怎默写
ok,先导入正则工具:



疑问:第一次用sys.stdin 和 .read() , 咋用,必须要一起用吗
详解:

stdin 译 标准输入


这里可能是oj平台吧,所以用了这个之后,不用空格输入结束了

再来区别一下和普通输入:
| 方法 | 读取方式 | 结束条件 | 适用场景 |
|---|---|---|---|
sys.stdin.read() |
一次性读全部 | 遇到 EOF | 多行大文本(如 HTML、日志) |
input() |
逐行读 | 遇到换行符(按回车) | 单行简单输入(如用户名) |
接下来定义正则表达式了:

详解:

href 译:


这里再详解一下 [^"]





然后:

url 解释:



python
import re
import sys
html_content = sys.stdin.read()
url_pattern = r'href="([^"]+)"'
urls = re.findall(url_pattern,html_content)
for url in urls:
print(url)

问题:这个正则表达式根本不会写【😭】
这样:

先解释一下里面的部分吧:



然后解释:


以上慢慢看吧,难懂,加油

先给一下代码吧,我也不知道咋写

解释一下:





