网络自动化04:python实现ACL匹配信息(主机与主机信息)

目录

今天不分享netmiko,今天分享一个用python提升工作效率的小案例:acl梳理时的信息匹配

背景

最近同事在梳理ACL,需要对每一条destination主机的条目,针对该目的地址主机,标记出这台主机的作用。

工作量大,重复性高,易错率高。

所以使用python进行自动化。

分析

  1. 首先,同事给出了一版已经做好匹配的文档,如下图(模拟):
  2. 根据给出的excel,拆分出对应的数据,放在一个sheet中,我这里命名为pattern
    第一列为IP,第二列开始为给出的主机信息:
  3. 分析python脚本执行思路:
    1. 读取patternsheet中的数据,以字典方式存入,key为第一列的IP,value为后续的主机信息(以列表存储);
    2. 循环对除了pattern sheet的其他sheet,每一行数据的第一列(即acl的每一个rule)去匹配刚刚第一步存储的字典的key,匹配成功后,在这一行后单元格中,填入key对应的value的值。

代码

python 复制代码
import pandas as pd
import numpy as np

def load_pattern_from_excel(file_path: str) -> dict:
    """
    从指定的Excel文件中读取'pattern'表内容,并返回一个字典。
    字典的键为第一列的值,值为每行后续列的内容列表(去除NaN)。
    
    参数:
        file_path (str): Excel文件的路径。
    
    返回:
        dict: 包含键值对的字典,键为第一列的内容,值为该行后续列的列表(去除NaN)。
    """
    # 读取Excel文件中的 'pattern' sheet
    df = pd.read_excel(file_path, sheet_name='pattern')

    # 将第一列作为字典的键,后续列的内容作为值存储在字典中,去除NaN
    pattern = {row[0]: [item for item in row[1:] if pd.notna(item)] for row in df.itertuples(index=False, name=None)}
    
    return pattern

def match_and_append_pattern(file_path: str, pattern: dict):
    """
    读取Excel文件中除'pattern'和'indexsheet'之外的所有sheet,
    检查第一列是否包含pattern中的key,匹配后将对应value的每个元素写入相邻单元格(跳过NaN)。
    
    参数:
        file_path (str): Excel文件的路径。
        pattern (dict): 包含匹配模式的字典,键为要匹配的字符串,值为需要写入的列表(无NaN)。
    """
    # 读取Excel文件
    xls = pd.ExcelFile(file_path)
    
    # 获取所有sheet名称,排除 'pattern' 和 'indexsheet'
    sheets_to_process = [sheet for sheet in xls.sheet_names if sheet not in ['pattern', 'indexsheet']]
    
    # 创建一个字典来存储每个sheet的更新内容
    updated_sheets = {}

    # 遍历需要处理的sheet
    for sheet_name in sheets_to_process:
        # 读取当前sheet的数据
        df = pd.read_excel(xls, sheet_name=sheet_name)
        
        # 遍历第一列的每一行,检查是否包含pattern的key
        for idx, cell_value in enumerate(df.iloc[:, 0]):
            for key, values in pattern.items():
                if key in str(cell_value):  # 检查第一列单元格是否包含key
                    # 在匹配的行写入values中的每个非NaN元素
                    start_col = 1  # 从B列开始写入
                    for value in values:
                        if pd.notna(value):  # 仅写入非NaN的值
                            if start_col >= df.shape[1]:
                                df.insert(start_col, f'New_Col_{start_col}', None)  # 添加新列
                            df.iat[idx, start_col] = value
                            start_col += 1
                    break  # 只匹配第一个找到的key并写入
        
        # 将更新后的DataFrame存储到字典中
        updated_sheets[sheet_name] = df
    
    # 将更新后的内容写回到新的Excel文件中
    with pd.ExcelWriter('Updated_ACL.xlsx') as writer:
        for sheet_name, updated_df in updated_sheets.items():
            updated_df.to_excel(writer, sheet_name=sheet_name, index=False)
    
    print("匹配和追加已完成,文件已保存为 'Updated_ACL.xlsx'.")

def main():
    file_path = 'ACL.xlsx'
    
    # 加载 pattern 表内容
    pattern = load_pattern_from_excel(file_path)
    
    # 进行匹配并更新其他 sheet
    match_and_append_pattern(file_path, pattern)

if __name__ == "__main__":
    main()

代码解读

这版代码实现了从Excel文件中提取特定的模式(pattern),并将这些模式应用到其他工作表中,对匹配的内容进行扩展性写入。以下是对代码的逐步讲解,以便更详细地了解其逻辑和功能:

代码总体结构

  1. load_pattern_from_excel 函数 :从Excel文件的 pattern sheet中读取数据,并生成一个以字典形式存储的 pattern 变量。
  2. match_and_append_pattern 函数 :将 pattern 变量的内容应用到 ACL.xlsx 中除 patternindexsheet 之外的所有sheet,找到匹配项后,将模式中对应的内容写入匹配行的指定位置。
  3. main 函数 :作为脚本的主函数,负责调用 load_pattern_from_excelmatch_and_append_pattern 函数,完成整个流程。

1. load_pattern_from_excel 函数

python 复制代码
def load_pattern_from_excel(file_path: str) -> dict:
    """
    从指定的Excel文件中读取'pattern'表内容,并返回一个字典。
    字典的键为第一列的值,值为每行后续列的内容列表(去除NaN)。
    
    参数:
        file_path (str): Excel文件的路径。
    
    返回:
        dict: 包含键值对的字典,键为第一列的内容,值为该行后续列的列表(去除NaN)。
    """
    # 读取Excel文件中的 'pattern' sheet
    df = pd.read_excel(file_path, sheet_name='pattern')

    # 将第一列作为字典的键,后续列的内容作为值存储在字典中,去除NaN
    pattern = {row[0]: [item for item in row[1:] if pd.notna(item)] for row in df.itertuples(index=False, name=None)}
    
    return pattern

功能解释

  • load_pattern_from_excel 函数的作用是读取Excel文件中特定的sheet(在这里是pattern)并将其内容格式化为一个字典 pattern
  • 字典的键来自于 pattern sheet 的第一列,表示需要在其他工作表中匹配的字符串。
  • 字典的值是每行后续列的内容列表,并且过滤掉所有 NaN 。这意味着,如果有空白单元格,它们不会被纳入到 pattern 中。

实现细节

  • pd.read_excel(file_path, sheet_name='pattern') 读取指定的Excel文件的 pattern sheet。
  • 使用 itertuples 遍历每一行,并构建一个字典推导式 {row[0]: [item for item in row[1:] if pd.notna(item)]},通过列表推导式过滤掉 NaN 值。

2. match_and_append_pattern 函数

python 复制代码
def match_and_append_pattern(file_path: str, pattern: dict):
    """
    读取Excel文件中除'pattern'和'indexsheet'之外的所有sheet,
    检查第一列是否包含pattern中的key,匹配后将对应value的每个元素写入相邻单元格(跳过NaN)。
    
    参数:
        file_path (str): Excel文件的路径。
        pattern (dict): 包含匹配模式的字典,键为要匹配的字符串,值为需要写入的列表(无NaN)。
    """
    # 读取Excel文件
    xls = pd.ExcelFile(file_path)
    
    # 获取所有sheet名称,排除 'pattern' 和 'indexsheet'
    sheets_to_process = [sheet for sheet in xls.sheet_names if sheet not in ['pattern', 'indexsheet']]
    
    # 创建一个字典来存储每个sheet的更新内容
    updated_sheets = {}

    # 遍历需要处理的sheet
    for sheet_name in sheets_to_process:
        # 读取当前sheet的数据
        df = pd.read_excel(xls, sheet_name=sheet_name)
        
        # 遍历第一列的每一行,检查是否包含pattern的key
        for idx, cell_value in enumerate(df.iloc[:, 0]):
            for key, values in pattern.items():
                if key in str(cell_value):  # 检查第一列单元格是否包含key
                    # 在匹配的行写入values中的每个非NaN元素
                    start_col = 1  # 从B列开始写入
                    for value in values:
                        if pd.notna(value):  # 仅写入非NaN的值
                            if start_col >= df.shape[1]:
                                df.insert(start_col, f'New_Col_{start_col}', None)  # 添加新列
                            df.iat[idx, start_col] = value
                            start_col += 1
                    break  # 只匹配第一个找到的key并写入
        
        # 将更新后的DataFrame存储到字典中
        updated_sheets[sheet_name] = df
    
    # 将更新后的内容写回到新的Excel文件中
    with pd.ExcelWriter('Updated_ACL.xlsx') as writer:
        for sheet_name, updated_df in updated_sheets.items():
            updated_df.to_excel(writer, sheet_name=sheet_name, index=False)
    
    print("匹配和追加已完成,文件已保存为 'Updated_ACL.xlsx'.")

功能解释

  • 该函数的主要功能是遍历 ACL.xlsx 中所有的工作表(除 patternindexsheet),然后检查每个工作表的第一列中是否包含 pattern 中的任何键。
  • 一旦找到匹配的键,函数会从B列开始,按顺序将 pattern 中对应的值逐个写入单元格,每个值占据一个单元格。如果值为 NaN 则跳过。

实现细节

  1. 读取所有工作表 :使用 pd.ExcelFile(file_path) 读取Excel文件,然后过滤出需要处理的工作表。
  2. 遍历每个工作表 :使用 for sheet_name in sheets_to_process 逐个读取并处理每个工作表。
  3. 匹配和写入数据
    • for idx, cell_value in enumerate(df.iloc[:, 0]) 遍历第一列的每一行,检查每个单元格是否包含 pattern 中的任何键。
    • 如果匹配成功,则按顺序将 values 列表中的每个元素写入到匹配行的相邻单元格,从 B 列开始(即 start_col = 1)。
    • 在写入时,使用 pd.notna(value) 跳过 NaN 值。
    • 如果需要的列数超过现有列,则动态添加新列 df.insert(start_col, f'New_Col_{start_col}', None)
  4. 保存更新后的工作表 :处理完所有工作表后,将结果保存到新的Excel文件 Updated_ACL.xlsx

3. main 函数

python 复制代码
if __name__ == "__main__":
    file_path = 'ACL.xlsx'
    # 加载 pattern 表内容
    pattern = load_pattern_from_excel(file_path)
    # 进行匹配并更新其他 sheet
    match_and_append_pattern(file_path, pattern)

功能解释

  • 首先加载 pattern sheet 的内容并生成 pattern 字典。
  • 然后调用 match_and_append_pattern 函数,对所有目标工作表进行处理并输出结果。

总结

  • 代码逻辑 :先构建模式数据字典 pattern,然后匹配并写入其他工作表。
  • 数据写入 :匹配成功的 value 列表内容依次写入相邻单元格,跳过 NaN 值。
  • 输出文件 :最终将处理结果保存到新文件 Updated_ACL.xlsx

最终的效果:

让每一个sheet都如下图一样:

相关推荐
贾贾20231 小时前
配电自动化系统“三区四层”数字化架构
运维·科技·架构·自动化·能源·制造·智能硬件
大懒猫软件2 小时前
如何运用python爬虫获取大型资讯类网站文章,并同时导出pdf或word格式文本?
python·深度学习·自然语言处理·网络爬虫
XianxinMao3 小时前
RLHF技术应用探析:从安全任务到高阶能力提升
人工智能·python·算法
查理零世4 小时前
【算法】经典博弈论问题——巴什博弈 python
开发语言·python·算法
啥也学不会a5 小时前
PLC通信
开发语言·网络·网络协议·c#
汤姆和佩琦5 小时前
2025-1-21-sklearn学习(43) 使用 scikit-learn 介绍机器学习 楼上阑干横斗柄,寒露人远鸡相应。
人工智能·python·学习·机器学习·scikit-learn·sklearn
HyperAI超神经5 小时前
【TVM教程】为 ARM CPU 自动调优卷积网络
arm开发·人工智能·python·深度学习·机器学习·tvm·编译器
缺的不是资料,是学习的心6 小时前
使用qwen作为基座训练分类大模型
python·机器学习·分类
hunter2062066 小时前
ubuntu调用图形化网络测试工具
网络·测试工具·ubuntu
Zda天天爱打卡6 小时前
【机器学习实战中阶】使用Python和OpenCV进行手语识别
人工智能·python·深度学习·opencv·机器学习