数据结构学习之树结构

前段时间刚好在学习机器学习中的决策树,想起多年前学习树这个数据结构的场景,刚好借此机会回归一下知识点。

树是一种非常常见的数据结构,它由节点(Node)和边(Edge)构成。它有如下的一些特征:

  1. 根结点(Root Node):树有且只有一个根结点,它是树的顶端结点。

  2. 结点(Node):每个结点包含一个值或信息,除了根结点,每个结点都有一个父结点和零个或多个子结点。

  3. 边(Edge):连接两个结点的连线,表示结点之间的关系。

  4. 叶结点(Leaf Node):没有子结点的结点。

  5. 子结点(Child Node):直接连接在某结点下的结点。

  6. 父结点(Parent Node):直接连接在某结点上的结点。

  7. 子树(Subtree):由一个结点及其所有子结点组成的树。

根据树的节点情况,主要有下面的分类:

  1. 二叉树(Binary Tree):每个结点最多有两个子结点,称为左子结点和右子结点。

  2. 完全二叉树(Complete Binary Tree):除了最后一层,其他层的结点都填满了,最后一层的结点靠左排列。

  3. 满二叉树(Full Binary Tree):每个结点要么是叶结点,要么有两个子结点。

  4. 平衡二叉树(Balanced Binary Tree):左右子树的高度差不超过1的二叉树。

  5. 二叉搜索树(Binary Search Tree, BST):左子结点的值小于父结点的值,右子结点的值大于父结点的值。

树的真实应用很多,比如LInux系统中的文件系统结构就是树结构。

我用Python实现了这个文件系统的树结构,代码如下:

class FileSystemNode:
    def __init__(self, name, is_directory=False):
        self.name = name
        self.is_directory = is_directory
        self.children = []

    def add_child(self, child_node):
        if self.is_directory:
            self.children.append(child_node)
        else:
            raise ValueError("Cannot add child to a file node")

    def __repr__(self, level=0):
        ret = "\t" * level + repr(self.name) + "\n"
        for child in self.children:
            ret += child.__repr__(level + 1)
        return ret

# 创建文件系统根目录
root = FileSystemNode("/", is_directory=True)

# 创建子目录和文件
home = FileSystemNode("home", is_directory=True)
var = FileSystemNode("var", is_directory=True)
etc = FileSystemNode("etc", is_directory=True)

user1 = FileSystemNode("user1", is_directory=True)
user2 = FileSystemNode("user2", is_directory=True)

documents = FileSystemNode("documents", is_directory=True)
pictures = FileSystemNode("pictures", is_directory=True)

file1 = FileSystemNode("file1.txt")
photo1 = FileSystemNode("photo1.jpg")

# 构建文件系统树
root.add_child(home)
root.add_child(var)
root.add_child(etc)

home.add_child(user1)
home.add_child(user2)

user1.add_child(documents)
user1.add_child(pictures)

documents.add_child(file1)
pictures.add_child(photo1)

# 打印文件系统树
print(root)

运行代码,可以得到输出如下所示:

'/'
	'home'
		'user1'
			'documents'
				'file1.txt'
			'pictures'
				'photo1.jpg'
		'user2'
	'var'
	'etc'

可以看出这个文件夹结构是一个多叉树,一个父节点可以有多个子节点。

最开始说到的决策树也是一种树结构的应用。下面是用Python实现的树的定义和三种遍历算法:

class TreeNode:
    def __init__(self, value=0, left=None, right=None):
        self.value = value
        self.left = left
        self.right = right


# 创建一个简单的二叉树
root = TreeNode(1)
root.left = TreeNode(2)
root.right = TreeNode(3)
root.left.left = TreeNode(4)
root.left.right = TreeNode(5)


# 前序遍历
def pre_order_traversal(node):
    if not node:
        return
    print(node.value, end=' ')
    pre_order_traversal(node.left)
    pre_order_traversal(node.right)

# 中序遍历
def mid_order_traversal(node):
    if not node:
        return
    mid_order_traversal(node.left)
    print(node.value, end=' ')
    mid_order_traversal(node.right)

# 后序遍历
def post_order_traversal(node):
    if not node:
        return
    post_order_traversal(node.left)
    post_order_traversal(node.right)
    print(node.value, end=' ')

# 调用前序遍历
pre_order_traversal(root)  # 输出:1 2 4 5 3
print("-------------------------\r\n")
mid_order_traversal(root)
print("-------------------------\r\n")
post_order_traversal(root)

明天在继续学习树的其他案例,日拱一卒,不负年华。

相关推荐
数据小爬虫@2 小时前
深入解析:使用 Python 爬虫获取苏宁商品详情
开发语言·爬虫·python
健胃消食片片片片2 小时前
Python爬虫技术:高效数据收集与深度挖掘
开发语言·爬虫·python
ℳ₯㎕ddzོꦿ࿐5 小时前
解决Python 在 Flask 开发模式下定时任务启动两次的问题
开发语言·python·flask
CodeClimb5 小时前
【华为OD-E卷 - 第k个排列 100分(python、java、c++、js、c)】
java·javascript·c++·python·华为od
一水鉴天5 小时前
为AI聊天工具添加一个知识系统 之63 详细设计 之4:AI操作系统 之2 智能合约
开发语言·人工智能·python
Channing Lewis5 小时前
什么是 Flask 的蓝图(Blueprint)
后端·python·flask
B站计算机毕业设计超人5 小时前
计算机毕业设计hadoop+spark股票基金推荐系统 股票基金预测系统 股票基金可视化系统 股票基金数据分析 股票基金大数据 股票基金爬虫
大数据·hadoop·python·spark·课程设计·数据可视化·推荐算法
觅远6 小时前
python+playwright自动化测试(四):元素操作(键盘鼠标事件)、文件上传
python·自动化
ghostwritten6 小时前
Python FastAPI 实战应用指南
开发语言·python·fastapi
CM莫问7 小时前
python实战(十五)——中文手写体数字图像CNN分类
人工智能·python·深度学习·算法·cnn·图像分类·手写体识别