在编程和文本处理中,括号匹配是一个经典问题,广泛应用于编译器、解释器、文本编辑器等场景。在 Exercism 的 "matching-brackets" 练习中,我们需要实现一个函数来检查字符串中的括号是否正确匹配。这不仅能帮助我们掌握栈数据结构的应用,还能深入学习Rust中的字符处理、数据结构实现和算法设计。
什么是括号匹配问题?
括号匹配问题是检查文本中各种类型的括号是否正确配对的问题。需要检查的括号类型包括:
- 圆括号:
( ) - 方括号:
[ ] - 花括号:
{ }
正确的括号匹配需要满足以下条件:
- 每个开括号都有对应的闭括号
- 每个闭括号都有对应的开括号
- 括号的嵌套顺序正确
例如:
"[]"是正确的"[()]"是正确的"([)]"是错误的(交叉嵌套)"([)"是错误的(缺少匹配)
括号匹配在以下领域有应用:
- 编译器:检查程序语法中的括号匹配
- 文本编辑器:高亮显示匹配的括号
- 数学表达式:验证数学表达式的正确性
- HTML/XML解析:检查标签的正确嵌套
让我们先看看练习提供的函数签名:
rust
pub fn brackets_are_balanced(string: &str) -> bool {
unimplemented!(
"Check if the string \"{}\" contains balanced brackets",
string
);
}
我们需要实现一个函数,检查给定字符串中的括号是否正确匹配。
设计分析
1. 核心要求
- 字符识别:识别各种类型的括号字符
- 匹配检查:检查括号是否正确配对
- 嵌套处理:处理嵌套的括号结构
- 忽略非括号字符:忽略文本中的其他字符
2. 技术要点
- 栈数据结构:使用栈来跟踪未匹配的开括号
- 字符处理:高效处理字符串中的字符
- 匹配逻辑:实现正确的括号匹配逻辑
- 边界情况:处理各种边界情况
完整实现
1. 基础实现
rust
pub fn brackets_are_balanced(string: &str) -> bool {
let mut stack = Vec::new();
for c in string.chars() {
match c {
'(' | '[' | '{' => stack.push(c),
')' => {
if stack.pop() != Some('(') {
return false;
}
}
']' => {
if stack.pop() != Some('[') {
return false;
}
}
'}' => {
if stack.pop() != Some('{') {
return false;
}
}
_ => (), // 忽略其他字符
}
}
stack.is_empty()
}
2. 优化实现
rust
pub fn brackets_are_balanced(string: &str) -> bool {
let mut stack = Vec::new();
for c in string.chars() {
match c {
'(' | '[' | '{' => stack.push(c),
')' | ']' | '}' => {
let expected = match c {
')' => '(',
']' => '[',
'}' => '{',
_ => unreachable!(),
};
if stack.pop() != Some(expected) {
return false;
}
}
_ => (), // 忽略其他字符
}
}
stack.is_empty()
}
3. 使用HashMap的实现
rust
use std::collections::HashMap;
pub fn brackets_are_balanced(string: &str) -> bool {
let mut stack = Vec::new();
let mut pairs = HashMap::new();
pairs.insert(')', '(');
pairs.insert(']', '[');
pairs.insert('}', '{');
for c in string.chars() {
match c {
'(' | '[' | '{' => stack.push(c),
')' | ']' | '}' => {
if stack.pop() != Some(*pairs.get(&c).unwrap()) {
return false;
}
}
_ => (), // 忽略其他字符
}
}
stack.is_empty()
}
测试用例分析
通过查看测试用例,我们可以更好地理解需求:
rust
#[test]
fn paired_square_brackets() {
assert!(brackets_are_balanced("[]"));
}
成对的方括号是平衡的。
rust
#[test]
fn empty_string() {
assert!(brackets_are_balanced(""));
}
空字符串是平衡的。
rust
#[test]
fn unpaired_brackets() {
assert!(!brackets_are_balanced("[["));
}
未成对的括号是不平衡的。
rust
#[test]
fn wrong_ordered_brackets() {
assert!(!brackets_are_balanced("}{"));
}
顺序错误的括号是不平衡的。
rust
#[test]
fn paired_with_whitespace() {
assert!(brackets_are_balanced("{ }"));
}
包含空白字符的成对括号是平衡的。
rust
#[test]
fn simple_nested_brackets() {
assert!(brackets_are_balanced("{[]}"));
}
简单的嵌套括号是平衡的。
rust
#[test]
fn paired_and_nested_brackets() {
assert!(brackets_are_balanced("([{}({}[])])"));
}
成对且嵌套的括号是平衡的。
rust
#[test]
fn unopened_closing_brackets() {
assert!(!brackets_are_balanced("{[)][]}"));
}
未正确开启的闭括号是不平衡的。
rust
#[test]
fn math_expression() {
assert!(brackets_are_balanced("(((185 + 223.85) * 15) - 543)/2"));
}
数学表达式中的括号是平衡的。
性能优化版本
考虑性能的优化实现:
rust
pub fn brackets_are_balanced(string: &str) -> bool {
let mut stack = Vec::with_capacity(string.len() / 2); // 预分配容量
for c in string.chars() {
match c {
'(' | '[' | '{' => stack.push(c),
')' => {
if stack.pop() != Some('(') {
return false;
}
}
']' => {
if stack.pop() != Some('[') {
return false;
}
}
'}' => {
if stack.pop() != Some('{') {
return false;
}
}
_ => (), // 忽略其他字符
}
}
stack.is_empty()
}
// 使用字节数组的高性能版本
pub fn brackets_are_balanced_bytes(string: &str) -> bool {
let mut stack = Vec::with_capacity(string.len() / 2);
let bytes = string.as_bytes();
for &byte in bytes {
match byte {
b'(' | b'[' | b'{' => stack.push(byte),
b')' => {
if stack.pop() != Some(b'(') {
return false;
}
}
b']' => {
if stack.pop() != Some(b'[') {
return false;
}
}
b'}' => {
if stack.pop() != Some(b'{') {
return false;
}
}
_ => (), // 忽略其他字符
}
}
stack.is_empty()
}
// 提前退出优化版本
pub fn brackets_are_balanced_optimized(string: &str) -> bool {
let mut stack = Vec::with_capacity(string.len() / 2);
// 统计开括号和闭括号数量,提前发现明显不平衡的情况
let mut open_count = 0;
let mut close_count = 0;
for c in string.chars() {
match c {
'(' | '[' | '{' => {
open_count += 1;
stack.push(c);
}
')' | ']' | '}' => {
close_count += 1;
if close_count > open_count {
return false; // 闭括号多于开括号
}
let expected = match c {
')' => '(',
']' => '[',
'}' => '{',
_ => unreachable!(),
};
if stack.pop() != Some(expected) {
return false;
}
}
_ => (), // 忽略其他字符
}
}
open_count == close_count && stack.is_empty()
}
错误处理和边界情况
考虑更多边界情况的实现:
rust
#[derive(Debug, PartialEq)]
pub enum BracketError {
UnmatchedClosingBracket,
UnmatchedOpeningBracket,
MismatchedBracket,
}
pub fn check_brackets_detailed(string: &str) -> Result<bool, BracketError> {
let mut stack = Vec::new();
let mut open_count = 0;
let mut close_count = 0;
for c in string.chars() {
match c {
'(' | '[' | '{' => {
open_count += 1;
stack.push(c);
}
')' | ']' | '}' => {
close_count += 1;
if close_count > open_count {
return Err(BracketError::UnmatchedClosingBracket);
}
let expected = match c {
')' => '(',
']' => '[',
'}' => '{',
_ => unreachable!(),
};
if stack.pop() != Some(expected) {
return Err(BracketError::MismatchedBracket);
}
}
_ => (), // 忽略其他字符
}
}
if !stack.is_empty() {
Err(BracketError::UnmatchedOpeningBracket)
} else {
Ok(true)
}
}
pub fn brackets_are_balanced(string: &str) -> bool {
check_brackets_detailed(string).unwrap_or(false)
}
// 支持自定义括号类型的版本
pub fn brackets_are_balanced_custom(string: &str, pairs: &[(&char, &char)]) -> bool {
let mut stack = Vec::new();
let opening_brackets: Vec<char> = pairs.iter().map(|(open, _)| **open).collect();
let closing_to_opening: std::collections::HashMap<char, char> =
pairs.iter().map(|(open, close)| (**close, **open)).collect();
for c in string.chars() {
if opening_brackets.contains(&c) {
stack.push(c);
} else if closing_to_opening.contains_key(&c) {
let expected = *closing_to_opening.get(&c).unwrap();
if stack.pop() != Some(expected) {
return false;
}
}
}
stack.is_empty()
}
扩展功能
基于基础实现,我们可以添加更多功能:
rust
pub struct BracketChecker {
stack: Vec<char>,
}
impl BracketChecker {
pub fn new() -> Self {
BracketChecker {
stack: Vec::new(),
}
}
pub fn is_balanced(&self, string: &str) -> bool {
let mut checker = BracketChecker::new();
checker.check(string).is_ok()
}
pub fn check(&mut self, string: &str) -> Result<bool, BracketError> {
self.stack.clear();
for c in string.chars() {
match c {
'(' | '[' | '{' => self.stack.push(c),
')' => {
if self.stack.pop() != Some('(') {
return Err(BracketError::UnmatchedClosingBracket);
}
}
']' => {
if self.stack.pop() != Some('[') {
return Err(BracketError::UnmatchedClosingBracket);
}
}
'}' => {
if self.stack.pop() != Some('{') {
return Err(BracketError::UnmatchedClosingBracket);
}
}
_ => (), // 忽略其他字符
}
}
if self.stack.is_empty() {
Ok(true)
} else {
Err(BracketError::UnmatchedOpeningBracket)
}
}
// 获取不匹配括号的位置信息
pub fn find_mismatch_positions(&self, string: &str) -> Vec<usize> {
let mut stack = Vec::new();
let mut mismatch_positions = Vec::new();
for (i, c) in string.chars().enumerate() {
match c {
'(' | '[' | '{' => stack.push((c, i)),
')' | ']' | '}' => {
let expected = match c {
')' => '(',
']' => '[',
'}' => '{',
_ => unreachable!(),
};
if let Some((last_char, _)) = stack.pop() {
if last_char != expected {
mismatch_positions.push(i);
}
} else {
mismatch_positions.push(i); // 多余的闭括号
}
}
_ => (),
}
}
// 剩余未匹配的开括号位置
for (_, pos) in stack {
mismatch_positions.push(pos);
}
mismatch_positions.sort();
mismatch_positions
}
// 获取嵌套深度信息
pub fn get_nesting_depth(&self, string: &str) -> usize {
let mut max_depth = 0;
let mut current_depth = 0;
for c in string.chars() {
match c {
'(' | '[' | '{' => {
current_depth += 1;
max_depth = max_depth.max(current_depth);
}
')' | ']' | '}' => {
if current_depth > 0 {
current_depth -= 1;
}
}
_ => (),
}
}
max_depth
}
}
#[derive(Debug, PartialEq)]
pub enum BracketError {
UnmatchedClosingBracket,
UnmatchedOpeningBracket,
MismatchedBracket,
}
// 便利函数
pub fn brackets_are_balanced(string: &str) -> bool {
BracketChecker::new().is_balanced(string)
}
实际应用场景
括号匹配在实际开发中有以下应用:
- 编译器和解释器:检查代码中的语法正确性
- 文本编辑器:实现括号高亮和自动补全功能
- IDE开发:提供语法检查和错误提示
- 表达式解析:验证数学和逻辑表达式的正确性
- 配置文件解析:检查配置文件中的结构正确性
- 模板引擎:验证模板语法的正确性
- HTML/XML解析:检查标签的正确嵌套
- JSON解析:验证JSON格式的正确性
算法复杂度分析
-
时间复杂度:O(n)
- 需要遍历字符串中的每个字符,其中n是字符串长度
-
空间复杂度:O(n)
- 在最坏情况下(所有字符都是开括号),需要存储n个字符
与其他实现方式的比较
rust
// 使用递归的实现
pub fn brackets_are_balanced_recursive(string: &str) -> bool {
fn check_recursive(chars: &[char], index: usize, stack: &mut Vec<char>) -> bool {
if index >= chars.len() {
return stack.is_empty();
}
let c = chars[index];
match c {
'(' | '[' | '{' => {
stack.push(c);
check_recursive(chars, index + 1, stack)
}
')' | ']' | '}' => {
let expected = match c {
')' => '(',
']' => '[',
'}' => '{',
_ => unreachable!(),
};
if stack.pop() == Some(expected) {
check_recursive(chars, index + 1, stack)
} else {
false
}
}
_ => check_recursive(chars, index + 1, stack),
}
}
let chars: Vec<char> = string.chars().collect();
let mut stack = Vec::new();
check_recursive(&chars, 0, &mut stack)
}
// 使用状态机的实现
#[derive(Debug, Clone, Copy)]
enum State {
Balanced,
Unbalanced,
}
pub fn brackets_are_balanced_state_machine(string: &str) -> bool {
let mut state = State::Balanced;
let mut stack = Vec::new();
for c in string.chars() {
match (state, c) {
(State::Balanced, '(' | '[' | '{') => {
stack.push(c);
}
(State::Balanced, ')' | ']' | '}') => {
let expected = match c {
')' => '(',
']' => '[',
'}' => '{',
_ => unreachable!(),
};
if stack.pop() == Some(expected) {
state = State::Balanced;
} else {
state = State::Unbalanced;
}
}
(State::Unbalanced, _) => {
// 一旦不平衡,保持不平衡状态
break;
}
_ => (), // 忽略其他字符
}
}
matches!(state, State::Balanced) && stack.is_empty()
}
// 使用迭代器链的函数式实现
pub fn brackets_are_balanced_functional(string: &str) -> bool {
string
.chars()
.fold((Vec::new(), true), |(mut stack, is_balanced), c| {
if !is_balanced {
return (stack, false);
}
match c {
'(' | '[' | '{' => {
stack.push(c);
(stack, true)
}
')' => {
if stack.pop() == Some('(') {
(stack, true)
} else {
(stack, false)
}
}
']' => {
if stack.pop() == Some('[') {
(stack, true)
} else {
(stack, false)
}
}
'}' => {
if stack.pop() == Some('{') {
(stack, true)
} else {
(stack, false)
}
}
_ => (stack, true),
}
})
.1 && string.chars().fold(Vec::new(), |mut stack, c| {
match c {
'(' | '[' | '{' => stack.push(c),
')' | ']' | '}' => { stack.pop(); }
_ => (),
}
stack
}).is_empty()
}
总结
通过 matching-brackets 练习,我们学到了:
- 栈数据结构:掌握了栈的基本操作和应用
- 字符处理:学会了处理字符串中的字符
- 算法设计:理解了括号匹配算法的设计思路
- 性能优化:了解了不同实现方式的性能特点
- 边界情况处理:学会了处理各种输入边界情况
- 错误处理:深入理解了Result类型处理错误情况
这些技能在实际开发中非常有用,特别是在编译器开发、文本处理、表达式解析等场景中。括号匹配虽然是一个经典的数据结构问题,但它涉及到了栈操作、字符处理、算法设计等许多核心概念,是学习Rust实用编程的良好起点。
通过这个练习,我们也看到了Rust在数据结构实现和算法设计方面的强大能力,以及如何用安全且高效的方式实现经典算法。这种结合了安全性和性能的语言特性正是Rust的魅力所在。