C#实现HiveQL建表语句中特殊数据类型的包裹

用C#实现搜索字符串中用'('和')'包裹的最外层的里面里面的字符串,将里面的记录按一个或多个空格、换行或tab,或者是它的在一起的组合作为分隔,分隔出多个字符串组,如果组中有字符串中同时包含'<'和'>',则在原始的字符串中该字符串的位置的前后插入字符`,最后返回修改过后的字符串,优化这个字符串处理算法,并给出所有的测试用例。

以下是C#代码,包括优化后的算法和测试用例:

csharp 复制代码
using System;
using System.Collections.Generic;
using System.Text;

public class StringProcessor
{
    public string ProcessString(string input)
    {
        var outerPairs = FindOuterParenthesesPairs(input);
        List<int> insertPositions = new List<int>();

        foreach (var (start, end) in outerPairs)
        {
            if (start > end)
                continue;

            string substr = input.Substring(start, end - start + 1);
            var groups = SplitIntoGroups(substr);

            foreach (var group in groups)
            {
                int groupStartInSubstr = group.Start;
                int groupEndInSubstr = group.End;

                bool hasLT = false;
                bool hasGT = false;
                for (int i = groupStartInSubstr; i <= groupEndInSubstr; i++)
                {
                    char c = substr[i];
                    if (c == '<') hasLT = true;
                    else if (c == '>') hasGT = true;
                    if (hasLT && hasGT) break;
                }

                if (hasLT && hasGT)
                {
                    int originalStart = start + groupStartInSubstr;
                    int originalEnd = start + groupEndInSubstr;
                    insertPositions.Add(originalStart);
                    insertPositions.Add(originalEnd + 1);
                }
            }
        }

        insertPositions.Sort((a, b) => b.CompareTo(a));
        StringBuilder sb = new StringBuilder(input);
        foreach (int pos in insertPositions)
        {
            sb.Insert(pos, '`');
        }
        return sb.ToString();
    }

    private List<(int Start, int End)> FindOuterParenthesesPairs(string input)
    {
        List<(int, int)> pairs = new List<(int, int)>();
        int depth = 0;
        int currentStart = -1;

        for (int i = 0; i < input.Length; i++)
        {
            char c = input[i];
            if (c == '(')
            {
                depth++;
                if (depth == 1)
                {
                    currentStart = i + 1;
                }
            }
            else if (c == ')')
            {
                depth--;
                if (depth == 0 && currentStart != -1)
                {
                    int currentEnd = i - 1;
                    if (currentStart <= currentEnd)
                    {
                        pairs.Add((currentStart, currentEnd));
                    }
                    currentStart = -1;
                }
            }
        }
        return pairs;
    }

    private List<(int Start, int End)> SplitIntoGroups(string substr)
    {
        List<(int, int)> groups = new List<(int, int)>();
        int currentGroupStart = -1;

        for (int i = 0; i < substr.Length; i++)
        {
            if (IsWhitespace(substr[i]))
            {
                if (currentGroupStart != -1)
                {
                    groups.Add((currentGroupStart, i - 1));
                    currentGroupStart = -1;
                }
            }
            else
            {
                if (currentGroupStart == -1)
                {
                    currentGroupStart = i;
                }
            }
        }

        if (currentGroupStart != -1)
        {
            groups.Add((currentGroupStart, substr.Length - 1));
        }

        return groups;
    }

    private bool IsWhitespace(char c)
    {
        return c == ' ' || c == '\t' || c == '\n' || c == '\r';
    }
}

public class Program
{
    public static void Main()
    {
        var processor = new StringProcessor();
        RunTestCases(processor);
    }

    private static void RunTestCases(StringProcessor processor)
    {
        // 测试用例
        TestCase(processor, "", ""); // 空字符串
        TestCase(processor, "hello world", "hello world"); // 无括号
        TestCase(processor, "()", "()"); // 空括号
        TestCase(processor, "(a b c)", "(a b c)"); // 无<和>
        TestCase(processor, "(a <b> c)", "(a `<b>` c)"); // 单个<和>
        TestCase(processor, "(a <b) c)", "(a <b) c)"); // 不匹配的<和)
        TestCase(processor, "((a <b>))", "((a `<b>`))"); // 嵌套括号
        TestCase(processor, "(a\t<b>\n)", "(a\t`<b>`\n)"); // 混合空白符
        TestCase(processor, "( <a> <b> )", "( `<a>` `<b>` )"); // 多个组
        TestCase(processor, "start(middle<test> end)finish", "start(middle `<test>` end)finish"); // 混合内容
        TestCase(processor, "(a<b<c>>d)", "(a`<b<c>>`d)"); // 复杂嵌套<>
    }

    private static void TestCase(StringProcessor processor, string input, string expected)
    {
        string result = processor.ProcessString(input);
        Console.WriteLine($"Input:    {input}");
        Console.WriteLine($"Expected: {expected}");
        Console.WriteLine($"Result:   {result}");
        Console.WriteLine($"Test {(result == expected ? "Passed" : "Failed")}\n");
    }
}

测试用例说明:

  1. 空字符串:输入为空,输出保持不变。
  2. 无括号:输入中没有括号,直接返回原字符串。
  3. 空括号:括号内无内容,不做处理。
  4. 无<和>的组:括号内的组不包含<和>,不插入反引号。
  5. 单个符合条件的组:组包含<和>,插入反引号。
  6. 不匹配的符号:组内只有<,不插入。
  7. 嵌套括号:仅处理最外层括号内的内容。
  8. 混合空白符:正确处理制表符和换行符。
  9. 多个组:每个符合条件的组独立处理。
  10. 混合内容:括号内外混合内容处理。
  11. 复杂嵌套符号:组内包含多个<和>符号。
相关推荐
云天徽上1 小时前
【数据可视化-96】使用 Pyecharts 绘制主题河流图(ThemeRiver):步骤与数据组织形式
开发语言·python·信息可视化·数据分析·pyecharts
没有梦想的咸鱼185-1037-16631 小时前
SWMM排水管网水力、水质建模及在海绵与水环境中的应用
数据仓库·人工智能·数据挖掘·数据分析
quaer2 小时前
print(2 ** 3)
开发语言·python
Tipriest_3 小时前
C++ csignal库详细使用介绍
开发语言·c++·csignal·信号与异常
kyle~3 小时前
C++---多态(一个接口多种实现)
java·开发语言·c++
芜青4 小时前
JavaScript手录18-ajax:异步请求与项目上线部署
开发语言·javascript·ajax
一个会的不多的人4 小时前
C# NX二次开发:面收集器控件和曲线收集器控件详解
开发语言·c#
Freak嵌入式4 小时前
一文速通 Python 并行计算:教程总结
开发语言·python
2401_837088504 小时前
setup 语法糖核心要点
开发语言·前端·javascript
创可贴治愈心灵5 小时前
WPF中UI线程频繁操作造成卡顿的处理
ui·c#·wpf