深入讲解 C# 中 string 如何支持 CultureInfo

1️⃣ 基础概念:string 与 CultureInfo

  • string不可变的 Unicode 字符序列(UTF-16)。

  • string 本身不包含文化信息,只是字符集合。

  • CultureInfo 是 .NET 中表示"文化/地区/语言环境"的类,例如:

    csharp 复制代码
    var enUS = new CultureInfo("en-US"); // 美国英语
    var trTR = new CultureInfo("tr-TR"); // 土耳其语
  • 支持文化的意义:在不同语言环境下,字符串的 排序、比较、大小写转换 规则可能不同。


2️⃣ 文化敏感操作 API

C# 提供了多种 可传入 CultureInfo 的字符串操作

2.1 字符串比较

csharp 复制代码
int string.Compare(string strA, string strB, bool ignoreCase, CultureInfo culture)
  • ignoreCase → 是否忽略大小写

  • culture → 使用哪种文化规则

  • 返回:

    • <0 → strA 排在 strB 前
    • 0 → 相等
    • >0 → strA 排在 strB 后

例子:土耳其语的 I 与 i

csharp 复制代码
string a = "i";
string b = "I";

CultureInfo en = new CultureInfo("en-US");
CultureInfo tr = new CultureInfo("tr-TR");

Console.WriteLine(string.Compare(a, b, false, en)); // -1
Console.WriteLine(string.Compare(a, b, false, tr)); // -1
Console.WriteLine(string.Compare(a, b, true, tr));  // 0

土耳其文化中,"i"的大写是 "İ",而英语是 "I"。CultureInfo 确保比较符合当地规则。


2.2 排序(Sort)

  • Array.Sort 或 LINQ 排序可以用 StringComparer
  • StringComparer 内部依赖 CultureInfo.CompareInfo 进行排序:
csharp 复制代码
string[] arr = { "i", "I" };
Array.Sort(arr, StringComparer.CurrentCulture); // 按当前文化排序
  • 对比:

    • Ordinal → 按 Unicode 二进制值排序(不受文化影响)
    • CurrentCulture → 按系统文化排序
    • InvariantCulture → 固定不变文化排序(跨系统一致)

2.3 大小写转换

csharp 复制代码
string s = "i";
Console.WriteLine(s.ToUpper(new CultureInfo("en-US"))); // I
Console.WriteLine(s.ToUpper(new CultureInfo("tr-TR"))); // İ
  • 默认 ToUpper() 使用 CultureInfo.CurrentCulture
  • 指定 CultureInfo 可得到文化敏感的大写/小写映射

3️⃣ CompareInfo:底层实现

  • CultureInfo.CompareInfo 提供了字符串比较的核心:

    csharp 复制代码
    CultureInfo ci = new CultureInfo("tr-TR");
    CompareInfo cmp = ci.CompareInfo;
    int result = cmp.Compare("i", "I", CompareOptions.IgnoreCase);
  • CompareInfo 负责:

    1. 大小写映射(case mapping)
    2. 排序权重(collation)
    3. 文化特定规则(例如土耳其语、德语 ß、法语重音等)

4️⃣ 哈希值与 CultureInfo

  • StringComparer 可以用来计算哈希:

    csharp 复制代码
    StringComparer.CurrentCulture.GetHashCode("abc")
  • Ordinal 系列 → 哈希基于字符 Unicode 值(跨文化稳定)

  • CurrentCulture → 哈希受文化规则影响(不同文化可能不同)

⚠️ 因此,如果需要跨文化稳定哈希,最好用 Ordinal


5️⃣ 案例:土耳其语 vs 英语

csharp 复制代码
string s1 = "i";
string s2 = "I";

CultureInfo en = new CultureInfo("en-US");
CultureInfo tr = new CultureInfo("tr-TR");

Console.WriteLine(s1.ToUpper(en)); // I
Console.WriteLine(s1.ToUpper(tr)); // İ

Console.WriteLine(string.Compare(s1, s2, true, en)); // 0
Console.WriteLine(string.Compare(s1, s2, true, tr)); // 0
  • 英语和土耳其语的大写规则不同
  • Compare、ToUpper、排序都会根据 CultureInfo 自动应用不同规则

6️⃣ 总结

  1. string 本身不带文化信息,只是 Unicode 字符序列。

  2. CultureInfo 影响

    • 排序:CompareInfo.Compare / StringComparer.CurrentCulture
    • 比较:string.Compare(strA, strB, culture) / CompareInfo
    • 大小写转换:ToUpper(CultureInfo) / ToLower(CultureInfo)
    • 哈希:StringComparer.CurrentCulture.GetHashCode(s)
  3. Ordinal 系列操作不受文化影响,适合跨系统、跨文化的存储或比较。

  4. InvariantCulture 提供跨文化一致规则。

  5. 底层依赖 CompareInfo(ICU 或 Windows NLS)实现文化敏感逻辑。

相关推荐
yaoxin5211232 小时前
291. Java Stream API - 从正则表达式创建 Stream
java·开发语言
BHXDML2 小时前
Java 设计模式详解
java·开发语言·设计模式
CCPC不拿奖不改名2 小时前
数据处理与分析:pandas基础+面试习题
开发语言·数据结构·python·面试·职场和发展·pandas
余瑜鱼鱼鱼2 小时前
Java数据结构:从入门到精通(十三)
java·开发语言
wzfj123452 小时前
FreeRTOS xTaskCreateStatic 详解
开发语言·c#
运维行者_2 小时前
远程办公场景 NFA:从网络嗅探与局域网流量监控软件排查团队网络卡顿问题
运维·服务器·开发语言·网络·自动化·php
txinyu的博客2 小时前
C++ 智能指针 (shared_ptr/weak_ptr) 全解析
开发语言·c++
没有bug.的程序员2 小时前
Java内存模型(JMM)深度解析:从 volatile 到 happens-before 的底层机制
java·开发语言·并发编程·volatile·内存模型·jmm·happens-before
寻星探路2 小时前
【算法进阶】滑动窗口与前缀和:从“和为 K”到“最小覆盖子串”的极限挑战
java·开发语言·c++·人工智能·python·算法·ai