深入讲解 C# 中 string 如何支持 CultureInfo

1️⃣ 基础概念:string 与 CultureInfo

  • string不可变的 Unicode 字符序列(UTF-16)。

  • string 本身不包含文化信息,只是字符集合。

  • CultureInfo 是 .NET 中表示"文化/地区/语言环境"的类,例如:

    csharp 复制代码
    var enUS = new CultureInfo("en-US"); // 美国英语
    var trTR = new CultureInfo("tr-TR"); // 土耳其语
  • 支持文化的意义:在不同语言环境下,字符串的 排序、比较、大小写转换 规则可能不同。


2️⃣ 文化敏感操作 API

C# 提供了多种 可传入 CultureInfo 的字符串操作

2.1 字符串比较

csharp 复制代码
int string.Compare(string strA, string strB, bool ignoreCase, CultureInfo culture)
  • ignoreCase → 是否忽略大小写

  • culture → 使用哪种文化规则

  • 返回:

    • <0 → strA 排在 strB 前
    • 0 → 相等
    • >0 → strA 排在 strB 后

例子:土耳其语的 I 与 i

csharp 复制代码
string a = "i";
string b = "I";

CultureInfo en = new CultureInfo("en-US");
CultureInfo tr = new CultureInfo("tr-TR");

Console.WriteLine(string.Compare(a, b, false, en)); // -1
Console.WriteLine(string.Compare(a, b, false, tr)); // -1
Console.WriteLine(string.Compare(a, b, true, tr));  // 0

土耳其文化中,"i"的大写是 "İ",而英语是 "I"。CultureInfo 确保比较符合当地规则。


2.2 排序(Sort)

  • Array.Sort 或 LINQ 排序可以用 StringComparer
  • StringComparer 内部依赖 CultureInfo.CompareInfo 进行排序:
csharp 复制代码
string[] arr = { "i", "I" };
Array.Sort(arr, StringComparer.CurrentCulture); // 按当前文化排序
  • 对比:

    • Ordinal → 按 Unicode 二进制值排序(不受文化影响)
    • CurrentCulture → 按系统文化排序
    • InvariantCulture → 固定不变文化排序(跨系统一致)

2.3 大小写转换

csharp 复制代码
string s = "i";
Console.WriteLine(s.ToUpper(new CultureInfo("en-US"))); // I
Console.WriteLine(s.ToUpper(new CultureInfo("tr-TR"))); // İ
  • 默认 ToUpper() 使用 CultureInfo.CurrentCulture
  • 指定 CultureInfo 可得到文化敏感的大写/小写映射

3️⃣ CompareInfo:底层实现

  • CultureInfo.CompareInfo 提供了字符串比较的核心:

    csharp 复制代码
    CultureInfo ci = new CultureInfo("tr-TR");
    CompareInfo cmp = ci.CompareInfo;
    int result = cmp.Compare("i", "I", CompareOptions.IgnoreCase);
  • CompareInfo 负责:

    1. 大小写映射(case mapping)
    2. 排序权重(collation)
    3. 文化特定规则(例如土耳其语、德语 ß、法语重音等)

4️⃣ 哈希值与 CultureInfo

  • StringComparer 可以用来计算哈希:

    csharp 复制代码
    StringComparer.CurrentCulture.GetHashCode("abc")
  • Ordinal 系列 → 哈希基于字符 Unicode 值(跨文化稳定)

  • CurrentCulture → 哈希受文化规则影响(不同文化可能不同)

⚠️ 因此,如果需要跨文化稳定哈希,最好用 Ordinal


5️⃣ 案例:土耳其语 vs 英语

csharp 复制代码
string s1 = "i";
string s2 = "I";

CultureInfo en = new CultureInfo("en-US");
CultureInfo tr = new CultureInfo("tr-TR");

Console.WriteLine(s1.ToUpper(en)); // I
Console.WriteLine(s1.ToUpper(tr)); // İ

Console.WriteLine(string.Compare(s1, s2, true, en)); // 0
Console.WriteLine(string.Compare(s1, s2, true, tr)); // 0
  • 英语和土耳其语的大写规则不同
  • Compare、ToUpper、排序都会根据 CultureInfo 自动应用不同规则

6️⃣ 总结

  1. string 本身不带文化信息,只是 Unicode 字符序列。

  2. CultureInfo 影响

    • 排序:CompareInfo.Compare / StringComparer.CurrentCulture
    • 比较:string.Compare(strA, strB, culture) / CompareInfo
    • 大小写转换:ToUpper(CultureInfo) / ToLower(CultureInfo)
    • 哈希:StringComparer.CurrentCulture.GetHashCode(s)
  3. Ordinal 系列操作不受文化影响,适合跨系统、跨文化的存储或比较。

  4. InvariantCulture 提供跨文化一致规则。

  5. 底层依赖 CompareInfo(ICU 或 Windows NLS)实现文化敏感逻辑。

相关推荐
FQNmxDG4S1 小时前
Java多线程编程:Thread与Runnable的并发控制
java·开发语言
前端老石人2 小时前
HTML 字符引用完全指南
开发语言·前端·html
matlab_xiaowang2 小时前
Redux 入门:JavaScript 可预测状态管理库
开发语言·javascript·其他·ecmascript
虹科网络安全2 小时前
艾体宝干货|数据复制详解:类型、原理与适用场景
java·开发语言·数据库
axng pmje3 小时前
Java语法进阶
java·开发语言·jvm
老前端的功夫3 小时前
【Java从入门到入土】28:Stream API:告别for循环的新时代
java·开发语言·python
qq_435287923 小时前
第9章 夸父逐日与后羿射日:死循环与进程终止?十个太阳同时值班的并行冲突
java·开发语言·git·死循环·进程终止·并行冲突·夸父逐日
止语Lab3 小时前
从手动到框架:Go DI 演进的三个拐点
开发语言·后端·golang
yaoxin5211233 小时前
397. Java 文件操作基础 - 创建常规文件与临时文件
java·开发语言·python
小短腿的代码世界3 小时前
Qt日志系统深度解析:从qDebug到企业级日志框架
开发语言·qt