深入讲解 C# 中 string 如何支持 CultureInfo

1️⃣ 基础概念:string 与 CultureInfo

  • string不可变的 Unicode 字符序列(UTF-16)。

  • string 本身不包含文化信息,只是字符集合。

  • CultureInfo 是 .NET 中表示"文化/地区/语言环境"的类,例如:

    csharp 复制代码
    var enUS = new CultureInfo("en-US"); // 美国英语
    var trTR = new CultureInfo("tr-TR"); // 土耳其语
  • 支持文化的意义:在不同语言环境下,字符串的 排序、比较、大小写转换 规则可能不同。


2️⃣ 文化敏感操作 API

C# 提供了多种 可传入 CultureInfo 的字符串操作

2.1 字符串比较

csharp 复制代码
int string.Compare(string strA, string strB, bool ignoreCase, CultureInfo culture)
  • ignoreCase → 是否忽略大小写

  • culture → 使用哪种文化规则

  • 返回:

    • <0 → strA 排在 strB 前
    • 0 → 相等
    • >0 → strA 排在 strB 后

例子:土耳其语的 I 与 i

csharp 复制代码
string a = "i";
string b = "I";

CultureInfo en = new CultureInfo("en-US");
CultureInfo tr = new CultureInfo("tr-TR");

Console.WriteLine(string.Compare(a, b, false, en)); // -1
Console.WriteLine(string.Compare(a, b, false, tr)); // -1
Console.WriteLine(string.Compare(a, b, true, tr));  // 0

土耳其文化中,"i"的大写是 "İ",而英语是 "I"。CultureInfo 确保比较符合当地规则。


2.2 排序(Sort)

  • Array.Sort 或 LINQ 排序可以用 StringComparer
  • StringComparer 内部依赖 CultureInfo.CompareInfo 进行排序:
csharp 复制代码
string[] arr = { "i", "I" };
Array.Sort(arr, StringComparer.CurrentCulture); // 按当前文化排序
  • 对比:

    • Ordinal → 按 Unicode 二进制值排序(不受文化影响)
    • CurrentCulture → 按系统文化排序
    • InvariantCulture → 固定不变文化排序(跨系统一致)

2.3 大小写转换

csharp 复制代码
string s = "i";
Console.WriteLine(s.ToUpper(new CultureInfo("en-US"))); // I
Console.WriteLine(s.ToUpper(new CultureInfo("tr-TR"))); // İ
  • 默认 ToUpper() 使用 CultureInfo.CurrentCulture
  • 指定 CultureInfo 可得到文化敏感的大写/小写映射

3️⃣ CompareInfo:底层实现

  • CultureInfo.CompareInfo 提供了字符串比较的核心:

    csharp 复制代码
    CultureInfo ci = new CultureInfo("tr-TR");
    CompareInfo cmp = ci.CompareInfo;
    int result = cmp.Compare("i", "I", CompareOptions.IgnoreCase);
  • CompareInfo 负责:

    1. 大小写映射(case mapping)
    2. 排序权重(collation)
    3. 文化特定规则(例如土耳其语、德语 ß、法语重音等)

4️⃣ 哈希值与 CultureInfo

  • StringComparer 可以用来计算哈希:

    csharp 复制代码
    StringComparer.CurrentCulture.GetHashCode("abc")
  • Ordinal 系列 → 哈希基于字符 Unicode 值(跨文化稳定)

  • CurrentCulture → 哈希受文化规则影响(不同文化可能不同)

⚠️ 因此,如果需要跨文化稳定哈希,最好用 Ordinal


5️⃣ 案例:土耳其语 vs 英语

csharp 复制代码
string s1 = "i";
string s2 = "I";

CultureInfo en = new CultureInfo("en-US");
CultureInfo tr = new CultureInfo("tr-TR");

Console.WriteLine(s1.ToUpper(en)); // I
Console.WriteLine(s1.ToUpper(tr)); // İ

Console.WriteLine(string.Compare(s1, s2, true, en)); // 0
Console.WriteLine(string.Compare(s1, s2, true, tr)); // 0
  • 英语和土耳其语的大写规则不同
  • Compare、ToUpper、排序都会根据 CultureInfo 自动应用不同规则

6️⃣ 总结

  1. string 本身不带文化信息,只是 Unicode 字符序列。

  2. CultureInfo 影响

    • 排序:CompareInfo.Compare / StringComparer.CurrentCulture
    • 比较:string.Compare(strA, strB, culture) / CompareInfo
    • 大小写转换:ToUpper(CultureInfo) / ToLower(CultureInfo)
    • 哈希:StringComparer.CurrentCulture.GetHashCode(s)
  3. Ordinal 系列操作不受文化影响,适合跨系统、跨文化的存储或比较。

  4. InvariantCulture 提供跨文化一致规则。

  5. 底层依赖 CompareInfo(ICU 或 Windows NLS)实现文化敏感逻辑。

相关推荐
王璐WL17 小时前
【C++】string类基础知识
开发语言·c++
PyAIGCMaster17 小时前
开发了一个全自动接入wordpress的saas发文章的网站,记录一下如何实现,有需要的朋友联系。
java·开发语言·数据库
m0_5281744517 小时前
ZLibrary反爬机制概述
开发语言·c++·算法
xiangpanf17 小时前
PHP vs Python:30字看透两大语言差异
开发语言·php
江沉晚呤时18 小时前
.NET 9 快速上手 RabbitMQ 直连交换机:高效消息传递实战指南
开发语言·分布式·后端·rabbitmq·.net·ruby
yunyun3212318 小时前
嵌入式C++驱动开发
开发语言·c++·算法
左左右右左右摇晃18 小时前
Java笔记 —— 值传递与“引用传递”
java·开发语言·笔记
chushiyunen18 小时前
python语法-继承、方法命名、单例等
开发语言·python
沐知全栈开发18 小时前
Chart.js 饼图详解
开发语言
iReachers18 小时前
恒盾C#混淆加密大师 1.4.5 最新2026版本发布 (附CSDN下载地址)
c#·c#混淆·c#加密·wpf加密·winform加密