技术栈
中文信息处理
2401_84149564
24 天前
人工智能
·
自然语言处理
·
中文信息处理
·
西文字符编码的奠基
·
中文编码的演进
·
字符编码的实践价值
·
字频统计的作用与方法
【自然语言处理】字符编码与字频统计:中文信息处理的底层逻辑与实践维度
目录一、引言二、从混乱到统一:西文字符编码的奠基三、中文编码的演进:从国标到全球统一(一)国标码(GB2312):中文编码的第一次统一
2401_84149564
1 个月前
人工智能
·
自然语言处理
·
语料库
·
标注
·
汉语语料库
·
中文信息处理
·
语料
【自然语言处理】汉语语料库建设的深层困境与现实挑战
目录一、引言二、语料获取:源头壁垒与结构失衡的双重梗阻(一)历史积淀薄弱与数字化程度偏低的先天短板(二)资源分布分散与数据壁垒的现实障碍
我是有底线的