技术栈

语料库

2401_84149564
9 天前
人工智能·自然语言处理·语料库·标注·汉语语料库·中文信息处理·语料
【自然语言处理】汉语语料库建设的深层困境与现实挑战目录一、引言二、语料获取:源头壁垒与结构失衡的双重梗阻(一)历史积淀薄弱与数字化程度偏低的先天短板(二)资源分布分散与数据壁垒的现实障碍
月光技术杂谈
10 个月前
chatgpt·语料库·训练数据·ai模型·数据分类·deepseek·训练样本
关于DeepSeek与ChatGPT等模型的原始训练数据DeepSeek与ChatGPT等模型的原始训练数据是否一样网页文本示例社交媒体对话示例合成数据案例污染数据实例
庞德公
2 年前
深度学习·自然语言处理·bert·语料库·自动化标注
基于BERT的医学影像报告语料库构建大模型时代,任何行业,任何企业的数据治理未来将会以“语料库”的自动化构建为基石。因此这一系列精选的论文还是围绕在语料库的建设以及自动化的构建。
阿波拉
2 年前
笔记·学习·自然语言处理·nlp·hanlp·语料库·brat
自然语言处理学习笔记(二)————语料库与开源工具目录1.语料库2.语料库建设(1)规范制定(2)人员培训(3)人工标注
我是有底线的