技术栈
语料库
喵手
13 天前
爬虫
·
python
·
爬虫实战
·
语料库
·
零基础python爬虫教学
·
基于关键词矩阵模拟
·
语义打捞
Python爬虫实战:深度索引 - 基于关键词矩阵模拟与语义打捞的语料库构建实战!
㊗️本期内容已收录至专栏《Python爬虫实战》,持续完善知识体系与项目实战,建议先订阅收藏,后续查阅更方便~ ㊙️本期爬虫难度指数:⭐⭐⭐ 🉐福利: 一次订阅后,专栏内的所有文章可永久免费看,持续更新中,保底1000+(篇)硬核实战内容。
2401_84149564
2 个月前
人工智能
·
自然语言处理
·
语料库
·
标注
·
汉语语料库
·
中文信息处理
·
语料
【自然语言处理】汉语语料库建设的深层困境与现实挑战
目录一、引言二、语料获取:源头壁垒与结构失衡的双重梗阻(一)历史积淀薄弱与数字化程度偏低的先天短板(二)资源分布分散与数据壁垒的现实障碍
月光技术杂谈
1 年前
chatgpt
·
语料库
·
训练数据
·
ai模型
·
数据分类
·
deepseek
·
训练样本
关于DeepSeek与ChatGPT等模型的原始训练数据
DeepSeek与ChatGPT等模型的原始训练数据是否一样网页文本示例社交媒体对话示例合成数据案例污染数据实例
庞德公
2 年前
深度学习
·
自然语言处理
·
bert
·
语料库
·
自动化标注
基于BERT的医学影像报告语料库构建
大模型时代,任何行业,任何企业的数据治理未来将会以“语料库”的自动化构建为基石。因此这一系列精选的论文还是围绕在语料库的建设以及自动化的构建。
阿波拉
3 年前
笔记
·
学习
·
自然语言处理
·
nlp
·
hanlp
·
语料库
·
brat
自然语言处理学习笔记(二)————语料库与开源工具
目录1.语料库2.语料库建设(1)规范制定(2)人员培训(3)人工标注
我是有底线的