什么是NLP-自然语言处理
什么是NLP
NPL是面向算法小白用户的行业自适应标注、训练和服务平台。该产品支持文本实体抽取、文本分类、关键短语抽取、情感分析、关系抽取、短文本匹配、商品评价解析等 NLP 定制化算法能力,用户无需拥有丰富的算法背景,仅需标注或上传适量文档数据,即可通过平台获得优质的 NLP 算法模型。
简单来说就是即使你是一个算法小白,你也可以拥有你自己的算法模型。下面开始上手实践吧
开通NLP
NLP官网地址:https://ai.aliyun.com/nlp 点击打开官网,点击【免费使用】
跳转到自然语言处理NLP,
这里我们不知道接下来我们要用到的是基础版、高级版还是行业应用版,因此这里我们先不开通,直接进入创建项目操作,等后续用到的时候再回过头来开通相应的服务。
新建项目
点击左侧菜单【创建项目】跳转到相应的服务开通页面
勾选NLP自学习平台服务协议,点击【立即开通】,开通成功。再次点击【创建项目】
这里我选择【关键短语抽取】点击【创建】,在弹出页面输入项目名称及项目描述点击【确认】
创建模型
点击【进入项目】
可以看到【创建模型】页面
点击【创建模型】
输入模型名称,根据专业词表要求结构填入专业词,点击本地上传后点击【提交】
静静等待模型训练,这里需要说明一下哈,模型训练完成之后当前页面是不会自动刷新的哦,因此你根据预计时间决定,时间差不多够的时候就自行F5刷新页面即可看到模型训练成功页面
模型训练成功之后我们来测试一下模型训练的成果吧,点击【测试】,输入一段话语,其中包含刚才训练模型的短语
然后点击【测试】看一下关键短语抽取的效果
这里可以看到我在文本内容中包含了刚才模型训练的"东奥""初级"两个短语,但是在测试过程中并没有将这两个短语抽取出来,这是因为什么呢?是因为模型只训练了1次,应该训练度不够?
考虑到自学习模型训练效果不是很好,这里我来体验一下官方已经训练好的预训练模型
这里我选择【招标中标信息抽取-基础版服务】来测试一下官方预训练模型的效果
这里可以看到整体信息抽取的效果还是很可以的,主要信息已经抽取出来了。