无论是如今爆火的LLMs(Large Language Models)技术,还是传统的NLP技术,分词环节都是至关重要的一步。为了更好地了解中文自然语言处理的关键环节,今天我想和大家分享分词技术---基于词图的机械分词法。
本文主要围绕中文分词为主进行讲解,我会从分词定义及原因,分词的应用场景,分词的难点,什么是语言模型,马尔科夫假设,基于词图的分词方法这几个方面来书写这篇文章。
完整文章: 点击查看原文
无论是如今爆火的LLMs(Large Language Models)技术,还是传统的NLP技术,分词环节都是至关重要的一步。为了更好地了解中文自然语言处理的关键环节,今天我想和大家分享分词技术---基于词图的机械分词法。
本文主要围绕中文分词为主进行讲解,我会从分词定义及原因,分词的应用场景,分词的难点,什么是语言模型,马尔科夫假设,基于词图的分词方法这几个方面来书写这篇文章。
完整文章: 点击查看原文