中文分词

深念Y1 天前
大数据·数据库·elasticsearch·中文分词·jenkins·ki分词器
Elasticsearch 8.11 + IK 分词器安装踩坑记录最近在做视频搜索功能,需要在 Windows 环境下搭建 Elasticsearch 环境。本以为是个简单的任务,结果踩了一堆坑,记录一下供后人参考。
LEAKSENSE4 天前
中文分词
机房漏水监测系统白皮书:技术革新×应用实践·未来蓝图《数字化转型背景下机房漏水监测系统白皮书》执行摘要 机房作为数字经济时代的核心基础设施,其安全稳定运行直接关系到数据资产与业务连续性。液漏风险是威胁机房物理安全的首要隐患,一次微小的渗漏即可引发服务器短路、数据丢失及业务中断,造成数百万乃至千万级的经济损失。然而,传统人工巡检与早期监测技术存在响应滞后、误报率高、定位困难等核心瓶颈。本白皮书基于行业深度洞察,结合立科(广州)检测技术有限公司(以下简称“立科LEAKSENSE”)二十年的专业实践,系统剖析机房漏水监测的现状、挑战,并提出一套融合前沿技术与系统
LEAKSENSE6 天前
中文分词
【漏油绳公司】元宇宙白皮书:技术革新×应用实践·未来蓝图漏油绳行业作为工业安全与环境保护的关键防线,其战略地位在能源、化工、数据中心等核心领域日益凸显。随着全球对安全生产与绿色发展的要求趋严,行业正面临从传统被动防护向主动智能预警的深刻变革。然而,技术迭代缓慢、专业人才断层、盈利模式单一及产业协同不足等核心瓶颈,严重制约了行业的高质量发展。本报告基于对行业现状的深度诊断,结合以立科(广州)检测技术有限公司为代表的头部企业实践,构建系统性解决方案框架,旨在为行业参与者提供前瞻性的战略指引与可落地的行动路径。
莽撞的大地瓜7 天前
自然语言处理·全文检索·中文分词
从人工审校到AI赋能:音视频校对如何保障内容质量从人工审校到AI赋能:音视频校对如何保障内容质量在数字内容创作与传播中,音视频已成为信息的重要载体。面对海量、多模态的内容生产,传统依赖人眼、人耳逐帧审核的模式,不仅效率低下、成本高昂,更难以满足实时发布与批量管理的需要。音视频校对通过人工智能技术实现对视频、音频内容的自动化、批量化审校,为解决多模态内容校对带来智能解决方案。
LEAKSENSE9 天前
中文分词
2026年必看!3招教你选对漏油检测公司,省心又省钱在2026年的工业安全与资产管理领域,液漏风险管控的重要性愈发凸显,尤其对于石油化工、能源储运等企业而言,精准、可靠的漏油检测是保障安全生产、避免环境事故与巨额经济损失的生命线。面对市场上众多的服务商,企业如何做出明智选择,实现风险闭环管理的同时优化成本?立科(广州)检测技术有限公司凭借近20年的行业深耕与全链条自主技术,为企业构建“专业、安全、可靠”的漏油检测体系提供了成熟范本。
Elastic 中国社区官方博客1 个月前
大数据·elasticsearch·搜索引擎·ai·开源·全文检索·中文分词
Elasticsearch 用于词形还原的开源 Hebrew 分析器作者:来自 Elasticsearch Lily Adler一个开源 Elasticsearch 9.x 分析器插件,通过在分析链中对 token 进行词形还原,改善 Hebrew 搜索,以提高对 Hebrew 形态的召回率。
JTfAbUGXr1 个月前
中文分词
基于粒子群优化支持向量机(PSO-SVM)的多变量时间序列预测 PSO-SVM多变量时间序列 ...基于粒子群优化支持向量机(PSO-SVM)的多变量时间序列预测 PSO-SVM多变量时间序列 matlab代码 注:暂无Matlab版本要求 -- 推荐 2018B 版本及以上 注:采用 Libsvm 工具箱(无需安装,可直接运行),仅支持 Windows 64位系统
oIFnupWZw1 个月前
中文分词
基于卷积神经网络的模糊车牌识别系统- 标题:基于卷积神经网络的模糊车牌识别系统 - 关键词: matlab GUI界面 模糊 还原 维纳滤波 最小二乘法约束滤波 数字图像预处理 定位车牌 字符分割 卷积神经网络识别 - 步骤: 打开图像 模糊 还原 灰度化 阈值化 边缘检测 孔洞填充 形态学操作 滤波操作 粗定位 精定位 字符分割 卷积神经网络识别 - 简述: 使用matlab gui界面进行操作,可对车牌进行模糊并进行复原操作,最
凸头1 个月前
windows·postgresql·中文分词
PostgreSQL 16 中文分词插件 zhparser 在 Windows 11 上的编译与安装近期在学习过程中,需为 Windows 11 环境下的 PostgreSQL 16 配置中文分词功能,核心依赖 zhparser 插件。然而,网上现存教程多为多年前的旧版本适配方案,与 PostgreSQL 16 + Windows 11 的新环境存在兼容性差异,可参考性有限。经过多次查阅资料、排查编译报错与环境配置问题,最终成功完成插件的编译与部署。现将完整实操经验整理分享,希望能为有同样需求的开发者避坑。
那起舞的日子2 个月前
elasticsearch·中文分词
ElasticSearch系列-2-中文分词器和复合查询与高亮显示【本期】1、 安装中文分词器 IK 2、深入复合查询与高亮显示介绍下核心参数:–rm 表示创建完后就删除; sh -c 表示shell脚本方式执行后面字符串中的命令。-c表示commands alpine是 极简版linux镜像名,也就8M左右,自带:wget命令 -v es-docker_es-plugins: 这里要注意,如果docker-compose里的volumes没有指定name,那么容器的卷名字格式是:目录名_卷名。 我的目录是es-docker,卷名是es-plugins。所以这里要创建一
JavaLearnerZGQ2 个月前
docker·中文分词·jenkins
Docker安装ElasticSearch8.13.0、Kibana、中文分词器,版本通过网盘分享的文件:elasticsearch、kibana、分词器 链接: https://pan.baidu.com/s/1hPy63QYZERfmIc-FSAGOQA?pwd=8888 提取码: 8888
仅此,3 个月前
运维·docker·postgresql·容器·中文分词·jieba
docker 方式,postgreSQL18 安装 jieba 分词器扩展首先用 docker 启动 pgsql 最新版,目前最新版是 18:然后按照如下命令来就行了
十五年专注C++开发3 个月前
c++·分布式·自然语言处理·中文分词
Jieba库: 一个中文分词领域的经典库目录1.简介2.安装与集成3.核心功能代码示例3.1.基础功能:三种分词模式3.2.关键词提取(TF-IDF 算法)
风若飞3 个月前
中文分词·solr·lucene
Solr 8 ik-analyzer 中文分词 基本使用篇分词器相关包:该github文档有详细说明,建议先看看。https://github.com/magese/ik-analyzer-solr?tab=readme-ov-file
聊天QQ:4877392783 个月前
中文分词
FPGA相位差检测:基于Vivado环境的7606三路采样探索fpga相位差检测,基于vivado环境,7606三路采样,绝对,独此一份,包含源码,仿真和matlab代码
咨询QQ180809513 个月前
中文分词
基于MATLAB的手势识别系统 有预处理和手势分割 提取多种特征,多种分类器进行比较基于MATLAB的手势识别系统 有预处理和手势分割 提取多种特征,多种分类器进行比较 可以实现图像和视频的手势识别
G***T6914 个月前
数据库·postgresql·中文分词
PostgreSQL全文搜索教程,中文分词配置**PostgreSQL全文搜索教程:中文分词配置**PostgreSQL,作为一款功能强大的开源关系型数据库管理系统,其全文搜索功能备受开发者青睐。对于需要处理大量文本数据的用户来说,如何高效地进行全文搜索成为了亟待解决的问题。本文将详细介绍如何在PostgreSQL中配置中文分词,以提升全文搜索的性能和准确性。
汗流浃背了吧,老弟!4 个月前
算法·中文分词·easyui
中文分词全切分算法本文档详细介绍了中文分词全切分算法的实现原理和应用场景。该算法基于字典匹配和深度优先搜索(DFS),结合记忆化递归优化,能够找出给定文本在字典约束下的所有可能切分方式。全切分是中文分词的基础技术,为后续的最优切分选择、歧义消解等任务提供重要支持。
神的孩子都在歌唱4 个月前
elasticsearch·中文分词·jenkins
Elasticsearch 7.6 安装 Jieba 中文分词插件完整教程前言 这是我在这个网站整理的笔记,有错误的地方请指出,关注我,接下来还会持续更新。作者:神的孩子都在歌唱
unicrom_深圳市由你创科技4 个月前
mysql·性能优化·中文分词
MySQL 全文索引进阶:中文分词配置 + 模糊查询性能优化在中文业务场景中,“模糊查询” 是高频需求 —— 例如电商的 “商品名称包含‘手机壳’”、内容平台的 “文章正文含‘人工智能’”。传统的LIKE '%关键词%'在数据量超过 10 万行后会陷入性能瓶颈,而 MySQL 全文索引通过合理配置中文分词,可将查询效率提升 10-100 倍。本文详解中文分词插件配置、全文索引实战及性能优化技巧。