jina

Elastic 中国社区官方博客24 天前
大数据·人工智能·elasticsearch·搜索引擎·ai·全文检索·jina
使用 Jina Embeddings v2 在 Elasticsearch 中进行后期分块作者:来自 Elastic Gustavo Llermaly在 Elasticsearch 中使用 Jina Embeddings v2 模型并探索长上下文嵌入模型的优缺点。
量化交易曾小健(金融号)1 个月前
jina
Jina CLIP v2:多语言多模态的文本图像向量模型原创 Jina AI Jina AI 2024年11月22日 12:47 北京多模态向量通过统一的数据表示,实现了不同模态数据的搜索和理解,是神经检索和多模态生成式 AI 应用的基石。今天,我们推出了全新的通用多语言多模态向量模型 —— jina-clip-v2。该模型基于 jina-clip-v1 和 jina-embeddings-3 构建,并实现了多项关键改进:
王多头发2 个月前
embedding·jina
【大模型开发指南】llamaindex配置deepseek、jina embedding及chromadb实现本地RAG及知识库(win系统、CPU适配)说一些坑,本来之前准备用milvus,但是发现win搞不了(docker都配好了)。然后转头搞chromadb。这里面还有就是embedding一般都是本地部署,但我电脑是cpu的没法玩,我就选了jina的embedding性能较优(也可以换glm的embedding但是要改代码)。最后问题出在deepseek与llamaindex的适配,因为采用openai的接口,这里面改了openai库的源码然后对llamaindex加了配置项才完全跑通。国内小伙伴如果使用我这套方案可以抄,给我点个赞谢谢。
飞来又飞去4 个月前
python·ansible·运维开发·jina
ansible playbook使用jinja2语法渲染inventory下的主机名和IP到/etc/hosts
jieshenai5 个月前
langchain·jina
langchain使用jina-embeddings构建Chroma向量库,解决加载模型初始化失败使用 {"trust_remote_code":True} 传递给 langchain_community.embeddings 的 SentenceTransformerEmbeddings ,逐步解析 jinaai/jina-embeddings-v2-base-en 编码模型初始化加载异常的问题。
Jina AI6 个月前
人工智能·jina
Jina CLIP v1:多模态向量模型,为文本和图像而生!CLIP 模型架起了文本和图像的桥梁,但实际上很少有人会用它来进行文本检索,因为CLIP的文本编码器无法有效的对长文本进行语义建模。
007php00710 个月前
java·人工智能·经验分享·redis·分布式·python·sql·深度学习·jmeter·mysql·mongodb·elasticsearch·ajax·微服务·设计模式·zookeeper·架构·golang·spark·系统架构·json·rabbitmq·php·nosql·hbase·postman·sass·健康医疗·dba·接口隔离原则·easyui·xss·activemq·yarn·oneapi·composer·storm·jira·iotdb·单一职责原则·交通物流·jina
智慧餐饮系统架构的设计与实现随着科技的不断发展,智慧餐饮系统在餐饮行业中扮演着越来越重要的角色。智慧餐饮系统整合了信息技术,以提高餐饮企业的管理效率、客户服务质量和市场竞争力。本文将探讨智慧餐饮系统架构的设计与实现,并探讨其在餐饮行业中的应用前景。
Jina AI1 年前
人工智能·云计算·aws·jina
Jina AI 的 8K 向量模型上线 AWS Marketplace,支持本地部署!在当前多模态 AI 和大模型技术风头正劲的背景下,Jina AI 始终领跑于创新前沿,技术领先。2023 年 10 月 30 日,Jina AI 隆重推出 jina-embeddings-v2,这是全球首款支持 8192 输入长度的开源向量大模型,其性能媲美 OpenAI 的闭源 text-embedding-ada002。如今,jina-embeddings-v2 正式登陆 AWS Marketplace,为中大型企业提供了私有化部署向量模型的理想解决方案。
comli_cn1 年前
论文阅读·embedding·jina
论文阅读:JINA EMBEDDINGS: A Novel Set of High-Performance Sentence Embedding ModelsJINA EMBEDINGS构成了一组高性能的句子嵌入模型,擅长将文本输入转换为数字表示,捕捉文本的语义。这些模型在密集检索和语义文本相似性等应用中表现出色。文章详细介绍了JINA EMBEDINGS的开发,从创建高质量的成对(pairwise)和三元组数据集(triplet datasets)开始。它强调了数据清理在数据集准备中的关键作用,深入了解了模型训练过程,并使用Massive Text Embedding Benchmark(MTEB)进行了全面的性能评估。此外,为了提高模型对语法否定的认识,构