自然语言处理

kcarly5 小时前
人工智能·语言模型·自然语言处理
KTransformers如何通过内核级优化、多GPU并行策略和稀疏注意力等技术显著加速大语言模型的推理速度?KTransformers通过内核级优化、多GPU并行策略和稀疏注意力等技术显著加速大语言模型的推理速度,具体体现在以下几个方面:
banjin8 小时前
阿里云·自然语言处理·云计算·ai编程·ai写作·deepseek
免费体验,在阿里云平台零门槛调用满血版DeepSeek-R1模型随着人工智能技术的飞速发展,各类AI模型层出不穷。其中,DeepSeek作为一款新兴的推理模型,凭借其强大的技术实力和广泛的应用场景,逐渐在市场中崭露头角。本文将基于阿里云提供的零门槛解决方案,对DeepSeek模型的部署与使用进行技术评测,本方案涵盖云上调用满血版 DeepSeek 的 API 及部署各尺寸模型的方式,无需编码,最快 5 分钟、最低 0 元即可部署实现。
高山莫衣8 小时前
人工智能·语言模型·自然语言处理
中文Build a Large Language Model (From Scratch) 免费获取全文中文pdf下载地址:https://pan.baidu.com/s/1aq2aBcWt9vYagT2-HuxdWA?pwd=lshj 提取码:lshj
Zhouqi_Hua14 小时前
论文阅读·笔记·深度学习·语言模型·自然语言处理
LLM论文笔记 15: Transformers Can Achieve Length Generalization But Not Robustly1. 实验结论:十进制加法任务上的长度泛化最佳组合:FIRE位置编码随机化位置编码反向数据格式索引提示(index hints,辅助定位)
Neo很努力16 小时前
自然语言处理·chatgpt·langchain·aigc·llama
【deepseek】本地部署+RAG知识库挂载+对话测试本文主要涵盖Deepseek在ubuntu系统中的部署全流程,包括模型的下载、系统部署、本地文档向量化、向量列表存储、RAG知识库挂载、对话测试等内容
QQ_77813297416 小时前
人工智能·自然语言处理
DeepSeek与ChatGPT:AI语言模型的全面对决DeepSeek与ChatGPT作为当前AI语言模型领域的代表性产品,分别展现了中美两国在技术路线、应用场景与商业模式上的差异化探索。以下从多个维度对两者进行对比分析:
伊一大数据&人工智能学习日志19 小时前
人工智能·算法·自然语言处理
自然语言处理NLP 03案例——提取小说红楼梦各卷关键词TOP10如下图,是红楼梦的本文小说,现在我们要提取出红楼梦每卷排名前十的关键词为了更顺利的完成要求,我们将任务拆解为以下四个节点
Kai HVZ1 天前
人工智能·深度学习·自然语言处理
《深度学习》——自然语言处理(NLP)自然语言处理(Natural Language Processing,NLP)是计算机科学与语言学等多学科交叉的领域,旨在让计算机理解、处理和生成人类自然语言。 在技术发展上,早期以基于规则的方法为主,随着计算机性能提升和数据量增加,基于统计的方法兴起,而深度学习的出现带来了巨大变革,像 Transformer 架构等推动了 NLP 的快速发展。 其常见任务丰富多样,包括文本分类(如情感分析、新闻分类)、命名实体识别(提取人名、地名等)、词性标注、句法分析、机器翻译以及文本生成等。 在应用方面,智能客服借
North_D1 天前
人工智能·深度学习·神经网络·目标检测·机器学习·自然语言处理·数据挖掘
ML.NET库学习008:使用ML.NET进行心脏疾病预测模型开发本项目的目的是开发一个基于ML.NET的机器学习模型,用于心脏疾病的风险预测。通过分析患者的心脏相关特征数据,模型可以对是否存在心脏疾病进行分类。
没枕头我咋睡觉2 天前
人工智能·语言模型·自然语言处理
【大语言模型_2】mindie部署deepseek模型https://modelscope.cn/home不修改启动模型会报错修改模型config.json
仙人掌_lz2 天前
人工智能·语言模型·自然语言处理
【再读】2501.12948/DeepSeek-R1通过强化学习提升大型语言模型(LLMs)的推理能力DeepSeek-R1-Zero展示了在没有监督数据的情况下,通过RL可以发展出强大的推理能力。DeepSeek-R1通过引入冷启动数据和多阶段训练,进一步提升了推理性能,达到了与OpenAI-o1-1217相当的水平。此外,通过蒸馏技术,将DeepSeek-R1的推理能力转移到更小的密集模型上,显著提高了这些模型的推理能力。
tangjunjun-owen2 天前
人工智能·语言模型·自然语言处理·llava-cot论文
LLaVA-CoT: Let Vision Language Models Reason Step-by-Step论文解读大型语言模型在推理能力方面展现了显著的进步,尤其是在推理时扩展方面,如OpenAI的o1模型所示。然而,当前的视觉-语言模型(VLMs)在进行系统性和结构性推理时往往面临挑战,特别是在处理复杂的视觉问答任务时。在这项工作中,我们介绍了LLaVA-CoT1,这是一种新型的VLM,旨在进行自主的多阶段推理。不同于链式思维提示,LLaVA-CoT独立地参与到摘要、视觉解释、逻辑推理和结论生成的连续阶段中。这种结构化的方法使得LLaVA-CoT在需要高度推理的任务上实现了明显的精度提升。为了实现这一目标,我们编译
FserSuN2 天前
人工智能·语言模型·自然语言处理
大语言模型Agent当你面临一个没有简单答案的问题时,通常需要遵循几个步骤,仔细思考,并记住你已经尝试过的方法。LLM代理正是为语言模型应用中的这些情况而设计的。它们结合了全面的数据分析、战略规划、数据检索以及从过去行动中学习的能力,以解决复杂问题。
真上帝的左手2 天前
spring boot·ai·语言模型·自然语言处理·ai编程
23. AI-大语言模型-DeepSeek赋能开发-Spring AI集成拥抱AI‌DeepSeek 是深度求索公司发布的大模型,是国产之光。大家应该学会如何使用 DeepSeek 大模型,本文主要探讨,如何开发基于 DeepSeek 大模型的智能应用。
过期动态2 天前
linux·服务器·人工智能·深度学习·机器学习·自然语言处理
【DeepSeek服务器部署全攻略】Linux服务器部署DeepSeek R1模型、实现API调用、搭建Web页面以及专属知识库2025年春节前夕,中国AI大模型DeepSeek以惊人的速度席卷全球,成为科技圈的“现象级”爆款。仅用20天,其日活用户突破2570万,并登顶43国应用商店榜首。
North_D2 天前
人工智能·深度学习·神经网络·目标检测·机器学习·自然语言处理·数据挖掘
ML.NET库学习011:基于YOLO目标检测算法的图像处理系统本项目旨在实现基于YOLO(You Only Look Once)目标检测算法的图像处理系统,具体使用的是Tiny YOLO v2模型。该模型是一种轻量级的目标检测模型,适合在资源有限的环境中运行。
Archie_IT2 天前
人工智能·深度学习·神经网络·计算机视觉·自然语言处理·数据挖掘·语音识别
DeepSeek模型快速部署教程-搭建自己的DeepSeek前言:在人工智能技术飞速发展的今天,深度学习模型已成为推动各行各业智能化转型的核心驱动力。DeepSeek 作为一款领先的 AI 模型,凭借其高效的性能和灵活的部署方式,受到了广泛关注。无论是自然语言处理、图像识别,还是智能推荐系统,DeepSeek 都能提供强大的支持。本文将详细介绍 DeepSeek 的特点,并分享两种常见的部署方式:容器云部署和极速部署,帮助用户快速上手并高效利用这一先进技术。无论是技术开发者还是普通用户,都能通过这些方法快速上手并高效利用 DeepSeek 的强大能力。
陈敬雷-充电了么-CEO兼CTO2 天前
人工智能·神经网络·自然语言处理·chatgpt·大模型·aigc·deepseek
DeepSeek核心算法解析:如何打造比肩ChatGPT的国产大模型注:此文章内容均节选自充电了么创始人,CEO兼CTO陈敬雷老师的新书《自然语言处理原理与实战》(人工智能科学与技术丛书)【陈敬雷编著】【清华大学出版社】
电棍2333 天前
笔记·深度学习·自然语言处理
深度学习笔记之自然语言处理(NLP)在行将开学之时,我将开始我的深度学习笔记的自然语言处理部分,这部分内容是在前面基础上开展学习的,且目前我的学习更加倾向于通识。自然语言处理部分将包含《动手学深度学习》这本书的第十四章,自然语言处理预训练和第十五章,自然语言处理应用。并且参考原书提供的jupyter notebook资源。
Watermelo6173 天前
大数据·人工智能·深度学习·神经网络·机器学习·语言模型·自然语言处理
DeepSeek横空出世,真的拯救了算力焦虑吗?目录DeepSeek横空出世,真的拯救了算力焦虑吗?一、为什么会有算力焦虑二、来自硅谷四大科技巨头的决策