技术栈
自然语言处理
小小工匠
17 小时前
人工智能
·
语言模型
·
自然语言处理
拆解大语言模型:从词向量到注意力机制的内部运行原理
当你向 ChatGPT 输入一句话,它在零点几秒内就能续写出流畅、连贯甚至富有洞察力的文字。这背后没有任何人类工程师编写的「逐步指令」,只有一张由数千亿参数构成的神经网络。本文尝试用尽量少的数学,把这张网络内部真正发生的事情讲清楚。
renhongxia1
11 小时前
人工智能
·
深度学习
·
生成对抗网络
·
自然语言处理
·
知识图谱
·
agi
世界模型作为AGI落地底层底座的作用
当前主流人工智能擅长分类、检测和生成,本质仍停留在“感知”层面。它们能认出猫和狗,却无法预判猫下一秒会不会跳上桌子。这种对动态世界的理解缺失,正是AI与人类智能的核心差距。世界模型的出现,恰好填补了这一空白——它不再满足于“这是什么”,而是追问“接下来会发生什么”。
星川皆无恙
17 小时前
大数据
·
人工智能
·
爬虫
·
算法
·
机器学习
·
自然语言处理
·
kmeans
大数据k-means聚类算法:基于k-means聚类算法+NLP微博舆情数据爬虫可视化分析推荐系统(新版)
如果你正在准备 毕业设计、课程设计、Python 项目实战、NLP 文本分析、舆情监测系统、数据分析可视化项目,这篇项目文章很适合拿来做参考。它不是单纯讲一个爬虫脚本,也不是只放几张图表,而是把 微博数据采集、文本处理、情感分析、K-means 聚类、可视化展示、推荐逻辑 串成了一套完整系统,更接近真实项目展示和答辩材料需要的结构。
大模型最新论文速读
15 小时前
论文阅读
·
人工智能
·
深度学习
·
机器学习
·
自然语言处理
06-16 · LLM 最新论文速览
今日候选池 101 篇,硬过滤 + LLM 打分后通过评估 15 篇,精选 Top-10,另列 5 篇速览。
宝贝儿好
15 小时前
人工智能
·
深度学习
·
神经网络
·
学习
·
算法
·
自然语言处理
【LLM】第二章:HuggingFace入门学习
HuggingFace是一个提供开源预训练模型和相关工具链的平台,目前已经是一个完整的AI开发生态系统,支持NLP、计算机视觉、语音处理、多模态任务等多个领域。我们使用HF可以简化预训练模型的使用,加速项目的开发和落地。
财经资讯数据_灵砚智能
17 小时前
大数据
·
人工智能
·
python
·
ai
·
信息可视化
·
自然语言处理
·
灵砚智能
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年6月15日
关于本文:这是一篇Python自动化数据采集与NLP分析的技术实践笔记。 使用的技术栈包括:Python爬虫、jieba/SnowNLP情感分析、TF-IDF关键词提取、LDA主题模型、Matplotlib数据可视化。 本文由脚本自动生成,仅记录技术实现过程,所有数据来源于公开渠道。 基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)
暮云星影
17 小时前
arm开发
·
人工智能
·
语言模型
·
自然语言处理
瑞芯微rk3588利用Rockchip NPU运行大语言模型(LLM)
在 RK3588开发板上,利用 Rockchip NPU 运行大语言模型(LLM),测试模型包括:设备
宝贝儿好
18 小时前
人工智能
·
深度学习
·
机器学习
·
自然语言处理
【LLM】第一章:知识体系框架概览
大模型,具体说就是大语言模型,LLM,large language model,这个领域其实就是NLP,所以本专栏也是NLP专栏的延续,是NLP的高阶内容。
啦啦啦_9999
18 小时前
自然语言处理
项目之 头满分_3Bert
1. 回顾:第一期选择了RF随机森林,做完之后效果83.74; 第二期选择了方案中选择了轻量化的 FastText,效果远超预期,从83.74%左右调到字符级别分词的效果是91.65%;虽然提升很大,但还是有很大的优化空间,所以有了第三期项目; (分类任务算是最简单的任务,对其一般要求都很高,一般都是四个9(9999):即99.99%,工作中91.65%肯定不是最好的,至少要优化到95%以上,尽量减少误差;) 第三期:使用Bert;
财经资讯数据_灵砚智能
19 小时前
人工智能
·
python
·
ai
·
信息可视化
·
自然语言处理
·
ai编程
·
灵砚智能
基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)2026年6月16日
关于本文:这是一篇Python自动化数据采集与NLP分析的技术实践笔记。 使用的技术栈包括:Python爬虫、jieba/SnowNLP情感分析、TF-IDF关键词提取、LDA主题模型、Matplotlib数据可视化。 本文由脚本自动生成,仅记录技术实现过程,所有数据来源于公开渠道。 基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-凌晨)
财经资讯数据_灵砚智能
1 天前
大数据
·
人工智能
·
python
·
ai
·
信息可视化
·
自然语言处理
·
灵砚智能
基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-次晨)2026年6月14日
关于本文:这是一篇Python自动化数据采集与NLP分析的技术实践笔记。 使用的技术栈包括:Python爬虫、jieba/SnowNLP情感分析、TF-IDF关键词提取、LDA主题模型、Matplotlib数据可视化。 本文由脚本自动生成,仅记录技术实现过程,所有数据来源于公开渠道。 基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-凌晨)
叫我:松哥
1 天前
人工智能
·
深度学习
·
机器学习
·
自然语言处理
·
flask
·
nlp
·
bootstrap
基于机器学习的中文文本抑郁症风险检测系统,包括NLP与传统机器学习的抑郁症识别,准确率92%
第一章 绪论1.1 研究背景及意义1.1.1 抑郁症检测背景抑郁症是一种常见的精神障碍,以持续的情绪低落、兴趣丧失、精力减退为主要特征,严重时可能导致自残、自杀等极端行为。据世界卫生组织统计,全球有超过3亿人受抑郁症困扰,占全球人口的4%以上,预计到2030年,抑郁症将成为全球疾病负担的首要原因。在中国,抑郁症的终身患病率约为6.8%,但就诊率却不足10%,大量患者未能得到及时有效的诊断和治疗。
troubles maker
1 天前
语言模型
·
自然语言处理
·
lora
·
大模型
·
peft
LoRA: Low-Rank Adaptation of Large Language Models
论文链接:https://arxiv.org/pdf/2106.09685v1/1000大模型下游迁移微调是行业落地的关键环节,传统全参数微调存在参数量大、算力消耗高、权重分发不便、易发生原有知识覆盖等缺陷。Adapter、Prefix Tuning、Prompt Tuning 等一系列参数高效微调(Parameter-Efficient Fine-Tuning,PEFT)方案被陆续提出,其中低秩自适应( Low-Rank Adaptation,LoRA)[1]方案凭借收敛速度快、推理无额外延迟、兼容性强
nbtang2026
2 天前
人工智能
·
语言模型
·
自然语言处理
小型语言模型(SLM)调研:从端侧部署到专业化 Agent
调研时间: 2026-06-12 适用读者: 关注本地 AI、端侧 Agent、低成本推理、私有化部署和模型选型的开发者 核心观点: 小模型不再只是“大模型的低配替代品”。在工具调用、代码补全、端侧助手、隐私敏感任务和固定流程自动化中,小模型正在成为更经济、更可控、更容易落地的默认选项。但在复杂推理、开放式长文档理解和高可靠多轮规划中,大模型仍然是必要兜底。
大模型最新论文速读
2 天前
论文阅读
·
人工智能
·
深度学习
·
自然语言处理
06-15 · LLM 最新论文速览
今日候选池 89 篇,硬过滤 + LLM 打分后通过评估 7 篇。关注方向:多 Agent 系统 / LLM 后训练(RL/SFT) / 扩散语言模型 / 推理加速 / 长上下文 / 量化交易
workflower
2 天前
人工智能
·
自然语言处理
·
数据挖掘
·
自动驾驶
·
动态规划
·
制造
互联网与大数据环境下制造服务模式
通过客户全程参与,利用信息“产生优化的决策和个性化的服 务为客户创造价值”的智能制造和客户化定制服务模式。
财经资讯数据_灵砚智能
2 天前
大数据
·
人工智能
·
python
·
信息可视化
·
自然语言处理
基于全球经济类多源新闻的NLP情感分析与数据可视化(日间)2026年6月15日
关于本文:这是一篇Python自动化数据采集与NLP分析的技术实践笔记。 使用的技术栈包括:Python爬虫、jieba/SnowNLP情感分析、TF-IDF关键词提取、LDA主题模型、Matplotlib数据可视化。 本文由脚本自动生成,仅记录技术实现过程,所有数据来源于公开渠道。 基于全球经济类多源新闻的NLP情感分析与数据可视化(夜间-凌晨)
Jump 不二
2 天前
人工智能
·
深度学习
·
自然语言处理
从 CV 扩散到 NLP:详解 Google DiffusionGemma 架构、推理机制与优劣
最近发现个好玩的大模型 DiffusionGemma-26B-A4B-it,这个模型有什么特别的呢?可以先看下下面这张图。
workflower
2 天前
人工智能
·
算法
·
机器学习
·
设计模式
·
语言模型
·
自然语言处理
·
重构
基于机器学习的设备故障预测分析方法
数据准备(Data preparation)——数据处理(Merging data sources)——特征工程(Feature engineering: lag feature, static feature)——建模(Modeling: Bin-class, regression, multi-class)——训练、仿真(Training, Simulation)——决策(Decision)
古希腊掌管代码的神THU
2 天前
人工智能
·
深度学习
·
自然语言处理
·
面试
解析 MiniMax M3 多模态大模型的架构/源码?
📌 本期解析 MiniMax M3 多模态大模型的架构/源码。并且回顾 MiniMax 从 01 到 M3 的发展路线。