技术栈
大模型
985小水博一枚呀
6 小时前
人工智能
·
学习
·
语言模型
·
架构
·
大模型
【AI大模型学习路线】第二阶段之RAG基础与架构——第七章(【项目实战】基于RAG的PDF文档助手)技术方案与架构设计?
【AI大模型学习路线】第二阶段之RAG基础与架构——第七章(【项目实战】基于RAG的PDF文档助手)技术方案与架构设计?
在未来等你
6 小时前
java
·
微服务
·
ai
·
kubernetes
·
大模型
·
embedding
·
spring ai
互联网大厂Java求职面试:AI与大模型应用集成及云原生挑战
郑薪苦是一位具有搞笑风格但技术潜力巨大的程序员,正在接受一位严肃专业的技术总监面试。面试官:在我们公司的短视频平台中,需要处理千万级用户同时在线观看直播的需求。请谈谈你在设计这样的直播系统架构时会考虑哪些关键点?
zeroporn
12 小时前
人工智能
·
语言模型
·
分类
·
大模型
·
n-gram
·
词袋
分别用 语言模型雏形N-Gram 和 文本表示BoW词袋 来实现文本情绪分类
用BoW和Bigram特征对电影评论进行情感分类(正/负面),并比较效果。使用简单的自定义数据集(实际项目可用IMDB数据集):
白熊188
16 小时前
人工智能
·
opencv
·
yolo
·
计算机视觉
·
大模型
·
音视频
【图像生成大模型】Step-Video-T2V:下一代文本到视频生成技术
随着人工智能技术的飞速发展,文本到视频生成(Text-to-Video, T2V)技术逐渐成为研究和应用的热点领域。这种技术能够根据文本描述生成相应的视频内容,具有广泛的应用前景,如视频创作、广告制作、教育娱乐等。Step-Video-T2V 是一个由 Stepfun-AI 团队开发的先进文本到视频生成模型,它以其卓越的性能和高效的实现方式,为这一领域带来了新的突破。
白熊188
18 小时前
人工智能
·
搜索引擎
·
大模型
【通用智能体】Serper API 详解:搜索引擎数据获取的核心工具
Serper API 是由 Serper.dev 提供的专业搜索引擎数据接口服务,主要面向开发者提供 Google 搜索结果的实时抓取能力。其核心功能包括:
小技工丨
1 天前
机器学习
·
大模型
·
llama
·
llama-factory
LLaMA-Factory:环境准备
注意: RTX 4090 笔记本 GPU 的 16GB VRAM 限制了可运行的模型大小。建议使用 4-bit 或 8-bit 量化模型(如 LLaMA 3.1 8B 或 13B)以适应 VRAM 限制。
AI大模型系统化学习
1 天前
人工智能
·
ai
·
大模型
·
ai大模型
·
大模型学习
·
大模型入门
·
mcp
Excel MCP: 自动读取、提炼、分析Excel数据并生成可视化图表和分析报告
最近,一款Excel MCP Server的开源工具火了,看起来功能很强大,咱们今天来一探究竟。最近两年,大家都可以看到AI的发展有多快,我国超10亿参数的大模型,在短短一年之内,已经超过了100个,现在还在不断的发掘中,时代在瞬息万变,我们又为何不给自己多一个选择,多一个出路,多一个可能呢?
老翅寒暑
2 天前
ai
·
大模型
·
本地小模型
AI模型的回调能力的理解和实现
BigTall最近把RAG和Agent的原理想通了,对于“一切都是提示词”的理解又更多了一些。本文把我的理解大致整理了一下,给出BigTall自己的一个实验。希望能够对大家有用。
Mr.小海
2 天前
大模型
重排序模型解读 mxbai-rerank-base-v2 强大的重排序模型
mxbai-rerank-base-v2 是 Mixedbread 提供的一个强大的重排序模型,旨在提高搜索相关性。该模型支持多语言,特别是在英语和中文方面表现出色。它还支持代码和 SQL 排序,能够处理长达 8k 个标记的上下文,并且在技术内容排序方面表现优异。
大模型铲屎官
2 天前
开发语言
·
人工智能
·
pytorch
·
python
·
深度学习
·
大模型
·
字典
【Python-Day 14】玩转Python字典(上篇):从零开始学习创建、访问与操作
01-玩转LangChain:从模型调用到Prompt模板与输出解析的完整指南 02-玩转 LangChain Memory 模块:四种记忆类型详解及应用场景全覆盖 03-全面掌握 LangChain:从核心链条构建到动态任务分配的实战指南 04-玩转 LangChain:从文档加载到高效问答系统构建的全程实战 05-玩转 LangChain:深度评估问答系统的三种高效方法(示例生成、手动评估与LLM辅助评估) 06-从 0 到 1 掌握 LangChain Agents:自定义工具 + LLM 打造智能
玩电脑的辣条哥
2 天前
大模型
·
模型量化
·
gptq
·
awq
模型量化AWQ和GPTQ哪种效果好?
AWQGPTQ模型量化AWQ和GPTQ哪种效果好?关于AWQ(Adaptive Weight Quantization)和GPTQ(Generative Pre-trained Transformer Quantization)这两种量化方法的效果比较,具体优劣通常依赖于应用场景、模型结构和目标指标(如精度保持、推理速度、硬件支持等)。以下是两者的详细介绍与对比:
Panesle
3 天前
人工智能
·
开源
·
大模型
·
文生视频
·
多模态
·
生成模型
阿里开源通义万相Wan2.1-VACE-14B:用于视频创建和编辑的一体化模型
Wan2.1是一个全面且开放的视频基础模型套件,旨在突破视频生成的边界。该模型在多个基准测试中持续超越现有的开源模型和商业解决方案的性能。Wan2.1支持多种任务,包括文本到视频、图像到视频、视频编辑、文本到图像和视频到音频,推动了视频生成领域的发展。此外,Wan2.1还具备生成中英文文本的能力,极大增强了其实际应用价值。
幸福清风
4 天前
ai
·
大模型
·
图片
·
liblib
【Liblib】基于LiblibAI自定义模型,总结一下Python开发步骤
Liblib AI(哩布哩布 AI)是一个集成了先进人工智能技术和用户友好设计的 AI 图像创作绘画平台和模型分享社区。
云边有个稻草人
4 天前
人工智能
·
大模型
·
算力
·
gpugeek平台
·
qwen3-32b
GpuGeek:为创新者提供灵活、快速、高效的云计算服务!
目录一、前言二、GpuGeek平台的显著优势2.1 显卡资源充足:强大计算能力的基础(1)多种GPU配置选择
CM莫问
4 天前
人工智能
·
算法
·
大模型
·
推荐算法
·
受限生成
<论文>(微软)避免推荐域外物品:基于LLM的受限生成式推荐
本文介绍微软和深圳大学合作发表于2025年5月的论文《Avoid Recommending Out-of-Domain Items: Constrained Generative Recommendation with LLMs》。论文主要研究如何解决大语言模型(LLMs)在推荐系统中推荐域外物品的问题,提出了 RecLM-ret 和 RecLM-cgen 两种方法。
jc_hook
4 天前
python
·
大模型
·
deepseek
Python 接入DeepSeek
不知不觉DeepSeek已经火了半年左右,冲浪都赶不上时代了。 今天开始学习。 本文旨在使用Python调用DeepSeek的接口(
TGITCIC
4 天前
人工智能
·
大模型
·
transformer
·
ai agent
·
大模型面试
·
ai面试
为何大模型都使用decoder-only?
2017年,BERT的横空出世让双向注意力机制成为NLP领域的“武林盟主”。通过Masked Language Modeling(MLM),BERT在阅读理解、情感分析等任务中展现出惊人的表现,但它的“短板”很快暴露:生成能力堪比“哑巴英语”。彼时的模型若想生成文本,必须依赖编码器-解码器结构,例如T5或BART,这类架构虽能兼顾理解与生成,却因训练效率低下、推理成本高昂而饱受诟病。
想要成为计算机高手
4 天前
ai
·
自然语言处理
·
开源
·
大模型
·
视觉处理
·
openvla
OpenVLA:开源的视觉-语言-动作模型
让我们先来介绍一下什么是OpenVLA,在这里: https://openvla.github.io/ 可以看到他们的论文、数据、模型。 OpenVLA 是一个拥有 70亿参数的开源 **视觉-语言-动作(VLA)**模型。它是在 Open X-Embodiment 数据集 中的 97万个 机器人执行任务或学习过程的数据记录(episodes) 上训练得到的。
林泽毅
5 天前
人工智能
·
深度学习
·
机器学习
·
大模型
·
paddlepaddle
·
模型训练
·
swanlab
PaddleNLP框架训练模型:使用SwanLab教程
PaddleNLP 是一款基于飞桨深度学习框架的大语言模型(LLM)开发套件,支持在多种硬件上进行高效的大模型训练、无损压缩以及高性能推理。PaddleNLP 具备简单易用和性能极致的特点,致力于助力开发者实现高效的大模型产业级应用。
程序边界
5 天前
大模型
AIGC时代 | 终端设备上的大模型轻量化部署:模型压缩与量化全栈方案
随着大模型参数规模突破万亿级,如何在资源受限的终端设备(如手机、IoT传感器、AR眼镜)上实现高效部署成为关键挑战。本文将深入探讨剪枝、量化、蒸馏、知识迁移等核心技术,结合PyTorch、TensorRT、CoreML等工具链,提供从模型压缩到终端部署的全流程解决方案,并附完整代码示例和性能优化策略。