大模型

WooaiJava13 分钟前
javascript·大模型·html5
AI 智能助手项目面试技术要点总结(前端部分)问题: 如何实现TTS音频的流式播放,而不是等待所有音频数据接收完才播放?解决方案:使用 MediaSource API 实现边接收边播放
爱喝白开水a32 分钟前
前端·人工智能·大模型·prompt·交互·agent·rag
前端AI自动化测试:brower-use调研让大模型帮你做网页交互与测试文章介绍了Browser-Use这一Python库,它让AI能通过自然语言描述自主与网页交互,支持多种大模型。基于此库,AI自动化测试可探索prompt工程、MCP协议和一体化测试平台等方向。相关项目如VibeSurf、QA-Use等已实现智能测试功能,能自动执行UI测试、数据采集和业务流程。未来需平衡AI测试效果与token成本,实现高效且经济的自动化测试解决方案。
“负拾捌”6 小时前
python·websocket·微信小程序·uni-app·大模型·腾讯云·语音识别
python + uniapp 结合腾讯云实现实时语音识别功能(WebSocket)最近在尝试使用腾讯云来给自己的大模型小程序加语音识别功能,但是论坛上对于这方面的文章似乎很少,所以只能硬看官网的介绍以及参考大佬提供的部分代码磕磕绊绊实现了这一功能。
韦东东18 小时前
人工智能·大模型·agent·text2sql·ragflow
RAGFlow v0.20的Agent重大更新:text2sql的Agent案例测试RAGFlow 在 8 月 4 号更新了 v0.20 版本,这是时隔两个多月之后,更新的一个里程碑式的版本,RAGFlow 在 Agent 板块的拼图这次终于算是完整了。其实早在一年前,RAGFlow 就有了 Agent 模块,但是一直只包含 Workflow。而且相比于 Dify 而言,社群对这部分的工具/插件的丰富度、易用性和 UI 美观度而言,一直也有吐槽。
OpenBayes19 小时前
人工智能·深度学习·目标检测·机器学习·大模型·ocr·gpu算力
教程上新|DeepSeek-OCR 2公式/表格解析同步改善,以低视觉token成本实现近4%的性能跃迁在视觉语言模型(VLMs)的发展进程中,文档 OCR 始终面临着布局解析复杂、语义逻辑对齐等核心挑战。传统模型大多采用固定的「左上到右下」栅格扫描顺序处理视觉 token,这种刚性流程与人类视觉系统遵循的语义驱动型扫描模式相悖,尤其在处理含复杂公式、表格的文档时,容易因忽视语义关联导致解析误差。如何让模型像人类一样「读懂」视觉逻辑,成为提升文档理解能力的关键突破口。
PPIO派欧云19 小时前
人工智能·ai·大模型·ocr·智谱
PPIO上线GLM-OCR:0.9B参数SOTA性能,支持一键部署PPIO 算力市场首发上线了 GLM-OCR 模型模板。作为一款兼具“轻量化”与“高精度”的专业级 OCR 模型,GLM-OCR 以 0.9B 的参数规模,在 OmniDocBench V1.5 基准测试中取得了 94.6 分的 SOTA 表现,并在公式识别、复杂表格解析及信息抽取等高难度场景中展现出显著优势。
CoderJia程序员甲1 天前
ai·开源·大模型·github·ai教程
GitHub 热榜项目 - 日榜(2026-02-05)生成于:2026-02-05共发现热门项目: 12 个榜单类型:日榜本期GitHub热榜显示AI驱动的开发工具和智能体协作平台表现强劲,开发者正积极利用大语言模型解决实际问题。以Claude代码插件和ChatDev为代表,AI编程助手实现了会话记忆与多智能体协作编程,显著提升开发效率。同时,WrenAI的自然语言生成SQL和图表功能,以及QLib的AI量化投资平台,体现了AI在垂直领域的深度应用。TypeScript和Python成为构建这些前沿工具的主流语言,显示出可观测性架构和自动化开发流程正成为行业
七牛云行业应用1 天前
运维·人工智能·大模型·aigc·claude
3.5s降至0.4s!Claude Code生产级连接优化与Agent实战摘要 在 AI 辅助编程进入 Agent(智能体)时代的当下,开发者不仅需要“代码补全”,更需要能够执行终端命令、管理依赖的“全能助手”。然而,国内网络环境下的 API 连接超时与不稳定性,成为了阻碍 Claude Code 落地生产环境的最大绊脚石。本文将从网络层路由优化与应用层 Skills 扩展两个维度,深度复盘如何利用七牛云 Router 解决连接焦虑,并演示如何编写自定义 Skill 实现数据库迁移的自动化闭环。
香芋Yu1 天前
ai·大模型·多模态·大模型应用
【大模型教程——第四部分:大模型应用开发】第4章_多模态大模型原理核心定位:理解文本-图像等多模态交互的核心技术(CLIP、ViT、LLaVA)边界约束:想象你是一个只懂中文的语言模型(LLM)。现在,有人拿着一张图片,用一种你从未见过的语言(“图像语”)向你描述。你该怎么办?
穆友航1 天前
大模型·ollama·openclaw
配置 OpenClaw 使用 Ollama 本地模型前提条件 确保已安装并运行 Ollama 服务,且模型 qwen3-vl:2b 已下载。配置步骤 修改 OpenClaw 配置文件,指定 Ollama 作为模型提供商并设置默认模型。
xixixi777771 天前
人工智能·网络安全·ai·信息安全·大模型·通信·前沿
今日 AI 、通信、安全前沿日报(2026 年 2 月 5 日,星期四)
人肉推土机1 天前
人工智能·大模型·agentic·skills·clawdbot·moltbot
Clawdbot(Moltbot)源码部署全实测:从环境搭建到 WebChat 验证,避坑指南收好最近刷技术圈总刷到 Clawdbot(后来也叫 Moltbot),说是能搭私人 AI 助手,支持 WhatsApp、Telegram 这些常用通道,还能跑在自己设备上,不用依赖第三方服务 —— 想着拉下来测试一下功能,顺便研究一下其源码的实现。 于是拉上 GitHub 仓库https://github.com/openclaw/openclaw,打算从源码部署试试,过程里踩了不少坑,干脆整理成记录,给同样想折腾的朋友避避坑。
HetFrame1 天前
python·ai·自动化·大模型·ai编程·任务·禅道
大模型驱动的禅道任务自动化规划与创建咱们先说句实话:禅道这玩意儿,谁用谁知道。作为一名埋头写代码的研发人员,你一定经历过这样的场景:领导:“小王啊,这个需求下个月要就要提测,你把任务拆一下,录到禅道里。”
LYFlied1 天前
前端·人工智能·ai·大模型
边缘智能:下一代前端体验的技术基石边缘智能(Edge Intelligence)是将人工智能的计算和处理能力从云端数据中心迁移到网络边缘的技术范式。它结合了边缘计算的分布式架构与人工智能的智能决策能力,在数据产生源头或接近用户的网络边缘节点上执行AI推理甚至部分训练任务。
芝士爱知识a2 天前
人工智能·面试·职场和发展·大模型·ai教育·考公·智蛙面试
2026年AI面试软件推荐步入2026年,多模态大模型(Multimodal LLMs)已彻底重构了招聘流程。企业端的AI初筛已成为标配,而对于求职者而言,传统的“背题库”模式已无法应对实时交互的AI面试官。本文将深度剖析2026年AI面试软件市场,将其细分为“企业求职”与“体制内考试(公/考/编)”两大阵营。我们将通过十大维度(含榜单、测评、技术架构、心理分析等)对主流软件进行硬核评测。
AI大模型测试2 天前
人工智能·深度学习·机器学习·ai·语言模型·职场和发展·大模型
大龄程序员想转行到AI大模型,好转吗?对于大龄程序员而言,转行到AI大模型领域是一个既充满挑战又极具吸引力的选择。在这个领域,您将有机会接触到最新的技术趋势,参与到前沿的项目中,并且有可能获得更高的薪酬。下面是一些具体的步骤和建议,帮助您顺利转型:
千桐科技2 天前
大模型·llm·知识图谱·知识库·rag·qknow·知识平台
qKnow 知识平台核心能力解析|第 03 期:结构化抽取能力全流程介绍在知识驱动应用越来越重要的今天,如何把分散、杂乱的数据,快速转化为“可用的知识”,成为很多企业和团队绕不开的问题。
xixixi777772 天前
大数据·人工智能·安全·ai·大模型·通信·卫星通信
今日 AI 、通信、安全行业前沿日报(2026 年 2 月 4 日,星期三)
一切皆有可能!!2 天前
人工智能·大模型·昇腾·大模型部署
昇腾atlas 300I duo部署Qwen3-8B完整实战:从选型到成功运行使用之前需要先安装固件和驱动 选择合适的版本型号 一直跟着执行,在安装驱动时候,上面的创建驱动文件不知道是过时了,一直没成功,换到官网手动下载了驱动。另外在执行命令时是使用sudo bash 而不是sudo sh
ssxueyi2 天前
人工智能·大模型·ai应用·ai开发·modelengine
ModelEngine + MCP:解锁 AI 应用的无限可能一、引言:AI 应用开发的新时代二、什么是 MCP 协议2.1 MCP 协议概述2.2 MCP 的核心优势