算法

CoovallyAIHub6 小时前
深度学习·算法·计算机视觉
Moonshine:比 Whisper 快 100 倍的端侧语音识别神器,Star 6.6K!告别云端 API,语音识别也能跑在树莓派上?还在为语音识别的高延迟、隐私泄露、API 调用费用发愁吗?来自 Moonshine AI 的开源项目 Moonshine Voice 给出了一个令人惊艳的答案 —— 一个完全运行在本地设备上的实时语音识别工具包,无需联网、无需 API Key、无需账号注册,开箱即用。
CoovallyAIHub7 小时前
深度学习·算法·计算机视觉
速度暴涨10倍、成本暴降6倍!Mercury 2用扩散取代自回归,重新定义LLM推理速度等AI回消息的间隙,你是切出去刷了个短视频,还是盯着屏幕数它蹦出来的字?现在的GPT、Claude、Gemini,看着聪明,骨子里其实都是老式打字员——一个字接一个字往外敲,前一个不落地,后一个就得干等着。这叫自回归,串行干活。问简单问题还行,一旦需要它多绕几个弯思考,比如解道数学题、做个多步规划,动辄让你等上半分钟。耐心就是这么磨没的。
CoovallyAIHub7 小时前
算法·架构·github
实时视觉AI智能体框架来了!Vision Agents 狂揽7K Star,延迟低至30ms,YOLO+Gemini实时联动!最近Stream团队开源的Vision Agents,在GitHub上已经悄悄爬上了7000多颗星。我花了一下午把它的文档和代码翻了个底朝天,说实话,有点意思。
CoovallyAIHub7 小时前
人工智能·算法·github
开源:YOLO最强对手?D-FINE目标检测与实例分割框架深度解析在计算机视觉领域,实时目标检测与实例分割一直是工业界和学术界关注的焦点。Transformer架构的加入让这一领域焕发新生,但如何在保持低延迟的同时实现高精度的实例分割,依然是技术落地的难点。
CoovallyAIHub8 小时前
算法·架构·github
OpenClaw:从“19万星标”到“行业封杀”,这只“赛博龙虾”究竟触动了谁的神经?最近科技圈最躁动的名字,非 OpenClaw 莫属。一方面,它在GitHub上狂揽19万星标,被无数极客奉为“自ChatGPT以来最让人兴奋的项目”,仿佛预示着AI权力的下放。另一方面,它接连遭到Meta、Google的公开“封杀”,安全漏洞、恶意使用、成本失控等争议缠身。
刀法如飞8 小时前
算法·编程开发·算法思想
程序员必须知道的核心算法思想算法思想 ≠ 代码实现。同一个思想可以用多种语言、多种方式来实现。掌握算法思想,就是掌握问题求解的本质,通过不同的实现方式,将问题解决得更加高效。
徐小夕9 小时前
vue.js·算法·github
pxcharts Ultra V2.3更新:多维表一键导出 PDF,渲染兼容性拉满!最近粉丝咨询最多的问题莫过于 pxcharts 多维表是否能导出PDF的能力了。说实话,我回避了很久。浏览器打印引擎差异大,中文渲染、分页断行、复杂表格适配...每个都是坑。
CoovallyAIHub10 小时前
深度学习·算法·计算机视觉
OpenClaw一脚踩碎传统CV?机器终于不再只是看世界如果你是一名计算机视觉的研究者,过去几年大概已经习惯了这样一种节奏:ImageNet分类准确率又涨了0.1%,某个新Backbone在COCO上刷了新高,某个Transformer变体能更好地理解图片上下文。这些进展当然重要,但它们都有一个共同点——所有的“理解”,最终都止步于理解本身。
CoovallyAIHub10 小时前
深度学习·算法·计算机视觉
仅凭单目相机实现3D锥桶定位?UNet-RKNet破解自动驾驶锥桶检测难题在自动驾驶赛道场景中,锥桶定位是车辆路径规划的基础任务。然而,传统方案面临着成本高昂、Z轴误差大、计算复杂三大痛点。最新提出的UNet-RKNet架构首次将UNet应用于3D锥桶关键点回归任务,仅需单目摄像头即可输出锥桶底部中心点的3D坐标,在标准测试集上达到横向误差<5cm、纵向误差<8cm的精度,推理速度达45FPS(NVIDIA Jetson Xavier)。
zone773911 小时前
后端·算法·面试
002:RAG 入门-LangChain 读取文本本文是 refine-rag 系列教程的第二篇,带你掌握 LangChain 的各种文本数据加载方式。 本文所有代码都在:github.com/zonezoen/re…
得物技术11 小时前
算法
得物社区搜推公式融合调参框架-加乘树3.0实战近年来,搜索/推荐/广告系统在粗排(Pre-ranking)与精排(Ranking)阶段的模型训练中,呈现出一个明确的趋势:从单目标优化转向多目标建模 + 多目标融合。模型目标多、融合公式复杂,给工程维护、算法迭代效率都带来了挑战。
会员源码网1 天前
后端·算法
使用`mysql_*`废弃函数(PHP7+完全移除,导致代码无法运行)如果你维护过一些几年前的 PHP 项目,或者从网上复制过古老的教程代码,你一定对这段代码不陌生:php
木心月转码ing1 天前
算法
Hot100-Day10-T438T438找到字符串中所有字母异位词给定两个字符串 s 和 p,找到 s 中所有 p 的 异位词 的子串,返回这些子串的起始索引。不考虑答案输出的顺序。
HelloReader1 天前
算法
Wi-Fi CSI 感知技术用无线信号“看见“室内的人如果你正在做智能家居、健康监护或室内安防相关的项目,你一定遇到过这个难题:怎样在不侵犯隐私的前提下感知环境中的人?
颜酱1 天前
javascript·后端·算法
二叉树分解问题思路解题模式二叉树是算法面试的核心考点,而「分解问题」是解决二叉树类题目最通用、最高效的思维方式——将复杂的二叉树问题拆解为「根节点处理 + 左右子树递归求解」,再通过子问题的结果合并得到最终答案。本文将结合多个经典二叉树题目,详解分解思维的落地方法,覆盖普通二叉树、满二叉树、完全二叉树、最大二叉树等典型场景。
qianpeng8971 天前
算法
水声匹配场定位原理及实验匹配场定位是通过数值模拟海洋声场,进行拷贝场计算,并通过拷贝场和测量场相关匹配估计目标距离深度的一种方法。匹配场的可看作为非平面条件下的波束形成,核心思路在“匹配”二字,在海洋环境无失配条件下,匹配场的定位效果较好。 本文代码开源,地址 UWSL-MFP: 水下声源定位的匹配场算法
董董灿是个攻城狮2 天前
算法
AI视觉连载8:传统 CV 之边缘检测本节来看一个利用传统计算机视觉方法来实现图片边缘检测的方法。边缘检测是通过一些算法来识别图像中物体之间或者物体与背景之间的边界,也就是边缘。
AI软著研究员2 天前
算法
程序员必看:软著不是“面子工程”,是代码的“法律保险”作为一名敲了8年代码的程序员,我见过太多同行的无奈:熬夜3个月打磨的核心算法被竞品“照搬”,却因没有软著维权无门;创业做产品,想上架应用市场却卡在软著申请,自己写的材料因“技术描述不规范”被驳回;甚至有同事离职后,把公司未登记的代码稍作修改就当成自己的成果——这些教训,再加上我亲身经历和见证的真实案例,让我深刻意识到:软著不是企业的“面子工程”,而是程序员劳动成果的“法律保险”,更是职业路上的“硬通货”。
FunnySaltyFish2 天前
算法·kotlin·android jetpack
什么?Compose 把 GapBuffer 换成了 LinkBuffer?倘若你略微了解过 Compose Runtime,可能会知道它使用了 GapBuffer 这一数据结构来构建其 SlotTable,后者存储了 Composition 中的各类重要信息,但如今它却要被替换了!这中间发生了什么呢,咱们一起来看看。