#神经网络

果冻人工智能15 小时前
#人工智能·#ai员工·#神经网络·#ai
小了 60,500 倍,但更强;AI 的“深度诅咒”作者:Ignacio de Gregorio几周前,我们看到 Anthropic 尝试训练 Claude 去通关宝可梦。模型是有点进展,但离真正通关还差得远。
果冻人工智能15 天前
#人工智能·#ai应用·#ai员工·#神经网络·#ai
AI 代理的未来是事件驱动的AI 代理即将彻底改变企业运营,它们具备自主解决问题的能力、适应性工作流以及可扩展性。但真正的挑战并不是构建更好的模型。
果冻人工智能17 天前
#人工智能·#ai员工·#神经网络·#ai
AI编程:最疯狂的MCP服务器你一定要试试我还记得我第一次听说MCP(模型上下文协议)的时候,我心想:“哈?又一个花里胡哨的缩写,这个世界已经快被这些缩写淹没了!”
果冻人工智能20 天前
#人工智能·#ai应用·#ai员工·#神经网络·#ai
城市林业的无声革命:人工智能与古老生态学如何重新设计城市城市林业的无声革命:人工智能与古老生态学如何重新设计城市在摩天大楼的阴影下,一场静悄悄的变革正在发生——它融合了硅芯片与古老根系,算法与原住民智慧。
果冻人工智能21 天前
#人工智能·#ai应用·#ai员工·#神经网络·#ai
阿里巴巴 QwQ-32B真的超越了 DeepSeek R-1吗?本文作者的观点:QwQ-32B 作为小型开源 AI 模型,在数学、编程等任务上表现接近甚至超越 DeepSeek-R1 671B模型,同时计算资源占用大幅降低,使其更易部署和使用。然而,在逻辑推理等方面仍存在推理不一致和语言混杂等问题,有待优化。作者总体认可 QwQ-32B 的实力,并认为它代表了 AI 发展向“小而高效”方向演进的趋势,可能冲击 OpenAI 等收费模式的市场格局。
果冻人工智能1 个月前
#人工智能·#ai应用·#ai员工·#神经网络·#ai
机器人技术的突破让OpenAI过时了机器人技术的突破让OpenAI过时了Ignacio de Gregorio最近,Figure AI,一家价值数十亿美元的AI机器人公司,宣布取消与OpenAI的合作伙伴关系,这一举动看起来是相当大胆的。在此之前,机器人的大脑是一个经过精细调教的OpenAI模型(由OpenAI专门为他们的机器人构建的模型),但该公司的公告暗示,他们在内部取得了一个突破,允许他们训练自己的模型。
果冻人工智能1 个月前
#人工智能·#ai员工·#神经网络·#ai
GPT-4.5 感觉有点拉胯,但其实是 OpenAI 迄今为止最大的一步赌注Alberto RomeroI. GPT-4.5 就是起跳前的助跑那一步OpenAI 推出了 GPT-4.5(官方博客、系统卡片、演示视频),这是他们最新也是目前最大的一款 AI 模型。他们其实一年多前就开始放风,说它叫 Orion,结果很多人还以为是 GPT-5。现在终于来了……但感觉吧,有点拉胯。至少看起来是这样。今天我们就聊聊这个“是”和“看起来是”之间的微妙区别,到底咋回事。
果冻人工智能1 个月前
#人工智能·#ai代理·#ai应用·#ai员工·#神经网络·#ai
掌握领域驱动微服务中的聚合与实体—— 从遗留单体系统转型为现代分布式系统的实战经验你好啊,我是一名经验丰富的软件工程师,专注于大规模应用的设计。多年来,我见过各种架构——从庞大的单体架构,到精细调整过的微服务基础设施。
果冻人工智能1 个月前
#人工智能·#ai员工·#神经网络·#ai
Featurewiz-Polars:一种强大且可扩展的特征选择解决方案,适用于XGBoost前言:“Featurewiz-Polars”是一个用于特征工程的 Python 库,结合了特征选择和特征生成的功能。它基于“Polars”,这是一个高性能的 DataFrame 库,用于处理大型数据集,具有类似 Pandas 的 API 但更高效,尤其在处理大数据时。Featurewiz-Polars 专注于通过自动化方式,快速从数据中提取出最有意义的特征,帮助机器学习模型提高性能。
果冻人工智能1 个月前
#人工智能·#ai员工·#神经网络·#ai
DeepSeek R1 简明指南:架构、训练、本地部署及硬件要求DeepSeek 通过强化学习(RL)提出了一种创新的改进大规模语言模型(LLM)推理能力的方法,这在他们最近关于 DeepSeek-R1 的论文中有详细介绍。这项研究代表了在不依赖于大量有监督微调的情况下,通过纯强化学习提升 LLM 解决复杂问题能力的重大进展。
果冻人工智能1 个月前
#人工智能·#ai代理·#ai应用·#ai员工·#神经网络·#ai
如何训练LLM“思考”(像o1和DeepSeek-R1一样, 高级推理模型解析2024年9月,OpenAI发布了它的o1模型,该模型基于大规模强化学习训练,赋予了它“高级推理”能力。不幸的是,他们是如何做到这一点的细节从未被公开披露。然而,今天,DeepSeek(一个AI研究实验室)成功复现了这种推理行为,并公开了他们方法的完整技术细节。在这篇文章中,我将讨论这一创新背后的关键思想,并描述它们在底层是如何运作的。
果冻人工智能2 个月前
#人工智能·#ai应用·#ai员工·#神经网络·#ai
从 Windows Forms 到微服务的经验教训如果说软件开发中有什么不变的东西,那就是变化。在 .NET 生态系统中摸爬滚打的这二十年里,我见证了各种框架的起起落落,目睹了容器化的崛起,也曾为微服务架构摇旗呐喊——而在几年前,微服务对许多人来说还只是晦涩难懂的概念。
果冻人工智能2 个月前
#人工智能·#ai代理·#ai应用·#ai员工·#神经网络·#ai
让我们从零开始使用PyTorch构建一个轻量级的词嵌入模型在我之前写的一篇文章中,我们学习了如何使用PyTorch的nn.Embedding层将单词转换为稠密向量。但由于该嵌入层是未经训练的,这些向量并没有任何语义含义。默认情况下,PyTorch会使用随机权重初始化嵌入层,这使得生成的向量基本上是毫无意义的。今天,我们要改变这一点,并希望赋予我们的嵌入一些真正的含义。
果冻人工智能2 个月前
#人工智能·#ai代理·#ai应用·#ai员工·#cnn·#chatgpt·#神经网络·#ai
在 PyTorch 中理解词向量,将单词转换为有用的向量表示你要是想构建一个大型语言模型,首先得掌握词向量的概念。幸运的是,这个概念很简单,也是本系列文章的一个完美起点。
果冻人工智能2 个月前
#人工智能·#ai代理·#ai应用·#ai员工·#神经网络·#ai
跟着蚂蚁走,它们知道路:用 ACO-ToT 增强 LLM 推理能力跟着蚂蚁走,它们知道路:用 ACO-ToT 增强 LLM 推理能力利用群体智能和思维树优化解锁高级 AI 推理能力