机器学习

有为少年6 分钟前
人工智能·深度学习·神经网络·算法·机器学习·大模型·预训练
告别“唯语料论”:用合成抽象数据为大模型开智在过去几年中,大语言模型(LLM)的训练范式几乎是一成不变的:在海量的自然语言网络语料(Web-scale corpora)上进行下一个词预测(Next-token prediction)。Scaling Law(缩放定律)被视为不可挑战的真理,仿佛只要给模型喂入更多的人类文本、投入更多的算力,通用人工智能(AGI)就会自动涌现。然而,这种依赖于“大力出奇迹”的路径正面临空前严峻的挑战:
AI医影跨模态组学7 分钟前
人工智能·深度学习·机器学习·ct·医学·医学影像
J Transl Med(IF=7.5)苏州大学附属第一医院秦颂兵教授等团队:基于机器学习影像组学的食管鳞癌预后评估列线图01文献学习今天分享的文献是由苏州大学附属第一医院秦颂兵教授等团队于2025年12月在《Journal of Translational Medicine》(中科院2区,IF=7.5)上发表的研究“A nomogram integrating machine learning-derived CT radiomics and clinical characteristics for prognostic assessment in patients with locally advanced esopha
春日见2 小时前
linux·人工智能·机器学习·计算机视觉·自动驾驶
自驾算法的日常工作?如何提升模型性能?一个成熟的算法训练流程通常包含以下 7 个核心阶段:“垃圾进,垃圾出 (Garbage in, garbage out)” 是深度学习的金科玉律。
*JOKER3 小时前
人工智能·深度学习·机器学习·大模型·生成模型·flow matching
Flow Matching&生成算法今天学习flow matching算法。Flow matching是近年来生成模型领域中快速崛起的一类新方法。许多先进模型如stable diffusion3 imagen3都采用了它的核心思想。他通过直接学习概率流的方式,将简单分布平滑地变为复杂的数据分布,比传统扩散模型更高效、训练更稳,采样更快。Flow match解决了过去噪声预测不稳定、采样步骤多等问题,为下一代生成模型奠定了重要的基础。
red1giant_star4 小时前
安全·机器学习
浅析XSS原理与分类——含payload合集和检测与防护思路跨站脚本(XSS)是Web安全领域最古老、最普遍的漏洞之一。其核心本质是数据与代码边界的混淆:攻击者将恶意脚本(通常是JavaScript)作为数据注入到Web应用中,当浏览器渲染页面时,这些数据被当作代码执行,从而导致信息泄露、会话劫持等后果。
霖大侠5 小时前
人工智能·深度学习·算法·机器学习·transformer
Wavelet Meets Adam: Compressing Gradients forMemory-Efficient Training大型语言模型(LLMs)在多种自然语言处理任务中展现出了卓越的性能。然而,其庞大的参数规模在训练过程中带来了显著的内存挑战,尤其是在使用像Adam这样内存消耗较高的优化器时。现有的内存高效算法通常依赖于奇异值分解投影或权重冻结等技术。尽管这些方法有助于缓解内存限制,但与全秩更新相比,它们通常会产生次优的结果。在本文中,我们探索了超越低秩训练的内存高效方法,提出了一种名为梯度小波变换(GWT)的创新解决方案。该方法通过将小波变换应用于梯度,显著降低了维护优化器状态所需的内存需求。我们证明了GWT能够与高内存
源码之家6 小时前
爬虫·python·机器学习·django·flask·课程设计·美食
计算机毕业设计:基于Python的美食推荐分析系统 Django框架 爬虫 协同过滤推荐算法 可视化 推荐系统 数据分析 大数据(建议收藏)✅博主介绍:✌全网粉丝50W+,前互联网大厂软件研发、集结硕博英豪成立软件开发工作室,专注于计算机相关专业项目实战6年之久,累计开发项目作品上万套。凭借丰富的经验与专业实力,已帮助成千上万的学生顺利毕业,选择我们,就是选择放心、选择安心毕业✌ > 🍅想要获取完整文章或者源码,或者代做,拉到文章底部即可与我联系了。🍅
badhope6 小时前
人工智能·深度学习·机器学习·数据挖掘·github
概率论如何让机器学习不再玄学别被“概率”俩字吓退!它不是赌场骰子,而是你训练的每个模型背后默默记账的会计、预测未来的天气预报员、以及在千万维空间里为你打手电筒的向导。 本文不堆定义、不抄教科书,用真实代码+生活类比+可运行公式+踩坑现场复盘,带你把贝叶斯、似然、KL散度这些“高冷名词”,变成你调试模型时脱口而出的日常用语。
阿钱真强道6 小时前
人工智能·深度学习·机器学习·cnn·分类算法·lenet
02 从 MLP 到 LeNet:数据、标签和任务:机器学习到底在解决什么问题?机器学习初学阶段最常见的问题,不是公式太难,也不是代码太复杂,而是很多基础概念彼此之间没有真正连起来。
阿钱真强道7 小时前
人工智能·机器学习·softmax·分类模型·sigmoid·深度学习入门
04 从 MLP 到 LeNet:sigmoid 和 softmax 到底在做什么?为什么输出层需要它们?在分类模型中,输入经过前面的计算之后,最后并不会天然地变成“这是 3”或者“这是猫”这样的最终答案。更常见的情况是,模型先得到一组原始数值,再由输出层把这些数值转换成更适合分类任务使用的结果。
醉舞经阁半卷书17 小时前
人工智能·机器学习
从零到1了解Agent Skills🧠 形象比喻:LLM就像一位知识渊博但行动受限的学者,能回答各种问题,但无法亲自去图书馆查资料或操作实验设备。
AI医影跨模态组学7 小时前
人工智能·深度学习·机器学习·医学·医学影像
J Immunother Cancer(IF=10.6)中山大学孙逸仙纪念医院陈柏深等团队:动态时间数据预测NSCLC新辅助免疫化疗主要病理反应01文献学习今天分享的文献是由中山大学第五附属医院曹庆东、中山大学孙逸仙纪念医院陈柏深等团队于2025年10月在《Journal for ImmunoTherapy of Cancer》(中科院1区top,IF=10.6)上发表的研究“Attention-guided framework for integrative omics and temporal dynamics in predicting major pathological response in neoadjuvant immunoche
小吴同学·9 小时前
人工智能·机器学习
吴恩达机器学习下:二分类问题、逻辑回归、过拟合问题26.动机_哔哩哔哩_bilibili吴恩达机器学习笔记 - Sanzo Blog什么是分类问题?——输出变量 y 只能取少数几个离散值,而不是无限范围内的任意数值。
程序员Shawn9 小时前
人工智能·机器学习·逻辑回归
【机器学习 | 第四篇】- 逻辑回归学习完前面的回归模型,现在我们来学习最重要的一个二分类模型,在后面的深度学习中我们也会是用到这个模型作为我们的激活函数,它其实也是基于前面的线性回归模型的得分,把值域限制到[0,1]之间,通常来说以0.5作为分类阈值来进行分类。
Flying pigs~~9 小时前
算法·随机森林·机器学习·nlp·文本分类
基于TF_IDF和Bagging的文本分类全过程tips:该模型用于baseline!基于TF-IDF特征工程和Bagging随机森林算法(sklearn - RandomForestClassifier)实现文本分类的基线模型(Baseline Model)功能,最终目的是通过模型算法提高推荐系统的用户点击率和访问量
STLearner10 小时前
大数据·论文阅读·人工智能·python·深度学习·学习·机器学习
AI论文速读 | 元认知监控赋能深度搜索:认知神经科学启发的分层优化框架论文标题:Deep Search with Hierarchical Meta-Cognitive Monitoring Inspired by Cognitive Neuroscience
2501_9269783310 小时前
人工智能·深度学习·机器学习·ai写作·agi
《与AI的妄想对话:如何给机器人造灵魂?》本文为个人想法分享,是一种幻觉创作,只图一乐。 #赛博哲学 #概念艺术 #AI幻想 #科幻微小说提问: 你分析一下下面这段文章里面的harness它的构建原则。我觉得他和我们这个理论里面说的某一些东西我感觉很像好像是这种智能的或者说锚点定义的简化结构板。 抖音解读:清华与哈工大联合提出了一项新的AI Agent技术方案NLAH,核心思路是将原本分散在代码、配置文件里的Agent控制逻辑,改用自然语言编写成独立的harness文件,再通过共享运行时IHR来解释执行。 这份自然语言harness文件包含契约、
程序员Shawn10 小时前
人工智能·机器学习·线性回归
【机器学习 | 第三篇】- 线性回归想象一下:如果你知道一个人的身高,能否预测他的体重?如果你了解房屋的面积、位置、楼层等信息,能否估算出它的价格?这些看似神奇的问题,都可以通过线性回归来解决! 线性回归是机器学习中最基础、最经典的算法之一,也是踏入机器学习殿堂的必经之路。它就像一把神奇的钥匙,能够帮我们打开从数据中发现规律、预测未来的大门。 本篇将从最基础的概念出发,带你逐步理解:
Master_oid11 小时前
人工智能·机器学习
机器学习36:机器学习概述本文对机器学习的基础概念进行了系统性回顾。文章阐述了人工智能、机器学习与深度学习三者之间的层级关系,区分了基于规则与基于模型两种学习方式。进一步介绍了机器学习发展的三要素(数据、算法、算力)及常用术语(样本、特征、标签等)。文中总结了有监督、无监督、半监督与强化学习四类主要算法,并梳理了从数据获取到模型评估的完整建模流程。此外,还探讨了拟合问题的类型与泛化能力,并简要介绍了Scikit-learn开发环境。本文为理解机器学习提供了全面的知识框架。