架构

铁蛋AI编程实战7 分钟前
人工智能·架构·开源
大模型本地轻量化微调+端侧部署实战(免高端GPU/16G PC可运行)摘要:本文基于国产轻量化大模型Qwen-2-7B、DeepSeek-R1-7B,结合LMDeploy量化、PEFT-LoRA低成本微调技术,实现普通16G内存PC即可完成的大模型本地轻量化处理与多端侧部署,覆盖4bit量化、行业场景LoRA微调、Windows本地运行、安卓端部署全流程,附完整可运行代码、性能优化方案与高频避坑指南,全程无需高端GPU,适配个人开发者与中小企业低成本AI落地需求。
Warren2Lynch21 分钟前
人工智能·架构·软件工程
2026年专业软件工程与企业架构的智能化演进在2026年,生成式人工智能已从早期的技术噱头,演变为推动专业软件工程与企业架构流程革新的核心力量。然而,真正的技术突破并非单纯依赖“图像生成”或“文本转图”这类表面功能,而在于是否具备对建模语义的深层理解与工程逻辑的精准表达。
vx-bot5556663 小时前
架构·企业微信·边缘计算
企业微信接口在边缘计算场景下的协同处理架构随着物联网、5G和工业互联网技术的快速发展,边缘计算已成为处理实时性要求高、数据隐私敏感业务的重要计算范式。在这种场景下,企业微信作为连接人与系统的协同平台,其接口集成面临网络条件复杂、设备资源受限、数据实时性要求高等全新挑战。本文将深入探讨如何设计适用于边缘计算环境的企业微信接口协同架构,实现边缘智能与云端协同的高效融合。
橙露4 小时前
运维·网络·tcp/ip·react.js·架构
NNG通信框架:现代分布式系统的通信解决方案与应用场景深度分析在当今高速发展的数字化时代,分布式系统已成为企业级应用的基础架构,而高效可靠的通信机制则是分布式系统的核心支柱。根据国际数据公司(IDC)发布的《2024年全球云计算与边缘计算趋势报告》,到2025年,超过75%的企业关键业务将部署在分布式架构上,这对通信框架的性能、可靠性和易用性提出了前所未有的要求。在这样的技术背景下,NNG(Nanomsg Next Generation)作为第二代轻量级高性能通信库,正逐渐成为解决现代分布式系统通信挑战的重要选择。
TracyCoder1236 小时前
redis·架构·华为云
解读华为云Redis Proxy集群规格:架构、规格与带宽性能随着互联网业务规模急剧上涨,传统单节点Redis架构已经难以支持亿级访问场景与海量缓存数据。华为云Redis Proxy集群通过引入“代理层”,构建了一个兼顾高性能、高可用与可扩展的分布式缓存系统。
SmartBrain7 小时前
人工智能·算法·语言模型·架构·aigc·ocr
OCR 模型在医疗场景的选型研究随着医疗信息化进程的深入推进,电子病历识别和医学影像报告分析等 OCR 应用需求日益增长。然而,医疗数据的隐私敏感性和合规要求使得本地化部署成为必然选择。本研究聚焦 Qwen3-VL、DeepSeek OCR 等主流大厂模型在医疗场景下的准确率表现,为医疗机构的技术选型提供决策依据。
老百姓懂点AI7 小时前
人工智能·架构
[RAG架构] 拒绝向量检索幻觉:智能体来了(西南总部)AI agent指挥官的GraphRAG实战与AI调度官的混合索引策略在构建企业级知识库时,我们最初都采用了标准的 Naive RAG(分块 + 向量数据库)。但很快遇到了 “碎片化陷阱”:
eso19838 小时前
微服务·云原生·架构
如何确保程序化广告系统中微服务架构的高可用性和可扩展性?在广告业务(DSP/DMP/ADX/ 聚合 SDK)的微服务架构中,高可用性(HA) 核心是 “无单点、故障自愈、容灾兜底”,保证系统持续可用;可扩展性(Scalability) 核心是 “水平扩容、解耦松绑、弹性适配”,支撑流量 / 数据 / 功能的指数级增长。结合广告系统高并发、低延迟、海量数据的特性,以下是分维度的落地保障方案:
Gofarlic_oms18 小时前
大数据·运维·人工智能·分布式·架构·自动化
通过Kisssoft API接口实现许可证管理自动化集成Kisssoft API接口实现许可证管理自动化集成作为一名IT部门经理,我经常被问到一个问题:“我们怎么才能避免手动管理许可证导致的效率低下和错误频发?”这个问题犹如定时炸弹,一旦没有解决,就会在系统部署、软件使用和合规检查中引发一系列麻烦。是在我们不断引入新应用、云服务和第三方工具的今天,许可证管理的复杂度越来越难以被人工处理。许可证过期了怎么办?有没有被授权的合法使用?能不能快速找到谁在使用哪个许可证? 这些问题不仅影响用户体验,还可能带来法律和安全风险。,今天我就想和大家分享我们是如何Kissso
逻极8 小时前
python·ai·架构·agent·ai编程·moltbot·openclaw
OpenClaw「Clawdbot/Moltbot」 深入解析:核心架构深度剖析OpenClaw 是2026年全球最火爆的开源自主式AI Agent项目,由PSPDFKit创始人Peter Steinberger主导开发,历经Clawdbot、Moltbot两次更名后,于2026年1月30日正式定名OpenClaw并完成全生态统一。它的核心定位是本地运行、可自托管的AI执行引擎,打破了传统AI工具仅“提供建议”的局限,让普通用户通过WhatsApp、Telegram、Discord等熟悉的聊天工具,直接指挥AI完成真实可落地的现实任务,是目前开源领域将“Agent智能规划”与“本地执
pcm1235679 小时前
java·c语言·架构
设计C/S架构的IM通信软件(3)在之前的功能基础上,可以区分开群聊和私聊引入哈希表来实现,具体代码如下:客户端类:服务器端:线程通信类:
岁岁种桃花儿9 小时前
架构·去中心化·区块链
深度解析DolphinScheduler核心架构:去中心化调度的设计与实践在大数据时代,数据研发、ETL处理、批处理任务等场景中,复杂的任务依赖、海量任务的并发调度、系统的高可用性要求,对任务调度平台提出了严峻挑战。
hellojackjiang20119 小时前
分布式·网络安全·架构·信息与通信
如何保障分布式IM聊天系统的消息可靠性(即消息不丢)本文引用了45岁老架构师尼恩的技术分享,有修订和重新排版。接上篇《如何保障分布式IM聊天系统的消息有序性(即消息不乱)》,本文主要聚焦分布式IM聊天系统消息可靠性问题,即如何保证消息不丢失。
彷徨的蜗牛10 小时前
架构
架构思维的精髓:在解构与集成间驱动数字化演进在快速迭代的数字时代,软件架构已不再是冰冷的技术图纸,而是连接复杂业务现实与数字化抽象世界的核心协议。优秀的架构思维,本质上是在混沌中建立秩序、在约束中寻找平衡的艺术。
esmap10 小时前
人工智能·低代码·ai·架构·编辑器·智慧城市
技术解构:ESMAP AI数字孪生赋能传统行业转型的全链路技术方案传统行业智能化转型的核心痛点在于“物理场景数字化难、数据价值挖掘浅、决策响应滞后”。ESMAP以“AI驱动+虚实共生”为核心,构建了覆盖“数据采集-孪生建模-智能分析-虚实联动”的全链路AI数字孪生技术体系,通过架构创新、算法突破与模块化设计,实现对传统行业物理场景的精准映射与智能赋能,为制造、能源、物流等领域提供可落地的技术转型路径。
喜欢吃豆10 小时前
人工智能·架构
对象存储架构演进与AI大模型时代的深度融合:从S3基础到万亿参数训练的技术全景随着生成式人工智能(Generative AI)和大语言模型(LLM)的爆发式增长,云计算基础设施的重心正在发生深刻的结构性转移。在传统的Web应用和企业IT架构中,块存储(Block Storage)和文件存储(File Storage)分别主导了数据库和应用服务领域。然而,在AI大模型时代,对象存储(Object Storage,简称OS)——以Amazon S3为代表——凭借其无限的扩展性、扁平化的命名空间以及与现代深度学习框架的深度集成,已无可争议地成为AI数据基础设施的“底座”。
马武寨山的猴子10 小时前
架构·transformer·moe·ktransformers·sglang
【KTransformers+SGLang】:异构推理架构融合与性能实测全解析期望使用KTransformers的将部分模型加载到内存和cpu上,达到在GPU资源比较匮乏的情况下运行一些超过显存的模型,并且达到一定的token数,可以多人同时使用
铁蛋AI编程实战11 小时前
人工智能·架构·开源
DeepSeek mHC 架构 + Agent 实战大模型开发指南摘要:DeepSeek推出的mHC(流形约束超连接)架构引发了AI算力革命,通过Transformer底层重构,在有限算力下实现10倍以上效率提升,让普通人无需高端GPU也能落地企业级大模型与Agent开发。本文从mHC架构底层原理切入,结合完整可运行代码,实现DeepSeek-V3.2(mHC架构)的快速部署与自动编程Agent开发,同时整理实战高频避坑点与算力优化技巧,兼顾技术深度与落地实用性,普通PC+轻量云服务器即可全程复现。
乾元11 小时前
运维·网络·人工智能·深度学习·安全·架构·自动化
暗网情报:自动化采集与情感分析在威胁狩猎中的应用⚠️ 免责声明 本文仅用于网络安全技术交流与学术研究。文中涉及的技术、代码和工具仅供安全从业者在获得合法授权的测试环境中使用。任何未经授权的攻击行为均属违法,读者需自行承担因不当使用本文内容而产生的一切法律责任。技术无罪,请将其用于正途。干网安,请记住,“虽小必牢”(虽然你犯的事很小,但你肯定会坐牢)。