各大公司用于生产环境的机器学习论文列表 | 开源日报 No.163

eugeneyan/applied-ml

Stars: 25.5k License: MIT

applied-ml 是一个收集和整理了各大公司在生产中应用数据科学和机器学习过程中产生的论文和博客的开源项目。 这个项目主要功能、关键特性、核心优势包括:

  • 收集整理了数据科学和机器学习在生产中的论文、文章和博客
  • 提供如何实施机器学习项目的指导,包括问题框架、技术应用情况以及研究背后的科学支持
  • 包含各种领域(如数据质量、特征存储等)下真实世界取得成果案例
  • 提供了 ML 进展总结以及应用 ML 的指南与访谈资源。

dotnet/runtime

Stars: 13.5k License: MIT

.NET runtime 是一个跨平台的运行时,支持各种类型的应用程序。该项目具有以下特点和优势:

  • 跨平台:支持多个操作系统版本
  • 社区贡献:欢迎全球范围内的贡献者参与改进项目
  • 安全性:提供安全问题报告渠道,并采取积极响应措施

collabora/WhisperSpeech

Stars: 2.2k License: MIT

WhisperSpeech 是一个通过反向 Whisper 构建的开源文本到语音系统。 该项目的主要功能、关键特性和核心优势包括:

  • 以开源模型为基础,如 Whisper from OpenAI、EnCodec from Meta 和 Vocos from Charactr Inc。
  • 训练模型使用合法授权的语音录音,并且所有代码都是开源的,因此在商业应用中始终安全可靠。
  • 目前模型基于英文 LibreLight 数据集训练,下一版本计划支持多种语言。

nextcloud/all-in-one

Stars: 3.4k License: AGPL-3.0

all-in-one 是官方的 Nextcloud 安装方法。 该项目提供了易于部署和维护的功能,包含了大多数特性在一个 Nextcloud 实例中。 主要功能、关键特性和核心优势如下:

  • 提供简单的 Web 界面,实现轻松安装和维护
  • 包含简便更新和备份通知
  • 可以通过 AIO 接口启用每日备份,并自动更新所有容器、Nextcloud 及其应用程序
  • 支持从备份存档中恢复实例
  • 集成了各种可选组件,如 Office 功能、Talk 录制服务器等
  • 具有高性能后端支持文件管理及聊天服务

apache/incubator-paimon

Stars: 1.6k License: Apache-2.0

Paimon 是一个流式数据湖平台,它提供了高速的数据摄入功能以及对变化性大量存储进行跟踪。同时,该项目还具备强大而有效率地处理海量实时分析任务能力。

  • 高速数据摄取
  • 变更数据追踪
  • 高效的实时分析
相关推荐
Raink老师5 小时前
【AI面试临阵磨枪-48】GraphRAG、多模态 RAG、自适应 RAG 原理
人工智能·ai 面试题
波动几何5 小时前
模式驱动的学术选题方法论——四种AI模式处理能力的系统建构与论证
人工智能
飞哥数智坊6 小时前
我为我的龙虾斩分身:OpenClaw 多智能体实操
人工智能·agent
七牛开发者6 小时前
HTML is the new Markdown:来自 Claude Code 团队的实践
前端·人工智能·语言模型·html
飞哥数智坊6 小时前
在二线城市做AI社群,我的五一节后到底有多疯狂?
人工智能
视***间6 小时前
智启边缘,魔盒藏锋——视程空间Pandora系列魔盒,解锁边缘计算普惠新范式
人工智能·区块链·边缘计算·ai算力·视程空间
蛐蛐蛐6 小时前
昇腾910B4上安装新版本CANN的正确流程
人工智能·python·昇腾
沪漂阿龙6 小时前
AI大模型面试题:线性回归是什么?最小二乘法、平方误差、正规方程、Ridge、Lasso 一文讲透
人工智能·机器学习·线性回归·最小二乘法
Lyon198505286 小时前
《文字定律》让AI体验,汉字逻辑与字母逻辑的差异——ChatGPT
人工智能·ai·chatgpt·ai写作
2601_957780847 小时前
Claude 4.6 对阵 GPT-5.4:2026 开发者大模型 API 选型深度解析
人工智能·python·gpt·ai·claude