各大公司用于生产环境的机器学习论文列表 | 开源日报 No.163

eugeneyan/applied-ml

Stars: 25.5k License: MIT

applied-ml 是一个收集和整理了各大公司在生产中应用数据科学和机器学习过程中产生的论文和博客的开源项目。 这个项目主要功能、关键特性、核心优势包括:

  • 收集整理了数据科学和机器学习在生产中的论文、文章和博客
  • 提供如何实施机器学习项目的指导,包括问题框架、技术应用情况以及研究背后的科学支持
  • 包含各种领域(如数据质量、特征存储等)下真实世界取得成果案例
  • 提供了 ML 进展总结以及应用 ML 的指南与访谈资源。

dotnet/runtime

Stars: 13.5k License: MIT

.NET runtime 是一个跨平台的运行时,支持各种类型的应用程序。该项目具有以下特点和优势:

  • 跨平台:支持多个操作系统版本
  • 社区贡献:欢迎全球范围内的贡献者参与改进项目
  • 安全性:提供安全问题报告渠道,并采取积极响应措施

collabora/WhisperSpeech

Stars: 2.2k License: MIT

WhisperSpeech 是一个通过反向 Whisper 构建的开源文本到语音系统。 该项目的主要功能、关键特性和核心优势包括:

  • 以开源模型为基础,如 Whisper from OpenAI、EnCodec from Meta 和 Vocos from Charactr Inc。
  • 训练模型使用合法授权的语音录音,并且所有代码都是开源的,因此在商业应用中始终安全可靠。
  • 目前模型基于英文 LibreLight 数据集训练,下一版本计划支持多种语言。

nextcloud/all-in-one

Stars: 3.4k License: AGPL-3.0

all-in-one 是官方的 Nextcloud 安装方法。 该项目提供了易于部署和维护的功能,包含了大多数特性在一个 Nextcloud 实例中。 主要功能、关键特性和核心优势如下:

  • 提供简单的 Web 界面,实现轻松安装和维护
  • 包含简便更新和备份通知
  • 可以通过 AIO 接口启用每日备份,并自动更新所有容器、Nextcloud 及其应用程序
  • 支持从备份存档中恢复实例
  • 集成了各种可选组件,如 Office 功能、Talk 录制服务器等
  • 具有高性能后端支持文件管理及聊天服务

apache/incubator-paimon

Stars: 1.6k License: Apache-2.0

Paimon 是一个流式数据湖平台,它提供了高速的数据摄入功能以及对变化性大量存储进行跟踪。同时,该项目还具备强大而有效率地处理海量实时分析任务能力。

  • 高速数据摄取
  • 变更数据追踪
  • 高效的实时分析
相关推荐
风象南7 小时前
我把大脑开源给了AI
人工智能·后端
Johny_Zhao9 小时前
OpenClaw安装部署教程
linux·人工智能·ai·云计算·系统运维·openclaw
飞哥数智坊10 小时前
我帮你读《一人公司(OPC)发展研究》
人工智能
冬奇Lab13 小时前
OpenClaw 源码精读(3):Agent 执行引擎——AI 如何「思考」并与真实世界交互?
人工智能·aigc
没事勤琢磨15 小时前
如何让 OpenClaw 控制使用浏览器:让 AI 像真人一样操控你的浏览器
人工智能
用户51914958484515 小时前
CrushFTP 认证绕过漏洞利用工具 (CVE-2024-4040)
人工智能·aigc
牛马摆渡人52815 小时前
OpenClaw实战--Day1: 本地化
人工智能
前端小豆15 小时前
玩转 OpenClaw:打造你的私有 AI 助手网关
人工智能
BugShare15 小时前
写一个你自己的Agent Skills
人工智能·程序员
机器之心16 小时前
英伟达护城河被AI攻破,字节清华CUDA Agent,让人人能搓CUDA内核
人工智能·openai