各大公司用于生产环境的机器学习论文列表 | 开源日报 No.163

eugeneyan/applied-ml

Stars: 25.5k License: MIT

applied-ml 是一个收集和整理了各大公司在生产中应用数据科学和机器学习过程中产生的论文和博客的开源项目。 这个项目主要功能、关键特性、核心优势包括:

  • 收集整理了数据科学和机器学习在生产中的论文、文章和博客
  • 提供如何实施机器学习项目的指导,包括问题框架、技术应用情况以及研究背后的科学支持
  • 包含各种领域(如数据质量、特征存储等)下真实世界取得成果案例
  • 提供了 ML 进展总结以及应用 ML 的指南与访谈资源。

dotnet/runtime

Stars: 13.5k License: MIT

.NET runtime 是一个跨平台的运行时,支持各种类型的应用程序。该项目具有以下特点和优势:

  • 跨平台:支持多个操作系统版本
  • 社区贡献:欢迎全球范围内的贡献者参与改进项目
  • 安全性:提供安全问题报告渠道,并采取积极响应措施

collabora/WhisperSpeech

Stars: 2.2k License: MIT

WhisperSpeech 是一个通过反向 Whisper 构建的开源文本到语音系统。 该项目的主要功能、关键特性和核心优势包括:

  • 以开源模型为基础,如 Whisper from OpenAI、EnCodec from Meta 和 Vocos from Charactr Inc。
  • 训练模型使用合法授权的语音录音,并且所有代码都是开源的,因此在商业应用中始终安全可靠。
  • 目前模型基于英文 LibreLight 数据集训练,下一版本计划支持多种语言。

nextcloud/all-in-one

Stars: 3.4k License: AGPL-3.0

all-in-one 是官方的 Nextcloud 安装方法。 该项目提供了易于部署和维护的功能,包含了大多数特性在一个 Nextcloud 实例中。 主要功能、关键特性和核心优势如下:

  • 提供简单的 Web 界面,实现轻松安装和维护
  • 包含简便更新和备份通知
  • 可以通过 AIO 接口启用每日备份,并自动更新所有容器、Nextcloud 及其应用程序
  • 支持从备份存档中恢复实例
  • 集成了各种可选组件,如 Office 功能、Talk 录制服务器等
  • 具有高性能后端支持文件管理及聊天服务

apache/incubator-paimon

Stars: 1.6k License: Apache-2.0

Paimon 是一个流式数据湖平台,它提供了高速的数据摄入功能以及对变化性大量存储进行跟踪。同时,该项目还具备强大而有效率地处理海量实时分析任务能力。

  • 高速数据摄取
  • 变更数据追踪
  • 高效的实时分析
相关推荐
一只乔哇噻4 分钟前
java后端工程师+AI大模型进修ing(研一版‖day55)
人工智能
小毅&Nora32 分钟前
【AI微服务】【Spring AI Alibaba】② Agent 深度实战:构建可记忆、可拦截、可流式的智能体系统
人工智能·微服务·spring-ai
陈天伟教授1 小时前
基于学习的人工智能(7)机器学习基本框架
人工智能·学习
千里念行客2401 小时前
昂瑞微正式启动科创板IPO发行
人工智能·科技·信息与通信·射频工程
撸码猿2 小时前
《Python AI入门》第10章 拥抱AIGC——OpenAI API调用与Prompt工程实战
人工智能·python·aigc
双翌视觉2 小时前
双翌全自动影像测量仪:以微米精度打造智能化制造
人工智能·机器学习·制造
编程小白_正在努力中3 小时前
神经网络深度解析:从神经元到深度学习的进化之路
人工智能·深度学习·神经网络·机器学习
无风听海3 小时前
神经网络之经验风险最小化
人工智能·深度学习·神经网络
音视频牛哥3 小时前
轻量级RTSP服务的工程化设计与应用:从移动端到边缘设备的实时媒体架构
人工智能·计算机视觉·音视频·音视频开发·rtsp播放器·安卓rtsp服务器·安卓实现ipc功能
该用户已不存在4 小时前
在 Gemini CLI 中使用 Gemini 3 Pro 实操指南
人工智能·ai编程·gemini