各大公司用于生产环境的机器学习论文列表 | 开源日报 No.163

eugeneyan/applied-ml

Stars: 25.5k License: MIT

applied-ml 是一个收集和整理了各大公司在生产中应用数据科学和机器学习过程中产生的论文和博客的开源项目。 这个项目主要功能、关键特性、核心优势包括:

  • 收集整理了数据科学和机器学习在生产中的论文、文章和博客
  • 提供如何实施机器学习项目的指导,包括问题框架、技术应用情况以及研究背后的科学支持
  • 包含各种领域(如数据质量、特征存储等)下真实世界取得成果案例
  • 提供了 ML 进展总结以及应用 ML 的指南与访谈资源。

dotnet/runtime

Stars: 13.5k License: MIT

.NET runtime 是一个跨平台的运行时,支持各种类型的应用程序。该项目具有以下特点和优势:

  • 跨平台:支持多个操作系统版本
  • 社区贡献:欢迎全球范围内的贡献者参与改进项目
  • 安全性:提供安全问题报告渠道,并采取积极响应措施

collabora/WhisperSpeech

Stars: 2.2k License: MIT

WhisperSpeech 是一个通过反向 Whisper 构建的开源文本到语音系统。 该项目的主要功能、关键特性和核心优势包括:

  • 以开源模型为基础,如 Whisper from OpenAI、EnCodec from Meta 和 Vocos from Charactr Inc。
  • 训练模型使用合法授权的语音录音,并且所有代码都是开源的,因此在商业应用中始终安全可靠。
  • 目前模型基于英文 LibreLight 数据集训练,下一版本计划支持多种语言。

nextcloud/all-in-one

Stars: 3.4k License: AGPL-3.0

all-in-one 是官方的 Nextcloud 安装方法。 该项目提供了易于部署和维护的功能,包含了大多数特性在一个 Nextcloud 实例中。 主要功能、关键特性和核心优势如下:

  • 提供简单的 Web 界面,实现轻松安装和维护
  • 包含简便更新和备份通知
  • 可以通过 AIO 接口启用每日备份,并自动更新所有容器、Nextcloud 及其应用程序
  • 支持从备份存档中恢复实例
  • 集成了各种可选组件,如 Office 功能、Talk 录制服务器等
  • 具有高性能后端支持文件管理及聊天服务

apache/incubator-paimon

Stars: 1.6k License: Apache-2.0

Paimon 是一个流式数据湖平台,它提供了高速的数据摄入功能以及对变化性大量存储进行跟踪。同时,该项目还具备强大而有效率地处理海量实时分析任务能力。

  • 高速数据摄取
  • 变更数据追踪
  • 高效的实时分析
相关推荐
迎仔1 分钟前
05-AI与网络安全
人工智能·安全·web安全
Aric_Jones4 分钟前
后台文章发布页添加 AI 自动生成摘要功能
人工智能
9呀8 分钟前
【ros2】OccupancyGrid消息里的resolution
人工智能·机器人
DuHz10 分钟前
通过超宽带信号估计位置——论文精读
论文阅读·人工智能·机器学习·自动驾驶·汽车
静听松涛13311 分钟前
大语言模型长上下文技术突破:如何处理超长文本的注意力机制与架构图解
人工智能·语言模型·架构
我送炭你添花12 分钟前
电子世界的奇妙冒险:从一个电阻开始(系列目录)
人工智能·单片机·嵌入式硬件·fpga开发
数据智能老司机13 分钟前
用于构建多智能体系统的智能体架构模式——可解释性与合规性的智能体模式
人工智能·llm·agent
数据智能老司机13 分钟前
用于构建多智能体系统的智能体架构模式——人类—智能体交互模式
人工智能·llm·agent
一个处女座的程序猿14 分钟前
LLMs之Benchmark:《CL-bench: A Benchmark for Context Learn》翻译与解读
人工智能·benchmark·llms
Node全栈15 分钟前
AI时代,不准备换行吗?
人工智能