各大公司用于生产环境的机器学习论文列表 | 开源日报 No.163

eugeneyan/applied-ml

Stars: 25.5k License: MIT

applied-ml 是一个收集和整理了各大公司在生产中应用数据科学和机器学习过程中产生的论文和博客的开源项目。 这个项目主要功能、关键特性、核心优势包括:

  • 收集整理了数据科学和机器学习在生产中的论文、文章和博客
  • 提供如何实施机器学习项目的指导,包括问题框架、技术应用情况以及研究背后的科学支持
  • 包含各种领域(如数据质量、特征存储等)下真实世界取得成果案例
  • 提供了 ML 进展总结以及应用 ML 的指南与访谈资源。

dotnet/runtime

Stars: 13.5k License: MIT

.NET runtime 是一个跨平台的运行时,支持各种类型的应用程序。该项目具有以下特点和优势:

  • 跨平台:支持多个操作系统版本
  • 社区贡献:欢迎全球范围内的贡献者参与改进项目
  • 安全性:提供安全问题报告渠道,并采取积极响应措施

collabora/WhisperSpeech

Stars: 2.2k License: MIT

WhisperSpeech 是一个通过反向 Whisper 构建的开源文本到语音系统。 该项目的主要功能、关键特性和核心优势包括:

  • 以开源模型为基础,如 Whisper from OpenAI、EnCodec from Meta 和 Vocos from Charactr Inc。
  • 训练模型使用合法授权的语音录音,并且所有代码都是开源的,因此在商业应用中始终安全可靠。
  • 目前模型基于英文 LibreLight 数据集训练,下一版本计划支持多种语言。

nextcloud/all-in-one

Stars: 3.4k License: AGPL-3.0

all-in-one 是官方的 Nextcloud 安装方法。 该项目提供了易于部署和维护的功能,包含了大多数特性在一个 Nextcloud 实例中。 主要功能、关键特性和核心优势如下:

  • 提供简单的 Web 界面,实现轻松安装和维护
  • 包含简便更新和备份通知
  • 可以通过 AIO 接口启用每日备份,并自动更新所有容器、Nextcloud 及其应用程序
  • 支持从备份存档中恢复实例
  • 集成了各种可选组件,如 Office 功能、Talk 录制服务器等
  • 具有高性能后端支持文件管理及聊天服务

apache/incubator-paimon

Stars: 1.6k License: Apache-2.0

Paimon 是一个流式数据湖平台,它提供了高速的数据摄入功能以及对变化性大量存储进行跟踪。同时,该项目还具备强大而有效率地处理海量实时分析任务能力。

  • 高速数据摄取
  • 变更数据追踪
  • 高效的实时分析
相关推荐
Hello123网站32 分钟前
GLM-4-Flash:智谱AI推出的首个免费API服务,支持128K上下文
人工智能·ai工具
试剂界的爱马仕35 分钟前
胶质母细胞瘤对化疗的敏感性由磷脂酰肌醇3-激酶β选择性调控
人工智能·科技·算法·机器学习·ai写作
青岛佰优联创新科技有限公司1 小时前
移动板房的网络化建设
服务器·人工智能·云计算·智慧城市
ajassi20001 小时前
开源 Arkts 鸿蒙应用 开发(十八)通讯--Ble低功耗蓝牙服务器
华为·开源·harmonyos
双向331 小时前
私有化部署全攻略:开源模型本地化改造的性能与安全评测
人工智能
189228048611 小时前
NY243NY253美光固态闪存NY257NY260
大数据·网络·人工智能·缓存
AI波克布林1 小时前
发文暴论!线性注意力is all you need!
人工智能·深度学习·神经网络·机器学习·注意力机制·线性注意力
张子夜 iiii1 小时前
机器学习算法系列专栏:主成分分析(PCA)降维算法(初学者)
人工智能·python·算法·机器学习
GIS宇宙1 小时前
五分钟免费开启你的Vibe Coding之旅!
人工智能
用户5191495848451 小时前
Three.js实例化技术:高效渲染数千3D对象
人工智能·aigc