modood/Administrative-divisions-of-China
Stars: 16.6k
License: WTFPL
中华人民共和国行政区划 (五级) 项目提供了中国的省级、地级、县级、乡级和村级数据,包括各个层次的代码及名称。该项目主要功能如下:
- 提供从省份到村庄五个层次的行政区划数据。
- 数据来源于国家统计局,并已更新至最新发布时间。
- 可以通过 JSON 或 CSV 格式下载相应文件列表中的数据。
- 支持数据库迁移,当前使用 sqlite3 存储数据。
SuperDuperDB/superduperdb
Stars: 3.8k
License: Apache-2.0
SuperDuperDB 是一个开源框架,用于将人工智能直接与现有数据库集成,包括流式推断、可扩展的模型训练和向量搜索。它不是一个数据库,而是将您喜爱的数据库转变为 AI 开发和部署环境;消除了复杂的 MLOps 管道、专门化矢量数据库以及迁移和数据重复需求。其主要功能和核心优势包括:
- 将 AI 与现有数据基础设施集成
- 流式推断
- 可扩展模型训练
- 模型串联
- 简单但可扩展的界面
- 处理各种类型数据 (如图像、视频等)
PRIS-CV/DemoFusion
Stars: 1.6k
License: NOASSERTION
DemoFusion 是一个开源项目,旨在通过推进高分辨率图像生成的前沿,并保持对广泛受众的可访问性,来使高分辨率 GenAI 民主化。该框架无缝扩展了开源 GenAI 模型,采用渐进式放大、跳过残差和扩张抽样机制实现更高分辨率的图像生成。 其核心优势包括:
- 支持多种集成演示 (HuggingFace Space、Colab、Replicate)
- 具有调整参数灵活性
- 提供本地 Gradio 演示功能
ise-uiuc/magicoder
Stars: 1.6k
License: MIT
Magicoder 是一个由 🪄OSS-Instruct 提供支持的模型系列,它采用一种新颖的方法来启发 LLMs 使用开源代码片段生成低偏差和高质量指令数据。🪄OSS-Instruct 通过赋予 LLM 丰富的开源参考资料,以产生更多样化、真实和可控制的数据,从而减轻了 LLM 合成指令数据固有的偏见。
bigscience-workshop/petals
Stars: 8.2k
License: MIT
Petals 是一个可以在家中以 BitTorrent 的方式运行大型语言模型的开源项目,通过分布式 Llama 2 (70B)、Falcon (40B+)、BLOOM (176B)(或它们的衍生版本)进行微调和推理速度最多比离线处理快 10 倍。该项目具有以下特点和优势:
- 可以在桌面计算机或 Google Colab 上为自己的任务微调并生成文本
- 数据将会与公共群体中的其他人一起处理,也可以建立私人群体来保护敏感数据
- 社区驱动系统,依赖于用户分享 GPU,并提供了详细指南来增加 Petals 的容量
- 提供了不同操作系统下安装及使用 Petals 的方法,并且支持多个 GPU 和启动服务器等功能
- 加载模型部分后加入网络服务他人加载部分模型,在单批次推理时速度可达每秒 6 个标记对于 Llama 2(70B),4 个标记对于 Falcon(180 B)
- 提供基础教程、实用工具和高级指南等资源
Azure/azure-rest-api-specs
Stars: 2.1k
License: MIT
Azure REST API Specifications 是 Microsoft Azure 的 REST API 规范的源代码库。
该项目具有以下核心优势和关键特性:
- 提供了微软云平台 Azure 上所有服务的 REST API 规范。
- 包含管理面板和数据面板相关文档,方便开发者进行应用程序开发。
- 严格按照目录结构组织,使得查找、阅读和理解各个 API 规范更加简单明了。
- 支持混合应用程序在 Azure Stack 通用可获得版本以及 Azure Cloud 上运行,并提供相应配置文件定义 (Profile) 来满足不同需求。
通过使用这些 REST API 规范,您可以轻松地与 Microsoft Azure 云平台集成并创建自己的基于云计算技术的解决方案。无论是为企业还是个人用户,在利用 Microsoft Azure 时都能够从中受益。