互联网时代的文学复兴:中文诗词大数据分析 | 开源日报 No.170

chinese-poetry/chinese-poetry

Stars: 45.4k License: MIT

最全的中文诗歌古典文集数据库,包含 5.5 万首唐诗、26 万首宋诗、2.1 万首宋词和其他古典文集。数据来源于互联网。该开源项目旨在通过 JSON 格式分发,方便用户开始自己的项目,并借助技术生成格式化 (JSON) 数据来构建诗词类应用程序。案例展示了一些基于该仓库创建的相关应用。

  • 数据集丰富
  • 古代中国各种经典作品齐全
  • 提供高频次分析图等功能
  • 开放给用户参与贡献

citra-emu/citra

Stars: 8.8k License: GPL-2.0

Citra 是世界上最受欢迎的开源任天堂 3DS 模拟器。该项目使用 C++ 编写,注重可移植性,并积极维护适用于 Windows、Linux、Android 和 macOS 的版本。

以下是 Citra 项目的关键特性和核心优势:

  • 兼容性:该模拟器能够以全速运行大多数商业游戏,前提是您满足必要的硬件需求。
  • 多平台支持:Citra 提供了针对不同操作系统 (Windows、Linux、Android 和 macOS) 的构建版本,方便用户在各种设备上体验游戏。
  • 持续更新与发展:团队定期发布新功能和进度报告,在 GitHub 上进行活跃地开发讨论,并通过 Discord 群组为贡献者们提供交流机会。
  • 易于安装和使用:可以从官网下载并安装 Nightly 或 Canary 版本;此外还有 Android 版本可在 Google Play 商店中获取。同时也提供 Flatpak 构建来简化部署过程。

e2b-dev/E2B

Stars: 5.6k License: Apache-2.0

这个项目是一个为 AI 应用程序和代理人提供的安全沙盒云环境,允许它们长时间运行。E2B Sandbox 可以连接到任何 LLM 和任何 AI 代理或应用程序,并且具有以下主要功能:

  • 可以使用与人类相同的工具
  • 具有云浏览器、GitHub 存储库和命令行界面等功能
  • 支持编码工具如代码检查、自动补全、"跳转至定义"
  • 能够运行由 LLM 生成的代码

该项目包含 Python SDK、JS SDK、CLI 以及文档等内容。

hemansnation/God-Level-Data-Science-ML-Full-Stack

Stars: 3.4k License: NOASSERTION

这个项目是一个数据科学和机器学习全栈的集合,包括了科学方法、流程、算法和系统来构建故事与模型。主要功能包括 Python 编程逻辑搭建、数据结构与算法以及 Git & GitHub 等内容。该项目的核心优势和特点有:

  • 包含 16 章节的路线图,涵盖从新手到经验专业人士转向数据科学与 AI 所需的知识;
  • 提供丰富资源库,并使用多种技术栈如 Python,NumPy,Pandas,Matplotlib 等工具进行实践;
  • 重点介绍了各阶段需要掌握的关键概念和技能,例如统计分析、机器学习算法应用以及自然语言处理等。

ricklamers/gpt-code-ui

Stars: 3.3k License: MIT

这个项目是 OpenAI 的 ChatGPT 代码解释器的开源实现。用户可以简单地向 OpenAI 模型提出要求,它将为您生成并执行代码。该项目具有以下主要功能和核心优势:

  • 文件上传
  • 文件下载
  • 上下文感知 (可以参考先前的消息)
  • 生成代码
  • 运行代码 (Python 内核)
  • 模型切换 (GPT-3.5 和 GPT -4)
相关推荐
martinzh1 分钟前
向量化与嵌入模型:RAG系统背后的隐形英雄
人工智能
新智元15 分钟前
学哲学没出路?不好意思,现在哲学就业碾压 CS!
人工智能·openai
AI码上来25 分钟前
当小智 AI 遇上数字人,我用 WebRTC 打造实时音视频应用
人工智能·webrtc·实时音视频
黎燃29 分钟前
智能库存管理的需求预测模型:从业务痛点到落地代码的完整实践
人工智能
机器之心30 分钟前
DPad: 扩散大语言模型的中庸之道,杜克大学陈怡然团队免训推理加速61倍
人工智能·openai
老青蛙33 分钟前
权限系统设计-用户设计
后端
一车小面包36 分钟前
人工智能中的线性代数总结--简单篇
人工智能·numpy
echoyu.43 分钟前
消息队列-初识kafka
java·分布式·后端·spring cloud·中间件·架构·kafka
大模型真好玩43 分钟前
深入浅出LangGraph AI Agent智能体开发教程(四)—LangGraph全生态开发工具使用与智能体部署
人工智能·python·mcp
算家计算1 小时前
OpenAI百亿美元造芯计划曝光,算力争夺战进入新阶段?
人工智能·openai·资讯