3 个近期"优质"的 AI 开源项目, 有点绝。

01、数据分析 Agent

这个叫 DeepAnalyze 的 GitHub 开源项目是清华和人大联合开发的数据分析 Agent。

开源 2 周,现在 1000 多 Star。

给它一堆原始数据,它能完成从数据准备、分析、可视化、建模、写报告全流程。

可以先看看实操视频:查看视频原文:mp.weixin.qq.com/s/yr1SvASME...

可以看到无需人工指导,能自我规划并执行完成,对于非专业数据分析人员比较实用,也可以做为专业数据分析师的辅助使用。

arduino 复制代码
开源地址:https://github.com/ruc-datalab/DeepAnalyze

支持数据库、CSV、Excel 等结构化数据,也支持 JSON、XML、YAML 等半结构化数据,还可以是 TXT、Markdown 文档等非结构化数据

它可以完成开放式任务,比如说「研究这些数据,找出一些有价值的洞见」,它就会去数据清洗、分析、建模、可视化,最终输出一份专业研究报告。

让数据分析像聊天一样简单。

DeepAnalyze 的模型、代码、训练数据全部开源,你可以自己部署或开发你自己的数据分析助手。

如何使用

克隆此仓库并下载 DeepAnalyze-8B:

bash 复制代码
git clone https://github.com/ruc-datalab/DeepAnalyze.git下载:https://huggingface.co/RUC-DataLab/DeepAnalyze-8B

然后运行下面这些脚本启动 API 和界面,然后能用了。

bash 复制代码
cd demo/chatnpm installcd ..bash start.sh

02、一键把文档/代码转成 Claude Skills

Claude 前段时间推出了 Agent Skills

这是一种模块化能力扩展机制,本质是包含 SKILL.md 文件的文件夹,这个 md 文件可以写专业知识、指令操作和代码脚本。

Claude 处理任务的时候可以动态加载相关 skill,有点像 AI 可调用的静态工具或知识库。

而要介绍的 Skill Seeker 开源项目就很实用了,开源两周就 3K 星了。

它可以自动把文档网站、GitHub 仓库、PDF 转换等成 Claude AI Skills,全程无需手动操作,将智能抓取的信息有机整合,最后整理成 Claude 能直接导入的 .zip 技能包。

开发者写了一篇从 0 部署这个开源项目的文章,挺详细的,感兴趣的可以去看看。

ruby 复制代码
新手教程:https://github.com/yusufkaraaslan/Skill_Seekers/blob/development/BULLETPROOF_QUICKSTART.md

03、谷歌开源的时间序列预测模型

这个叫 TimesFM 的开源项目是 Google Research 发布的。

专为时间序列预测开发的预训练基础模型,它是基于一个 1000 亿个真实世界时间点的大型时间序列语料库训练出来的

算是一个基座模型。

别被这么高大上的名词唬住哦。

简单说,时间序列预测模型就是能根据过去的时间数据,推测未来的趋势

比如你是开网店的,有过去 100 天的销量数据,丢进 TimesFM 能直接预测未来 12 天的销量,还能知道销量的波动范围。

因为 TimesFM 作为预训练模型,已经提前学会了大量时间序列的规律,不用你从零训练,直接开箱即用。

因为是基座模型,有2亿参数,你可以直接把你手上不同时间节点的数据丢进去让它预测,也可以基于它进行微调。

arduino 复制代码
开源地址:https://github.com/google-research/timesfm

查看视频原文:mp.weixin.qq.com/s/yr1SvASME...

相关推荐
Solar20256 小时前
微服务调用超时:从问题分析到全链路优化实践
微服务·云原生·架构
腾讯云开发者6 小时前
数据与 AI 如何双向赋能?腾讯云架构师技术沙龙邀你共探
架构
databook7 小时前
AI辅助编程下的软件分层设计:让生成的代码井然有序
人工智能·程序员·架构
小马哥编程9 小时前
JWT 是由哪三个部分组成?如何使用JWT进行身份认证?
网络协议·http·架构·ssh
z10_149 小时前
多协议网关架构
架构
岛屿旅人10 小时前
英国国防部推进本土化开放架构建设
网络·人工智能·安全·web安全·架构
sas-soft10 小时前
短任务占资源、低频 API 耗成本?混合架构方案:微服务扛核心,Serverless 接弹性需求
微服务·架构·serverless