OpenBayes 一周速览|在线实测 Deepmoney 金融大模型、清华发布 LongAlign 大模型长上下文对齐数据集

公共资源速递

This Weekly Snapshots !

5 个数据集:

yf_dianping 大众点评数据集

yf_amazon 亚马逊用户评价数据集

LongAlign 大模型长上下文对齐数据集

PD&CFT 人民日报中文阅读理解数据集

2020 年中国地面光伏电站 10 米全国比例尺地图

1 个模型:

通义千问 QwenV1.5-1.8B-Chat

3 个教程:

在线运行 Deepmoney-34b-full

在线运行 Deepmoney-67b-full

在线运行 Deepmoney-miqu-70b

访问官网立即使用: openbayes.com

公共数据集

1. yf_dianping 大众点评数据集

该数据集包含 54 万用户对 24 万家餐馆的 440 万条评论或评分数据。可用于推荐系统、情感/观点/评论倾向性分析等任务。

直接使用: https://my5353.com/dianping

2. yf_amazon 亚马逊用户评价数据集

该数据集包含 142 万用户对亚马逊上 1,100 多个类目,52 万件商品的 720 万条评论或评分数据,可用于推荐系统、情感/观点/评论倾向性分析等任务。

直接使用: https://my5353.com/yfAmazon

3.LongAlign 10k 大模型长上下文对齐数据集

LongAlign-10k 是清华大学提出的一个针对大模型在长上下文对齐任务中面临的挑战而设计的数据集,包含 10,000 条长指令数据,长度在 8k-64k 之间。此数据集旨在测评大模型于长上下文中的表现,及其对 10k-100k 长度任务指令的遵循能力。

直接使用: https://my5353.com/LongAlign

4.PD&CFT 人民日报中文阅读理解数据集

该数据集该数据集是第一个中文阅读理解数据集,其中包括人民日报和儿童童话(People Daily&Children's Fairy Tale,简称 PD&CFT)。

直接使用: https://my5353.com/dailyp

5.2020 年中国地面光伏电站 10 米全国比例尺地图

中国农业大学与中国科学院地理科学与资源研究所合作,针对国内缺乏高分辨率、开源的全国地面光伏电站分布数据现状,开发了 2020 年全国 10 米分辨率地面光伏电站分类数据集。该成果不仅精确揭示了我国光伏电站的空间分布特征,而且以 89% 的分类精度,为能源规划、土地利用、遥感监测及环境研究等领域提供了宝贵的数据资源。

直接使用: https://my5353.com/20c10m

公共模型

1. 通义千问 QwenV1.5-1.8B-Chat

该模型为 QwenV1.5,是 Qwen2 的 beta 版本,型号大小为 1.8B。

直接使用: https://my5353.com/1518B

公共教程

📢📢📢插播一则小贝快讯:

OpenBayes贝式计算与机器之心SOTA!模型社区携手合作,旨在为开发者和大型模型厂商,提供高性能且易于使用的人工智能基础设施, 推动 AI 开发者社区的创新与发展,并致力于打造开箱即用的大型模型体验和推广平台。

首批合作教程「在线运行 Deepmoney 金融大模型」已经可以在 OpenBayes 一键克隆啦!看看都有哪些模型吧👇🏻👇🏻👇🏻

1. 在线运行 Deepmoney-34b-full

Deepmoney 是一个专注于金融领域投资的大型语言模型项目。Deepmoney-34b-full 是基于 01-ai 开源的 Yi-34B-200K 模型进行训练的,分为 pt(全参数训练)和 sft (lora 微调) 两个阶段。现可在超神经官网一键克隆使用。

在线运行: https://my5353.com/34bfull

2. 在线运行 Deepmoney-67b-full

该模型是基于 deepseek-ai 开源的 deepseek-llm-67b-base 进行训练的,分为 pt(lora 训练)和 sft (lora 训练) 两个阶段,现可在超神经官网一键克隆使用。

在线运行: https://my5353.com/67bfull

3. 在线运行 Deepmoney-miqu-70b

该模型是基于 huggingface 的 miqu-1-70b-sf 进行训练的,仅进行 sft (lora 微调) ,现可在超神经官网一键克隆使用。

在线运行: https://my5353.com/miqu70

以上就是小贝上周在 OpenBayes 的全部更新内容啦~

此外,**OpenBayes 平台还提供超过 500 个精选公共数据集、模型、教程等优质资源,**并已经整合到「公共资源」模块中。OpenBayes 平台支持一键 Input,开箱即用!

更多详细教程,请观看:

【OpenBayes 官方教程】使用 File Browser 管理 OpenBayes 中的数据和模型_哔哩哔哩_bilibili

相关推荐
云边云科技5 分钟前
零售行业新店网络零接触部署场景下,如何选择SDWAN
运维·服务器·网络·人工智能·安全·边缘计算·零售
audyxiao00115 分钟前
为了更强大的空间智能,如何将2D图像转换成完整、具有真实尺度和外观的3D场景?
人工智能·计算机视觉·3d·iccv·空间智能
Monkey的自我迭代32 分钟前
机器学习总复习
人工智能·机器学习
大千AI助手32 分钟前
GitHub Copilot:AI编程助手的架构演进与真实世界影响
人工智能·深度学习·大模型·github·copilot·ai编程·codex
用户51914958484541 分钟前
耶稣蓝队集体防护Bash脚本:多模块协同防御实战
人工智能·aigc
☺����1 小时前
实现自己的AI视频监控系统-第一章-视频拉流与解码1
人工智能·python·音视频
Black_Rock_br1 小时前
本地部署的终极多面手:Qwen2.5-Omni-3B,视频剪、音频混、图像生、文本写全搞定
人工智能·音视频
2301_821919921 小时前
决策树8.19
算法·决策树·机器学习
用什么都重名1 小时前
《GPT-OSS 模型全解析:OpenAI 回归开源的 Mixture-of-Experts 之路》
人工智能·大模型·openai·gpt-oss