OpenBayes 一周速览|在线实测 Deepmoney 金融大模型、清华发布 LongAlign 大模型长上下文对齐数据集

公共资源速递

This Weekly Snapshots !

5 个数据集:

yf_dianping 大众点评数据集

yf_amazon 亚马逊用户评价数据集

LongAlign 大模型长上下文对齐数据集

PD&CFT 人民日报中文阅读理解数据集

2020 年中国地面光伏电站 10 米全国比例尺地图

1 个模型:

通义千问 QwenV1.5-1.8B-Chat

3 个教程:

在线运行 Deepmoney-34b-full

在线运行 Deepmoney-67b-full

在线运行 Deepmoney-miqu-70b

访问官网立即使用: openbayes.com

公共数据集

1. yf_dianping 大众点评数据集

该数据集包含 54 万用户对 24 万家餐馆的 440 万条评论或评分数据。可用于推荐系统、情感/观点/评论倾向性分析等任务。

直接使用: https://my5353.com/dianping

2. yf_amazon 亚马逊用户评价数据集

该数据集包含 142 万用户对亚马逊上 1,100 多个类目,52 万件商品的 720 万条评论或评分数据,可用于推荐系统、情感/观点/评论倾向性分析等任务。

直接使用: https://my5353.com/yfAmazon

3.LongAlign 10k 大模型长上下文对齐数据集

LongAlign-10k 是清华大学提出的一个针对大模型在长上下文对齐任务中面临的挑战而设计的数据集,包含 10,000 条长指令数据,长度在 8k-64k 之间。此数据集旨在测评大模型于长上下文中的表现,及其对 10k-100k 长度任务指令的遵循能力。

直接使用: https://my5353.com/LongAlign

4.PD&CFT 人民日报中文阅读理解数据集

该数据集该数据集是第一个中文阅读理解数据集,其中包括人民日报和儿童童话(People Daily&Children's Fairy Tale,简称 PD&CFT)。

直接使用: https://my5353.com/dailyp

5.2020 年中国地面光伏电站 10 米全国比例尺地图

中国农业大学与中国科学院地理科学与资源研究所合作,针对国内缺乏高分辨率、开源的全国地面光伏电站分布数据现状,开发了 2020 年全国 10 米分辨率地面光伏电站分类数据集。该成果不仅精确揭示了我国光伏电站的空间分布特征,而且以 89% 的分类精度,为能源规划、土地利用、遥感监测及环境研究等领域提供了宝贵的数据资源。

直接使用: https://my5353.com/20c10m

公共模型

1. 通义千问 QwenV1.5-1.8B-Chat

该模型为 QwenV1.5,是 Qwen2 的 beta 版本,型号大小为 1.8B。

直接使用: https://my5353.com/1518B

公共教程

📢📢📢插播一则小贝快讯:

OpenBayes贝式计算与机器之心SOTA!模型社区携手合作,旨在为开发者和大型模型厂商,提供高性能且易于使用的人工智能基础设施, 推动 AI 开发者社区的创新与发展,并致力于打造开箱即用的大型模型体验和推广平台。

首批合作教程「在线运行 Deepmoney 金融大模型」已经可以在 OpenBayes 一键克隆啦!看看都有哪些模型吧👇🏻👇🏻👇🏻

1. 在线运行 Deepmoney-34b-full

Deepmoney 是一个专注于金融领域投资的大型语言模型项目。Deepmoney-34b-full 是基于 01-ai 开源的 Yi-34B-200K 模型进行训练的,分为 pt(全参数训练)和 sft (lora 微调) 两个阶段。现可在超神经官网一键克隆使用。

在线运行: https://my5353.com/34bfull

2. 在线运行 Deepmoney-67b-full

该模型是基于 deepseek-ai 开源的 deepseek-llm-67b-base 进行训练的,分为 pt(lora 训练)和 sft (lora 训练) 两个阶段,现可在超神经官网一键克隆使用。

在线运行: https://my5353.com/67bfull

3. 在线运行 Deepmoney-miqu-70b

该模型是基于 huggingface 的 miqu-1-70b-sf 进行训练的,仅进行 sft (lora 微调) ,现可在超神经官网一键克隆使用。

在线运行: https://my5353.com/miqu70

以上就是小贝上周在 OpenBayes 的全部更新内容啦~

此外,**OpenBayes 平台还提供超过 500 个精选公共数据集、模型、教程等优质资源,**并已经整合到「公共资源」模块中。OpenBayes 平台支持一键 Input,开箱即用!

更多详细教程,请观看:

【OpenBayes 官方教程】使用 File Browser 管理 OpenBayes 中的数据和模型_哔哩哔哩_bilibili

相关推荐
机器之心25 分钟前
今天起,Claude正式接入Office全家桶,跨应用还能共享记忆
人工智能·openai
机器之心31 分钟前
破案了!为啥ChatGPT老想着「稳稳地接住你」
人工智能·openai
二哈赛车手41 分钟前
新人笔记---Spring AI的Advisor以及其底层机制讲解(涉及源码),包含一些遇见的Spring AI的Advisor缺陷问题的解决方案
java·人工智能·spring boot·笔记·spring
sali-tec41 分钟前
C# 基于OpenCv的视觉工作流-章66-直线夹角
图像处理·人工智能·opencv·算法·计算机视觉
不背八股的AI选手42 分钟前
《别再“喂prompt赌运气”了:我的AI开发工程化管理实践》
人工智能
AC赳赳老秦1 小时前
接口测试自动化:用 OpenClaw 对接 Postman,实现批量回归测试、测试报告自动生成与推送
java·人工智能·python·算法·elasticsearch·deepseek·openclaw
DO_Community1 小时前
DigitalOcean VPC 网络故障排查 Runbook 实战指南
人工智能·aigc·claude·deepseek
PILIPALAPENG1 小时前
第4周 Day 1:智能体记忆系统——给 Agent 一个"大脑"
前端·人工智能·python
是你的小橘呀1 小时前
coze工作流打造 来喽!!
人工智能
再玩一会儿看代码1 小时前
如何理解神经网络中的权重参数?从一张图看懂模型参数量计算
人工智能·经验分享·python·深度学习·神经网络·机器学习