OpenBayes 一周速览|在线实测 Deepmoney 金融大模型、清华发布 LongAlign 大模型长上下文对齐数据集

公共资源速递

This Weekly Snapshots !

5 个数据集:

yf_dianping 大众点评数据集

yf_amazon 亚马逊用户评价数据集

LongAlign 大模型长上下文对齐数据集

PD&CFT 人民日报中文阅读理解数据集

2020 年中国地面光伏电站 10 米全国比例尺地图

1 个模型:

通义千问 QwenV1.5-1.8B-Chat

3 个教程:

在线运行 Deepmoney-34b-full

在线运行 Deepmoney-67b-full

在线运行 Deepmoney-miqu-70b

访问官网立即使用: openbayes.com

公共数据集

1. yf_dianping 大众点评数据集

该数据集包含 54 万用户对 24 万家餐馆的 440 万条评论或评分数据。可用于推荐系统、情感/观点/评论倾向性分析等任务。

直接使用: https://my5353.com/dianping

2. yf_amazon 亚马逊用户评价数据集

该数据集包含 142 万用户对亚马逊上 1,100 多个类目,52 万件商品的 720 万条评论或评分数据,可用于推荐系统、情感/观点/评论倾向性分析等任务。

直接使用: https://my5353.com/yfAmazon

3.LongAlign 10k 大模型长上下文对齐数据集

LongAlign-10k 是清华大学提出的一个针对大模型在长上下文对齐任务中面临的挑战而设计的数据集,包含 10,000 条长指令数据,长度在 8k-64k 之间。此数据集旨在测评大模型于长上下文中的表现,及其对 10k-100k 长度任务指令的遵循能力。

直接使用: https://my5353.com/LongAlign

4.PD&CFT 人民日报中文阅读理解数据集

该数据集该数据集是第一个中文阅读理解数据集,其中包括人民日报和儿童童话(People Daily&Children's Fairy Tale,简称 PD&CFT)。

直接使用: https://my5353.com/dailyp

5.2020 年中国地面光伏电站 10 米全国比例尺地图

中国农业大学与中国科学院地理科学与资源研究所合作,针对国内缺乏高分辨率、开源的全国地面光伏电站分布数据现状,开发了 2020 年全国 10 米分辨率地面光伏电站分类数据集。该成果不仅精确揭示了我国光伏电站的空间分布特征,而且以 89% 的分类精度,为能源规划、土地利用、遥感监测及环境研究等领域提供了宝贵的数据资源。

直接使用: https://my5353.com/20c10m

公共模型

1. 通义千问 QwenV1.5-1.8B-Chat

该模型为 QwenV1.5,是 Qwen2 的 beta 版本,型号大小为 1.8B。

直接使用: https://my5353.com/1518B

公共教程

📢📢📢插播一则小贝快讯:

OpenBayes贝式计算与机器之心SOTA!模型社区携手合作,旨在为开发者和大型模型厂商,提供高性能且易于使用的人工智能基础设施, 推动 AI 开发者社区的创新与发展,并致力于打造开箱即用的大型模型体验和推广平台。

首批合作教程「在线运行 Deepmoney 金融大模型」已经可以在 OpenBayes 一键克隆啦!看看都有哪些模型吧👇🏻👇🏻👇🏻

1. 在线运行 Deepmoney-34b-full

Deepmoney 是一个专注于金融领域投资的大型语言模型项目。Deepmoney-34b-full 是基于 01-ai 开源的 Yi-34B-200K 模型进行训练的,分为 pt(全参数训练)和 sft (lora 微调) 两个阶段。现可在超神经官网一键克隆使用。

在线运行: https://my5353.com/34bfull

2. 在线运行 Deepmoney-67b-full

该模型是基于 deepseek-ai 开源的 deepseek-llm-67b-base 进行训练的,分为 pt(lora 训练)和 sft (lora 训练) 两个阶段,现可在超神经官网一键克隆使用。

在线运行: https://my5353.com/67bfull

3. 在线运行 Deepmoney-miqu-70b

该模型是基于 huggingface 的 miqu-1-70b-sf 进行训练的,仅进行 sft (lora 微调) ,现可在超神经官网一键克隆使用。

在线运行: https://my5353.com/miqu70

以上就是小贝上周在 OpenBayes 的全部更新内容啦~

此外,**OpenBayes 平台还提供超过 500 个精选公共数据集、模型、教程等优质资源,**并已经整合到「公共资源」模块中。OpenBayes 平台支持一键 Input,开箱即用!

更多详细教程,请观看:

【OpenBayes 官方教程】使用 File Browser 管理 OpenBayes 中的数据和模型_哔哩哔哩_bilibili

相关推荐
MARS_AI_7 分钟前
AI 智能外呼系统的智能体现
人工智能·自然语言处理·nlp·语音识别·信息与通信
想做后端的小C8 分钟前
Visual Studio 2022 UI机器学习训练模块
机器学习·vs
_一条咸鱼_20 分钟前
AI 大模型微调原理深度剖析与源码解读
人工智能·深度学习·机器学习
激动滴西瓜20 分钟前
使用 Spring AI 构建高效的AI Agent(Part 1)
人工智能·后端
jndingxin21 分钟前
OpenCV 图形API(22)矩阵操作
人工智能·opencv
蚝油菜花22 分钟前
AI终于能听懂宝宝说话了!ChildMandarin:智源研究院开源的低幼儿童中文语音数据集,覆盖22省方言
人工智能·开源
掘金安东尼24 分钟前
llm 训练脚本怎么写?平台启动怎么配?一文搞定
人工智能·llm
果冻人工智能26 分钟前
如何把未量化的 70B 大模型加载到笔记本电脑上运行?
人工智能
DevUI团队37 分钟前
MateChat V1.4.0来了~MarkdownCard支持think、input组件增强
前端·人工智能
Mr.Winter`1 小时前
运动规划实战案例 | 基于四叉树分解的路径规划(附ROS C++/Python仿真)
人工智能·机器人·自动驾驶·ros·计算机图形学·ros2·路径规划