OpenBayes 一周速览|在线实测 Deepmoney 金融大模型、清华发布 LongAlign 大模型长上下文对齐数据集

公共资源速递

This Weekly Snapshots !

5 个数据集:

yf_dianping 大众点评数据集

yf_amazon 亚马逊用户评价数据集

LongAlign 大模型长上下文对齐数据集

PD&CFT 人民日报中文阅读理解数据集

2020 年中国地面光伏电站 10 米全国比例尺地图

1 个模型:

通义千问 QwenV1.5-1.8B-Chat

3 个教程:

在线运行 Deepmoney-34b-full

在线运行 Deepmoney-67b-full

在线运行 Deepmoney-miqu-70b

访问官网立即使用: openbayes.com

公共数据集

1. yf_dianping 大众点评数据集

该数据集包含 54 万用户对 24 万家餐馆的 440 万条评论或评分数据。可用于推荐系统、情感/观点/评论倾向性分析等任务。

直接使用: https://my5353.com/dianping

2. yf_amazon 亚马逊用户评价数据集

该数据集包含 142 万用户对亚马逊上 1,100 多个类目,52 万件商品的 720 万条评论或评分数据,可用于推荐系统、情感/观点/评论倾向性分析等任务。

直接使用: https://my5353.com/yfAmazon

3.LongAlign 10k 大模型长上下文对齐数据集

LongAlign-10k 是清华大学提出的一个针对大模型在长上下文对齐任务中面临的挑战而设计的数据集,包含 10,000 条长指令数据,长度在 8k-64k 之间。此数据集旨在测评大模型于长上下文中的表现,及其对 10k-100k 长度任务指令的遵循能力。

直接使用: https://my5353.com/LongAlign

4.PD&CFT 人民日报中文阅读理解数据集

该数据集该数据集是第一个中文阅读理解数据集,其中包括人民日报和儿童童话(People Daily&Children's Fairy Tale,简称 PD&CFT)。

直接使用: https://my5353.com/dailyp

5.2020 年中国地面光伏电站 10 米全国比例尺地图

中国农业大学与中国科学院地理科学与资源研究所合作,针对国内缺乏高分辨率、开源的全国地面光伏电站分布数据现状,开发了 2020 年全国 10 米分辨率地面光伏电站分类数据集。该成果不仅精确揭示了我国光伏电站的空间分布特征,而且以 89% 的分类精度,为能源规划、土地利用、遥感监测及环境研究等领域提供了宝贵的数据资源。

直接使用: https://my5353.com/20c10m

公共模型

1. 通义千问 QwenV1.5-1.8B-Chat

该模型为 QwenV1.5,是 Qwen2 的 beta 版本,型号大小为 1.8B。

直接使用: https://my5353.com/1518B

公共教程

📢📢📢插播一则小贝快讯:

OpenBayes贝式计算与机器之心SOTA!模型社区携手合作,旨在为开发者和大型模型厂商,提供高性能且易于使用的人工智能基础设施, 推动 AI 开发者社区的创新与发展,并致力于打造开箱即用的大型模型体验和推广平台。

首批合作教程「在线运行 Deepmoney 金融大模型」已经可以在 OpenBayes 一键克隆啦!看看都有哪些模型吧👇🏻👇🏻👇🏻

1. 在线运行 Deepmoney-34b-full

Deepmoney 是一个专注于金融领域投资的大型语言模型项目。Deepmoney-34b-full 是基于 01-ai 开源的 Yi-34B-200K 模型进行训练的,分为 pt(全参数训练)和 sft (lora 微调) 两个阶段。现可在超神经官网一键克隆使用。

在线运行: https://my5353.com/34bfull

2. 在线运行 Deepmoney-67b-full

该模型是基于 deepseek-ai 开源的 deepseek-llm-67b-base 进行训练的,分为 pt(lora 训练)和 sft (lora 训练) 两个阶段,现可在超神经官网一键克隆使用。

在线运行: https://my5353.com/67bfull

3. 在线运行 Deepmoney-miqu-70b

该模型是基于 huggingface 的 miqu-1-70b-sf 进行训练的,仅进行 sft (lora 微调) ,现可在超神经官网一键克隆使用。

在线运行: https://my5353.com/miqu70

以上就是小贝上周在 OpenBayes 的全部更新内容啦~

此外,**OpenBayes 平台还提供超过 500 个精选公共数据集、模型、教程等优质资源,**并已经整合到「公共资源」模块中。OpenBayes 平台支持一键 Input,开箱即用!

更多详细教程,请观看:

【OpenBayes 官方教程】使用 File Browser 管理 OpenBayes 中的数据和模型_哔哩哔哩_bilibili

相关推荐
Thetoicxdude5 分钟前
迎接AI時代的新篇章:GPT-5 技術突破與未來展望
人工智能
聊聊网事6 分钟前
【AI资讯】可以媲美GPT-SoVITS的低显存开源文本转语音模型Fish Speech
人工智能·gpt
2的n次方_7 分钟前
迎接AI新时代:GPT-5即将登场的巨大变革与应用前瞻
人工智能·gpt·学习
Czi.8 分钟前
Build a Large Language Model (From Scratch)附录D(gpt-4o翻译版)
人工智能·语言模型·自然语言处理
xiandong208 分钟前
240707_昇思学习打卡-Day19-基于MindSpore通过GPT实现情感分类
人工智能·gpt·学习·分类
Czi.9 分钟前
Build a Large Language Model (From Scratch)附录A(gpt-4o翻译版)
人工智能·语言模型·自然语言处理
TechQuester10 分钟前
解决GPT-4o耗电难题!DeepMind新算法训练效率提升13倍,能耗降低10倍!
java·c++·人工智能·python·算法·chatgpt
深圳信迈科技DSP+ARM+FPGA1 小时前
基于全国产复旦微JFM7K325T+ARM人工智能数据处理平台
人工智能·复旦微jfm7k325t
m0_689618281 小时前
生物墨水:3D组织生物打印的基石
人工智能·笔记
锋.谢1 小时前
深入研究深度学习
人工智能·深度学习