OpenBayes 一周速览|在线实测 Deepmoney 金融大模型、清华发布 LongAlign 大模型长上下文对齐数据集

公共资源速递

This Weekly Snapshots !

5 个数据集:

yf_dianping 大众点评数据集

yf_amazon 亚马逊用户评价数据集

LongAlign 大模型长上下文对齐数据集

PD&CFT 人民日报中文阅读理解数据集

2020 年中国地面光伏电站 10 米全国比例尺地图

1 个模型:

通义千问 QwenV1.5-1.8B-Chat

3 个教程:

在线运行 Deepmoney-34b-full

在线运行 Deepmoney-67b-full

在线运行 Deepmoney-miqu-70b

访问官网立即使用: openbayes.com

公共数据集

1. yf_dianping 大众点评数据集

该数据集包含 54 万用户对 24 万家餐馆的 440 万条评论或评分数据。可用于推荐系统、情感/观点/评论倾向性分析等任务。

直接使用: https://my5353.com/dianping

2. yf_amazon 亚马逊用户评价数据集

该数据集包含 142 万用户对亚马逊上 1,100 多个类目,52 万件商品的 720 万条评论或评分数据,可用于推荐系统、情感/观点/评论倾向性分析等任务。

直接使用: https://my5353.com/yfAmazon

3.LongAlign 10k 大模型长上下文对齐数据集

LongAlign-10k 是清华大学提出的一个针对大模型在长上下文对齐任务中面临的挑战而设计的数据集,包含 10,000 条长指令数据,长度在 8k-64k 之间。此数据集旨在测评大模型于长上下文中的表现,及其对 10k-100k 长度任务指令的遵循能力。

直接使用: https://my5353.com/LongAlign

4.PD&CFT 人民日报中文阅读理解数据集

该数据集该数据集是第一个中文阅读理解数据集,其中包括人民日报和儿童童话(People Daily&Children's Fairy Tale,简称 PD&CFT)。

直接使用: https://my5353.com/dailyp

5.2020 年中国地面光伏电站 10 米全国比例尺地图

中国农业大学与中国科学院地理科学与资源研究所合作,针对国内缺乏高分辨率、开源的全国地面光伏电站分布数据现状,开发了 2020 年全国 10 米分辨率地面光伏电站分类数据集。该成果不仅精确揭示了我国光伏电站的空间分布特征,而且以 89% 的分类精度,为能源规划、土地利用、遥感监测及环境研究等领域提供了宝贵的数据资源。

直接使用: https://my5353.com/20c10m

公共模型

1. 通义千问 QwenV1.5-1.8B-Chat

该模型为 QwenV1.5,是 Qwen2 的 beta 版本,型号大小为 1.8B。

直接使用: https://my5353.com/1518B

公共教程

📢📢📢插播一则小贝快讯:

OpenBayes贝式计算与机器之心SOTA!模型社区携手合作,旨在为开发者和大型模型厂商,提供高性能且易于使用的人工智能基础设施, 推动 AI 开发者社区的创新与发展,并致力于打造开箱即用的大型模型体验和推广平台。

首批合作教程「在线运行 Deepmoney 金融大模型」已经可以在 OpenBayes 一键克隆啦!看看都有哪些模型吧👇🏻👇🏻👇🏻

1. 在线运行 Deepmoney-34b-full

Deepmoney 是一个专注于金融领域投资的大型语言模型项目。Deepmoney-34b-full 是基于 01-ai 开源的 Yi-34B-200K 模型进行训练的,分为 pt(全参数训练)和 sft (lora 微调) 两个阶段。现可在超神经官网一键克隆使用。

在线运行: https://my5353.com/34bfull

2. 在线运行 Deepmoney-67b-full

该模型是基于 deepseek-ai 开源的 deepseek-llm-67b-base 进行训练的,分为 pt(lora 训练)和 sft (lora 训练) 两个阶段,现可在超神经官网一键克隆使用。

在线运行: https://my5353.com/67bfull

3. 在线运行 Deepmoney-miqu-70b

该模型是基于 huggingface 的 miqu-1-70b-sf 进行训练的,仅进行 sft (lora 微调) ,现可在超神经官网一键克隆使用。

在线运行: https://my5353.com/miqu70

以上就是小贝上周在 OpenBayes 的全部更新内容啦~

此外,**OpenBayes 平台还提供超过 500 个精选公共数据集、模型、教程等优质资源,**并已经整合到「公共资源」模块中。OpenBayes 平台支持一键 Input,开箱即用!

更多详细教程,请观看:

【OpenBayes 官方教程】使用 File Browser 管理 OpenBayes 中的数据和模型_哔哩哔哩_bilibili

相关推荐
缺的不是资料,是学习的心21 分钟前
使用qwen作为基座训练分类大模型
python·机器学习·分类
AI趋势预见33 分钟前
使用AI生成金融时间序列数据:解决股市场的数据稀缺问题并提升信噪比
人工智能·深度学习·神经网络·语言模型·金融
Zda天天爱打卡1 小时前
【机器学习实战中阶】使用Python和OpenCV进行手语识别
人工智能·python·深度学习·opencv·机器学习
爱喝奶茶的企鹅1 小时前
AI Agent的规划系统:让Agent更智能地完成任务
机器学习
背太阳的牧羊人2 小时前
冻结语言模型中的 自注意力层,使其参数不参与训练(梯度不会更新)。 对于跨注意力层,则解冻参数,使这些层可以进行梯度更新,从而参与训练。
人工智能·语言模型·自然语言处理
2401_890416712 小时前
Recaptcha2 图像怎么识别
人工智能·python·django
机器之心3 小时前
贾佳亚团队联合Adobe提出GenProp,物体追踪移除特效样样在行
人工智能
一叶_障目3 小时前
机器学习之决策树(DecisionTree——C4.5)
人工智能·决策树·机器学习
思码逸研发效能3 小时前
在 DevOps 实践中,如何构建自动化的持续集成和持续交付(CI/CD)管道,以提高开发和测试效率?
运维·人工智能·ci/cd·自动化·研发效能·devops·效能度量
AI量化投资实验室4 小时前
deap系统重构,再新增一个新的因子,年化39.1%,卡玛提升至2.76(附python代码)
大数据·人工智能·重构