技术栈
大模型评测
司南OpenCompass
2 个月前
人工智能
·
pytorch
·
大模型评测
司南OpenCompass评测工具正式加入PyTorch Ecosystem
日前,司南 OpenCompass 评测工具正式加入 PyTorch Ecosystem 体系,这一进展不仅彰显了司南 OpenCompass 评测工具的技术实力,还为开发者与研究人员带来了更加便捷的模型评测体验。
司南OpenCompass
2 个月前
人工智能
·
语言模型
·
大模型
·
大模型评测
·
opencompass
CompassArena新升级:Judge Copilot提升竞技体验,新一代Bradley-Terry模型还原模型真实能力
2024 年 5 月,上海人工智能实验室司南 OpenCompass 团队携手魔搭 ModelScope,联合推出了大模型评测平台——CompassArena(大模型竞技场),为大模型领域引入了一种全新的竞技模式。
司南OpenCompass
2 个月前
人工智能
·
语言模型
·
自然语言处理
·
大模型评测
顶会评测集解读-AlignBench: 大语言模型中文对齐基准
评测集社区 CompssHub 作为司南 OpenCompass大模型评测体系的重要组成部分,致力于简化并加快研究人员和行业人士搜索和使用评测集的过程。评测集社区 CompssHub 目前已收录了学科、推理、知识、代码等12个方向的评测集,欢迎大家探索。