技术栈

评估基准

大千AI助手
4 小时前
人工智能·大模型·llm·强化学习·评估基准·数学推理能力·math500
MATH-500:大模型数学推理能力评估基准本文由「大千AI助手」原创发布,专注用真话讲AI,回归技术本质。拒绝神话或妖魔化。搜索「大千AI助手」关注我,一起撕掉过度包装,学习真实的AI技术!
庞德公
1 年前
人工智能·自然语言处理·斯坦福·评估基准
斯坦福报告解读4:图解有趣的推理基准(中)《人工智能指数报告》由斯坦福大学、AI指数指导委员会及业内众多大佬Raymond Perrault、Erik Brynjolfsson 、James Manyika等人员和组织合著,该报告已被公认为最权威、最具信誉人工智能数据与洞察来源之一。
我是有底线的