技术栈

llm 评估

yubinCloud
1 年前
人工智能·深度学习·语言模型·自然语言处理·llm 评估
【LLM 评估】GLUE benchmark:NLU 的多任务 benchmark论文:GLUE: A Multi-Task Benchmark and Analysis Platform for Natural Language Understanding