技术栈
llm 评估
yubinCloud
10 个月前
人工智能
·
深度学习
·
语言模型
·
自然语言处理
·
llm 评估
【LLM 评估】GLUE benchmark:NLU 的多任务 benchmark
论文:GLUE: A Multi-Task Benchmark and Analysis Platform for Natural Language Understanding