MedEureka 医疗领域用于多粒度、多数据类型基于文本嵌入检索的测试数据集最近在研究医疗领域的基于文本嵌入的信息检索,需要一个比较全面的评测数据集,因此找到了《MedEureka: A Medical Domain Benchmark for Multi-Granularity and Multi-Data-Type Embedding-Based Retrieval》一文,发表于NAACL 2025,NAACL是CCF的B类会议,算是不错的会议了,文章质量相信不差。但是在复现学习的时候却发现以下问题,分享出来供高手指点。