大模型日报
2024-06-12
大模型资讯
- 摘要: NVIDIA近日宣布推出GB200 Grace Blackwell超级芯片和Blackwell B200 GPU,这些新技术将推动人工智能领域的发展。
- 摘要: 阿布扎比的技术创新研究所(TII)于5月14日发布了新一代Falcon语言模型。这些新模型在性能上与现有顶级模型相媲美,标志着语言模型技术的又一重大进步。
- 摘要: GNN-RAG结合图神经网络的知识图谱处理能力和大型语言模型的语言能力,解锁新的应用潜力。
- 摘要: 亚马逊加大对Anthropic的投资,追加27.5亿美元以加强与该大型语言模型开发公司的合作,此举旨在将生成式AI技术推向更多客户。
- 摘要: Meta在伦敦活动中确认,计划于下月初步发布Llama 3,这是其下一代用于驱动大型语言模型的开源项目。
- 摘要: Qwen-2是一款先进的开源大型语言模型和AI编程助手,相较于其前身有显著提升,能够帮助用户编写完美代码。
- 摘要: 6月11日,俄罗斯科技巨头Yandex推出了开源大型语言模型训练工具YaFSDP,声称该工具能大幅提升语言模型的训练效果。
- 摘要: Slack工程团队近日发布了如何使用大语言模型(LLM)自动转换15000个单元和集成测试,其中80%的转换任务由LLM完成。这一技术结合了抽象语法树(ASTs),显著提高了测试转换效率。
- 摘要: 新研究分析了AI生成的报告在简化放射科医生影像解读方面的有效性,使其更易于患者理解。
- 摘要: Meta公司计划使用隐私意识较强的欧洲用户数据来训练其人工智能模型,然而此举引发了隐私保护方面的担忧。
大模型产品
- 摘要: Active Recall通过摘要和知识图谱帮助你记住90%的内容,并根据学习曲线定期提醒,确保信息不被遗忘。
- 摘要: Elai让学习者超越观看,添加互动元素,打造游戏化的学习体验,提高参与度和学习效果。
- 摘要: 利用AI技术,快速将平铺照片转换为真实人模照片,提升产品展示效果,节省时间和成本,100%无版权问题。
- 摘要: Afforai是一款AI驱动的参考文献管理工具,帮助您随时随地管理论文和研究资料。限时在AppSumo提供终身优惠。
- 摘要: Zeacon为网站提供视频托管、组织和分析服务,AI营销员持续学习以吸引、互动和转化更多访客。
- 摘要: EducUp Study是一款AI驱动的工具,可将任何想法、文本、视频、链接或PDF转化为互动游戏化课程,适合语言学习、考试准备和内容总结。
- 摘要: 通过AI婚礼主题生成器,分享爱情故事,探索颜色、场地、装饰和花卉风格,获得专属推荐。
- 摘要: Invisibility为Mac用户提供统一订阅,整合GPT-4o、Claude 3 Opus、Gemini和Llama 3。按Option+Space即可调用,无需截图或复制粘贴。
- 摘要: TeamCreate提供多功能AI工人,可用于财务、销售等领域。通过Slack部署,支持200+应用,无需信用卡,送$50免费额度。
- 摘要: Luna Ring获2024红点奖,全天候监测睡眠、心脏健康、活动数据,帮助您提升效率,理解压力和准备状态。
大模型论文
- 摘要: UMBRELA是一个开源工具,复现了Bing相关性评估研究。利用GPT-4模型,提供高质量的相关性判断,并可集成到现有检索系统中。
- 摘要: LlamaGen应用自回归模型进行图像生成,超越扩散模型,提升生成质量和推理速度,并开源模型和代码。
- 摘要: Merlin是一个3D视图语言模型,通过CT扫描、EHR诊断码和放射报告进行训练,提升自动医学图像解读性能。
- 摘要: NarrativeBridge通过CTN基准和CEN架构,提升视频字幕生成的因果和时间叙事能力,显著优于现有模型。
- 摘要: 本文提出PH-LLM模型,通过数值时间序列数据生成个性化健康见解,并在睡眠和健身领域表现优异。
- 摘要: AID通过引入多模态大语言模型和双查询Transformer架构,实现了文本引导的视频预测,在多个数据集上表现优异。
- 摘要: 本文介绍了个人健康见解代理系统(PHIA),通过分析可穿戴设备数据提供个性化健康分析,准确度超过83%。
- 摘要: 本文提出一种结合计算预算的评估框架,发现简单基线在相同计算资源下常优于复杂推理策略。
- 摘要: 本文提出了一种评价RAG问答系统中检索组件的基准方法,展示了其对系统整体性能的影响。
- 摘要: 本文介绍了通过微调OpenAI模型和Langchain提示工程管道,在乳腺癌辅助放疗和化疗分类中取得高准确率的研究。
大模型开源项目
- 摘要: EricLBuehler项目使用Rust语言编写,提供极其快速的LLM推理能力,适用于高性能需求的AI应用。
- 摘要: Litestar是一个生产级、轻量、灵活且可扩展的ASGI API框架,用Python编写,轻松构建高效API。
- 摘要: aider是一个用Python编写的终端AI编程助手,旨在提供AI配对编程功能,提升开发效率。
- 摘要: Karpathy项目提供最简单、最快速的Python库,用于训练和微调中型GPT模型,适合快速开发和实验。
- 摘要: xenova项目允许用户直接在浏览器中运行顶尖的机器学习模型,如🤗 Transformers,无需服务器支持,使用JavaScript编写。
- 摘要: 该项目包含论文《语言模型是无监督多任务学习者》的代码,使用Python编写,展示了语言模型的多任务学习能力。
- 摘要: blakeblackshear项目,使用Python编写,实现IP摄像头的实时本地目标检测功能。
- 摘要: 提供示例Jupyter笔记本,演示如何使用Amazon SageMaker构建、训练和部署机器学习模型。