今日 AI 简报|百度推出检索增强的文生图技术、开源表格处理大模型、蛋白质结构预测、3D 生成、短视频生成、PDF 翻译工具

❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦


TableGPT2:浙大推出的多模态表格处理大模型

TableGPT2 是浙江大学推出的新型大型多模态模型,针对表格数据的整合与处理。它首次将结构化数据作为独立模态进行训练,直接理解并操作数据库和 Excel 等数据,执行 SQL 查询、数据分析等任务。模型包含创新的表格编码器,强化对不规则表格和模糊查询的处理能力,在多个基准测试中性能显著提升。

资源

  1. HuggingFace 模型库:huggingface.co/tablegpt/Ta...
  2. arXiv 技术论文:arxiv.org/pdf/2411.02...

AlphaFold 3:谷歌 DeepMind 开源的结构预测统一框架

AlphaFold 3 是谷歌 DeepMind 团队推出的 AI 模型,能预测蛋白质、核酸(DNA 和 RNA)、小分子、离子及修饰残基等生物分子的三维结构。模型在结构预测的准确性上取得革命性进展,对药物设计、科研和生物医学领域具有重大影响。

资源

  1. GitHub 仓库:github.com/google-deep...
  2. 技术论文:www.nature.com/articles/s4...

GenXD:新加坡国立和微软共同推出的通用 3D 和 4D 联合生成框架

GenXD 是新加坡国立大学和微软公司共同推出的 3D-4D 联合生成框架,能从任意数量的条件图像中生成高质量的 3D 和 4D 场景。框架用一个数据整理流程从视频中提取相机姿态和物体运动强度,基于这些信息及大规模 4D 数据集 CamVid-30K 训练模型。GenXD 基于多视角时序模块解耦相机和物体的运动,用掩码潜在条件支持多种视角的条件生成,实现在单一模型中处理多种 3D 和 4D 生成任务。

资源

  1. 项目官网:gen-x-d.github.io
  2. GitHub 仓库:github.com/HeliosZhao/...
  3. arXiv 技术论文:arxiv.org/pdf/2411.02...

MoneyPrinterTurbo:开源的 AI 短视频生成工具

MoneyPrinterTurbo 是开源的 AI 短视频生成工具,能自动化地根据用户提供的视频主题或关键词生成视频文案、素材、字幕和背景音乐,合成高清短视频。工具支持 API 和 Web 界面操作,具备自定义文案、多种视频尺寸、批量视频生成、多语言支持、多种语音合成技术、字幕定制和背景音乐选择等功能。MoneyPrinterTurbo 兼容多种 AI 模型,确保视频素材高清无版权问题,适合内容创作者和营销人员使用。

资源

  1. GitHub 仓库:github.com/harry0703/M...

PDFMathTranslate:开源的 PDF 文档翻译和双语对照工具

PDFMathTranslate 是开源的 PDF 文档翻译工具,设计用于翻译科技论文等 PDF 文件,能保留原文的排版,包括公式和图表。PDFMathTranslate 支持双语对照,保持原有目录结构,兼容多种翻译服务,如 Google、DeepL、Ollama 和 OpenAI 等。用户基于命令行工具操作,实现文档的快速翻译和双语对照查看。

资源

  1. GitHub 仓库:github.com/Byaidu/PDFM...

文心 iRAG:百度推出的检索增强的文生图技术

文心 iRAG 是百度推出的检索增强的文生图技术(iRAG),结合了百度搜索的亿级图片资源和强大的基础模型能力,解决大模型在文生图方面的幻觉问题,提升 AI 生成图片的真实性和可靠性。基于 iRAG 技术,AI 能生成逼真、无误的图片,显著提高 AI 在图像生成领域的实用性和准确性。

资源

  1. 项目官网:wenxin.baidu.com

❤️ 如果你也关注大模型与 AI 的发展现状,且对大模型应用开发非常感兴趣,我会快速跟你分享最新的感兴趣的 AI 应用和热点信息,也会不定期分享自己的想法和开源实例,欢迎关注我哦!

🥦 微信公众号|搜一搜:蚝油菜花 🥦

相关推荐
猿类崛起@几秒前
百度千帆大模型实战:AI大模型开发的调用指南
人工智能·学习·百度·大模型·产品经理·大模型学习·大模型教程
sdaxue.com1 分钟前
人工智能就业方向及前景以及薪资水平
人工智能
寻道码路2 分钟前
探秘 Docling:多格式文档解析转换大揭秘,赋能 AI 应用新生态
人工智能·aigc·ai编程
健忘的派大星2 分钟前
【AI大模型】根据官方案例使用milvus向量数据库打造问答RAG系统
人工智能·ai·语言模型·llm·milvus·agi·rag
黑客-雨4 分钟前
从零开始:如何用Python训练一个AI模型(超详细教程)非常详细收藏我这一篇就够了!
开发语言·人工智能·python·大模型·ai产品经理·大模型学习·大模型入门
是Dream呀4 分钟前
引领AI发展潮流:打造大模型时代的安全与可信——CCF-CV企业交流会走进合合信息会议回顾
人工智能·安全·生成式ai
日出等日落5 分钟前
小白也能轻松上手的GPT-SoVITS AI语音克隆神器一键部署教程
人工智能·gpt
孤独且没人爱的纸鹤18 分钟前
【机器学习】深入无监督学习分裂型层次聚类的原理、算法结构与数学基础全方位解读,深度揭示其如何在数据空间中构建层次化聚类结构
人工智能·python·深度学习·机器学习·支持向量机·ai·聚类
后端研发Marion20 分钟前
【AI编辑器】字节跳动推出AI IDE——Trae,专为中文开发者深度定制
人工智能·ai编程·ai程序员·trae·ai编辑器
Tiger Z43 分钟前
R 语言科研绘图 --- 散点图-汇总
人工智能·程序人生·r语言·贴图