【AI News | 20250729】每日AI进展

AI Repos

1、500-AI-Agents-Projects

该资料库精选并收录了500多个跨行业AI Agent用例,展示了AI代理在医疗、金融、教育等领域的实际应用,并提供了开源项目链接供参考实现。它详尽罗列了基于CrewAI、AutoGen、Agno和Langgraph等主流框架的AI Agent应用,涵盖了从邮件自动化、市场分析到代码生成、供应链优化等广泛场景。无论是开发者、研究者还是商业爱好者,该资源库都是获取AI Agent灵感和学习的理想之选,旨在推动AI代理技术的实际落地和行业转型。

2、autoclip_mvp

AutoClip是一款利用AI技术实现视频智能切片和合集推荐的工具。它支持自动下载Bilibili视频并提取字幕,进而分析视频内容生成高质量切片,并智能推荐相关合集。用户可通过现代化的Web界面进行手动编辑和一键打包下载。系统基于Python和React开发,支持通义千问AI模型,旨在简化视频内容创作和管理流程,提升效率与用户体验。

3、abogen

Abogen是一款强大的文本转语音工具,能将ePub、PDF或TXT文件快速转换为高质量音频,并自动生成精确同步的字幕。它采用Kokoro-82M模型,提供自然流畅的语音,适用于制作有声读物、社交媒体配音等多种场景。Abogen支持多平台安装,具备用户友好的图形界面,提供语速调节、多语言支持、自定义音色混合、队列处理及章节/元数据控制等丰富功能,旨在简化音频内容创作流程。

AI News

1、香港理工大学与蚂蚁数科携手共建AI+Web3联合实验室

香港理工大学与蚂蚁数科签署战略合作协议,共同建立"香港理大---蚂蚁数科AI+Web3联合实验室",旨在探索人工智能与Web3技术的融合发展。蚂蚁数科计划在未来三年内投入最高1亿港元支持实验室的研究与项目孵化。实验室将聚焦可信AI智能体、AI增强的区块链安全框架及数据隐私与可验证技术等领域,同时构建"AI + Web3教育基金平台",培养数字科技人才,助力香港建设全球科创中心。

2、微软Edge浏览器Copilot模式

微软近日为其Edge浏览器推出了革命性的Copilot模式,通过集成先进的AI功能,如多标签RAG和Copilot Vision,为用户提供智能化的浏览体验。这些功能能够自动分析、总结和推理多个标签页的内容,实时分析屏幕信息,以及自动生成视频摘要等,极大提升了信息处理效率和用户体验。微软的这一创新标志着浏览器向AI驱动的协作平台转型的开始,展现了AI技术在浏览器领域的巨大潜力。

3、中国移动发布'九天'基础大模型3.0

中国移动在2025世界人工智能大会上发布了自主研发的'九天'基础大模型3.0,展示了其在人工智能领域的深厚实力和创新能力。该模型在语言、代码、数学及多模态处理等方面实现了显著的技术突破,并在多个国际评测中取得领先成绩。中国移动还采取了开放策略,将多项模型及核心技术开源,旨在推动行业共同发展。

4、上海AI实验室开源科学多模态大模型Intern-S1

在2025世界人工智能大会上,上海人工智能实验室发布了开源的科学多模态大模型Intern-S1,该模型结合了书生大模型家族的优势,实现了语言和多模态性能的均衡发展,并在化学、材料和地球科学等多个领域的任务上超越了顶尖的闭源模型Grok-4。同时,实验室还推出了科学发现平台Intern-Discovery,旨在提升研究者、研究工具和研究对象的协同能力。Intern-S1的创新技术为科研人员提供了强大的支持,未来将继续推动多智能体虚拟疾病学家系统的开发,助力科研的持续进步。

5、蚂蚁数科推出金融推理大模型Agentar-Fin-R1

在世界人工智能大会论坛上,蚂蚁数科发布了基于阿里巴巴通义千问Qwen3大模型打造的金融推理大模型Agentar-Fin-R1。该模型在金融行业的专业性、推理能力及安全合规方面表现卓越,已在多个权威评测中超越同类产品。蚂蚁数科通过构建全面的金融任务分类体系和利用千亿级金融专业数据语料,展现了其在金融AI领域的深厚实力。此外,Agentar-Fin-R1的应用已助力上海某银行实现用户满意度提升和月活用户增长。

6、阶跃星辰发布新一代Step3大模型

阶跃星辰在2025世界人工智能大会前夕发布了新一代基础大模型Step3,该模型在智能性和推理效率上取得突破,计划于7月31日开源。阶跃星辰还联合多家芯片和平台厂商成立了"模芯生态创新联盟",并与上海国有资本投资有限公司达成战略合作,以加速大模型在各行业的应用。Step3作为首个全尺寸原生多模态推理模型,在视觉感知和复杂推理方面表现卓越,推理效率在多种硬件平台上均有显著提升。

7、OpenAI GPT-5震撼发布:多版本亮相,重新定义AI编程与智能边界

OpenAI最新力作GPT-5悄然进入公众视野,推出包括GPT-5-pro、GPT-5-high、GPT-5-mini和GPT-5-nano在内的多个版本。实测显示,GPT-5-pro展现惊人能力,一键生成网站、为经典游戏添加功能等;GPT-5-high则能构建宇宙飞船控制面板等复杂项目。业内分析认为,GPT-5将彻底改变编程领域,提升AI在编程、研究和问题解决中的角色,推动进入全新智能时代。

8、Harmonic推出无幻觉AI聊天机器人亚里士多德

Harmonic近日推出了iOS和Android平台的AI聊天机器人应用亚里士多德,旨在提供精准的数学推理答案。该应用目前处于测试阶段,利用开源编程语言Lean进行算法验证,确保输出无幻觉。公司近期完成了1亿美元的B轮融资,估值达8.75亿美元,展现了快速发展的势头。亚里士多德的目标是实现数学超智能,帮助用户解决数学相关领域的问题。

文章内容引用自:jungleBlog

相关推荐
yj15583 分钟前
装修风格怎么选
python
泰Tai4 分钟前
【YOLOv8学习】WSL2中安装标注软件X-AnyLabeling
python·图像识别
笔触狂放5 分钟前
【机器学习】第九章 综合实战
人工智能·机器学习
玄明Hanko5 分钟前
从需求、开发、测试到运维,程序员效率飙升的秘密曝光
人工智能·ai编程
玄明Hanko5 分钟前
百度开源 ERNIE 4.5,将给国内大模型生态带来哪些影响
人工智能·文心一言·ai编程
analywize7 分钟前
diffusion原理和代码延伸笔记1——扩散桥,GOUB,UniDB
人工智能·笔记·深度学习·机器学习·diffusion·扩散桥
玄明Hanko7 分钟前
DeepSeek开源 vs 文心4.5开源
人工智能·文心一言·deepseek
柠檬味拥抱10 分钟前
基于迁移学习的智能代理在多领域任务中的泛化能力探索
人工智能
数字化观察36 分钟前
博创软件数智通OA平台:高效协同,安全办公新选择
大数据·人工智能
zhongqu_3dnest39 分钟前
数字化应急预案:构筑现代安全防线
人工智能·vr