在数字化浪潮的推动下,人工智能(AI)正成为塑造未来的关键力量。硅纪元视角栏目紧跟AI科技的最新发展,捕捉行业动态;提供深入的新闻解读,助您洞悉技术背后的逻辑;汇聚行业专家的见解,分享独到的视角和思考;精选对您有价值的信息,帮助您在AI时代中把握机遇。
1分钟速览新闻
-
Meta新网络爬虫助力AI模型数据收集
-
百度领跑中国大模型市场,商汤、智谱紧随其后
-
OpenAI GPT-4惊人潜力:AI模拟蛋白质结构获突破
-
中国移动智算中心哈尔滨节点月底投用,算力达6.6EFLOPS
-
谷歌Pixel 9 AI图像生成工具引发争议
-
宇树科技G1人形机器人升级:悟空造型亮相2024世界机器人大会
-
微软发布突破性Phi-3.5系列AI模型
-
D-ID发布AI视频翻译工具:语音克隆与唇形同步
-
Midjourney开放免费额度,引发AI创作热潮
全球AI新闻
一、Meta新网络爬虫助力AI模型数据收集
Meta近日悄无声息地发布了名为Meta External Agent的新网络爬虫,旨在搜集互联网上的海量数据以支持其人工智能模型的训练。这款爬虫与OpenAI的GPTBot类似,能够抓取新闻文章、在线讨论等文本数据。尽管Meta未公开宣布这一消息,但其新爬虫的存在表明公司对高质量训练数据的需求日益增长。与此同时,全球只有2%的网站屏蔽了Meta的新爬虫,远低于25%的网站对GPTBot的屏蔽率。这表明Meta在数据收集方面拥有更大的自由度,有望进一步提升其AI模型的性能。
二、百度领跑中国大模型市场,商汤、智谱紧随其后
国际数据公司(IDC)发布的《中国大模型平台市场份额,2023》报告显示,2023年中国大模型平台及相关应用市场规模达到17.65亿元人民币。百度智能云以3.5亿元、19.9%的市场份额位居第一,商汤科技以16%的市场份额紧随其后,智谱AI位居第三。尽管大模型技术仍不成熟,但预计未来2-3年市场格局将发生巨变,头部互联网公司的投入和价格战将给初创企业带来竞争压力。报告还指出,大语言模型创新接近收敛,而多模态、视频大模型等新兴领域技术尚不成熟,市场对这些产品需求迫切。
三、OpenAI GPT-4惊人潜力:AI模拟蛋白质结构获突破
罗格斯大学研究发现,OpenAI的GPT-4 AI模型展现出高精度模拟氨基酸和蛋白质结构的能力。该模型能准确预测20种标准氨基酸的三维结构,以及α-螺旋等蛋白质结构元素。GPT-4还成功分析了抗病毒药物Nirmatrelvir与SARS-CoV-2主要蛋白酶的结合。尽管GPT-4并非专为结构生物学设计,其在该领域的潜力已引起科研人员关注,未来有望进一步探索AI在生命科学其他领域的应用。
四、中国移动智算中心哈尔滨节点月底投用,算力达6.6EFLOPS
中国移动智算中心(哈尔滨)节点超万卡智算集群将于8月30日正式投用,其单集群算力规模、国产化网络设备组网规模、融合分级存储规模均居国内首位。该中心的投用将显著提升哈尔滨在人工智能研发领域的地位,为万亿级模型训练提供高效、稳定的算力支持。根据《智能计算中心创新发展指南》预测,"十四五"期间智算中心投资可带动人工智能核心产业及相关产业实现高速增长,到2030年人工智能核心产业规模有望超过1万亿元,相关产业规模超过10万亿元。
五、谷歌Pixel 9 AI图像生成工具引发争议
谷歌最新发布的Pixel 9系列手机搭载了名为Pixel Studio的AI图像生成工具,引发广泛争议。该工具能根据文本提示生成各种图像,但评测人员发现其可能被用于生成不当内容,如纳粹标志、枪支等。尽管谷歌已采取一定安全措施,但"重构"功能仍可向图片添加逼真的虚假对象,令人担忧其被用于造假。谷歌表示将继续完善保障措施,以防止工具被滥用。
六、宇树科技G1人形机器人升级:悟空造型亮相2024世界机器人大会
宇树科技对G1人形机器人进行量产设计升级,新增单脚跳、360°旋转跳等动作,提升平衡性能,可模仿马力欧顶金币。机器人重35kg,高127cm,23-43个关节电机,最大扭矩120N·m,支持AI驱动学习。官方还推出"悟空"造型版本,已在2024世界机器人大会上展出。
七、微软发布突破性Phi-3.5系列AI模型
微软公司推出Phi-3.5系列AI模型,包括首款混合专家模型Phi-3.5-MoE、增强型图像理解模型Phi-3.5-vision和轻量级高性能模型Phi-3.5-mini。Phi-3.5-MoE在标准AI基准测试中性能超越多个竞争对手,接近行业领先水平。Phi-3.5-vision在多帧图像理解方面取得显著性能提升。Phi-3.5-mini以38亿参数在多语言任务中展现出色竞争力,支持128K上下文窗口,远超主要竞争对手。这三款模型均基于合成数据和过滤公开网站构建,上下文窗口达128K,现已在Hugging Face平台以MIT许可方式发布。
八、D-ID发布AI视频翻译工具:语音克隆与唇形同步
D-ID公司推出了一款名为Video Translate的AI视频翻译工具,该工具在Product Hunt上线,可实现视频多语言转换并支持AI唇形同步和声音克隆。目前,D-ID订阅者可以免费使用这项服务。Video Translate旨在改变全球视频交流方式,让任何语言的观众都能理解热门视频内容。
九、在Flux和Ideogram 2.0的竞争压力下,Midjourney每日开放25张免费额度
在Flux和Ideogram 2.0的竞争压力下,Midjourney于2024年8月22日宣布向所有用户每天提供免费的25张照片生成额度。用户可以直接在网页上生成图片,通过探索面板选择图片并查看提示词和风格,一键复制后即可生成具有特定风格和提示词的新图片。此外,用户还可以在Chat面板上实时查看其他人生成的图片。这一举措不仅降低了AI创作的门槛,也激发了用户的创造力,有望引发一场AI创作的热潮。