技术栈
共绩算力
共绩算力
15 天前
人工智能
·
llama
·
共绩算力
Llama 4 Maverick Scout 多模态MoE新里程碑
Meta Llama 4 Maverick和Scout模型近日在Hugging Face Hub上发布 这标志着大型语言模型发展的一个重要飞跃 两款模型均采用原生多模态MoE架构 不仅能力强大 而且在长文本处理方面展现了惊人创新
共绩算力
19 天前
人工智能
·
共绩算力
Ming Lite 万能模型对标 GPT-4o 的多模态能力
inclusionAI 团队近日发布的 Ming Lite 万能模型,是一款仅需 2.8 亿激活参数的轻量级多模态模型,却实现了前所未有的全模态感知与生成能力,首次在开放领域向 GPT-4o 的多模态支持范围发起挑战,无疑是 AI 社区的一枚重磅炸弹。
共绩算力
20 天前
人工智能
·
ai作画
·
共绩算力
混元图像3.0开源原生多模态生图新篇章
腾讯近期正式发布了HunyuanImage 3.0 这款模型以其80B的参数规模和工业级原生多模态架构 成为目前开源生图领域的佼佼者。它不仅免费开放使用 其生成效果和语义理解能力已能对标业界头部闭源模型 为AI爱好者和开发者带来了前所未有的创作工具。
共绩算力
20 天前
人工智能
·
共绩算力
Google发布Gemma 3 多模态多语言大模型
Google正式推出Gemma家族的最新力作Gemma 3,这标志着开源AI领域又一次重要突破。Gemma 3不仅继承了前代模型的优秀基因,更在多模态理解、多语言支持以及超长上下文处理方面实现了飞跃,为开发者和研究者提供了前所未有的强大工具。
共绩算力
1 个月前
人工智能
·
whisper
·
语音识别
·
共绩算力
OpenAI Whisper 语音识别模型:技术与应用全面分析
OpenAI 于2022年12月开源的 Whisper 模型,凭借 多语言支持(98种语言)、零样本迁移能力、噪声鲁棒性 等核心优势,迅速成为语音识别领域的“明星工具”。其在英语语音识别任务中接近人类水平(LibriSpeech测试清洁切分WER达2.5%),同时支持语音翻译、语言识别等多任务,无需针对特定场景微调即可直接应用 。
我是有底线的