Transformers.js v2.11 发布,迄今为止最大版本之一,包含 8 个令人兴奋的新模型!

12 月 13 日,Transformers.js 作者 Joshua Lochner 在 GitHub 宣传 Transformers.js v2.11 发布。

他称:Transformers.js v2.11 是我们迄今为止推出的最大版本之一,包含了8个令人兴奋的新模型!

现在支持 73 种不同的模型架构!

1、 ViTMatte 用于图像抠图: 直接在你的浏览器中将图像分离成前景和背景!这将为一些酷炫的图像编辑网页应用带来新风貌!

2、Chinese-CLIP 用于中文的零样本图像分类:根据训练过程中未曾见过的标签来分类图像。

如果你是一位对在网页应用中加入 AI 感兴趣的中国前端开发者,请告诉我们接下来应该添加哪些模型!

3、 ESM 用于蛋白质序列的特征提取、分类、掩码语言建模和零样本分类。****

由于 Transformers.js 在你的浏览器本地运行 AI 模型(即,无需服务器),这对隐私保护有巨大好处:特别是在医疗应用上!

4、Hubert 用于音频分类和自动语音识别。

5、DINOv2 用于图像分类。

6、ConvBERT 用于掩码语言建模、文本/符号分类和问题回答。

7、ELECTRA 用于特征提取。

**8、最后,Phi 用于文本生成!

**注意:这仅添加了对架构的支持。当外部数据格式在 ONNX Runtime 中得到支持时,我们将发布一个更新,其中包括可用的 Phi 模型的转换版本。

你能相信这些模型全部都能在你的浏览器本地完全运行吗?无需安装!PS:如果你对了解更多感兴趣,请查看Transformers.js文档!

新示例:语义音乐搜索应用程序

在上次发布中,我们添加了对 CLAP 模型(音频版的 CLIP)的支持,因此在这一次,我们推出了一个简单的演示应用程序,展示了如何使用 CLAP 模型来执行实时语义音乐搜索!为了简化,我们使用纯 JavaScript 实现了所有功能,但您可以随意将其适配到您选择的框架中!一如既往,源代码是开源的!🥳

相关推荐
VidDown8 分钟前
VidDown 工具站:免费、本地优先的开发者工具箱
javascript·编辑器·音视频·视频编解码·视频
触底反弹2 小时前
🚀 手把手用 HTML5 Canvas 从零打造飞机大战游戏,代码全开源!
前端·javascript·canvas
DJ斯特拉2 小时前
axios快速使用
开发语言·前端·javascript
智通2 小时前
可取消的异步任务与 AbortController
javascript
Hilaku2 小时前
AI 写代码越快,为什么 Code Review 越不能省?
前端·javascript·程序员
HjhIron3 小时前
CSS 3D 世界:从盒子模型到三维空间动画
javascript·css
VidDown4 小时前
显卡处理视频技术详解:从硬解码到 NVENC,GPU 如何让视频处理起飞?
javascript·编辑器·音视频·视频编解码·视频
代码不加糖4 小时前
Proxy能够监听到对象中的对象的引用吗?
开发语言·前端·javascript
大家的林语冰4 小时前
连 Markdown 都不放过,Rust 在前端基建杀疯了,万物皆可“锈化“!
前端·javascript·markdown
想吃火锅10054 小时前
【前端手撕】instanceof
前端·javascript·原型模式