12 月 13 日,Transformers.js 作者 Joshua Lochner 在 GitHub 宣传 Transformers.js v2.11 发布。
他称:Transformers.js v2.11 是我们迄今为止推出的最大版本之一,包含了8个令人兴奋的新模型!
现在支持 73 种不同的模型架构!
1、 ViTMatte 用于图像抠图: 直接在你的浏览器中将图像分离成前景和背景!这将为一些酷炫的图像编辑网页应用带来新风貌!
2、Chinese-CLIP 用于中文的零样本图像分类:根据训练过程中未曾见过的标签来分类图像。
如果你是一位对在网页应用中加入 AI 感兴趣的中国前端开发者,请告诉我们接下来应该添加哪些模型!
3、 ESM 用于蛋白质序列的特征提取、分类、掩码语言建模和零样本分类。****
由于 Transformers.js 在你的浏览器本地运行 AI 模型(即,无需服务器),这对隐私保护有巨大好处:特别是在医疗应用上!
4、Hubert 用于音频分类和自动语音识别。
5、DINOv2 用于图像分类。
6、ConvBERT 用于掩码语言建模、文本/符号分类和问题回答。
7、ELECTRA 用于特征提取。
**8、最后,Phi 用于文本生成!
**注意:这仅添加了对架构的支持。当外部数据格式在 ONNX Runtime 中得到支持时,我们将发布一个更新,其中包括可用的 Phi 模型的转换版本。
你能相信这些模型全部都能在你的浏览器本地完全运行吗?无需安装!PS:如果你对了解更多感兴趣,请查看Transformers.js文档!
新示例:语义音乐搜索应用程序
在上次发布中,我们添加了对 CLAP 模型(音频版的 CLIP)的支持,因此在这一次,我们推出了一个简单的演示应用程序,展示了如何使用 CLAP 模型来执行实时语义音乐搜索!为了简化,我们使用纯 JavaScript 实现了所有功能,但您可以随意将其适配到您选择的框架中!一如既往,源代码是开源的!🥳