对话思必驰:语音+AIGC的时代才刚刚开始

思必驰的价值在于开创了以语音技术为基础,打开了用人机交互解决方案构建软硬件智能化的崭新篇章。具象地说,它不仅是ChatBot,更像是"Jarvis"。

@数科星球原创

作者丨苑晶

编辑丨大兔

2023年已过半,人工智能已成为全社会所关注的焦点,时至今日,我们正在大踏步地向智能时代迈进。

在过去,数科星球(ID:digital-planet)的团队已走访近百家相关企业。一些企业展示了其应用的落地能力,思必驰便是其中一家。

成立于2007年,思必驰可算人工智能行业的资深企业。同为剑桥大学毕业生,高始兴和俞凯为这家公司打下了十足的技术烙印。现在思必驰已成为苏州地区头部人工智能企业,旗下产品为不同行业提供人工智能解决方案,包括语音识别、自然语言处理、机器学习等技术。

在日前,思必驰的DFM-2东风大模型发布会中,该公司创始人和首席科学家详尽地展示了这家企业的战略战术。对比其他行业参与者,思必驰更加务实且具有远瞻眼光。

01

服务业行业的"专用模型"

如果抛开大模型不谈,思必驰是一家以AI语音语言技术为核心的人机交互解决方案提供商。

比如,在远程会议场景中,它拥有降噪麦克风音箱,其中结合了360°全向识音、语音转文字、会议记录、蓝牙音箱等功能。这个系列的产品能有效过滤周围噪音并记录多人员说话内容,在"定向识音"功能里,可以指定识别说话区域、自动消除其他区域噪音。

诸如此类的软硬件AI产品还可以应用到智能家居、智能客服、智能车载等场景中,并在金融、交通和政务领域被广泛应用。

在大模型时代来临后,思必驰自研的DFM-2大模型问世,AGI开始落地具体行业。在这场围绕"真正的人工智能"的竞争中,思必驰拥有语音技术和落地能力两大优势。其所推行的"专用模型"概念区别于通用大模型产品,旨在更专注地在具体行业落地、推动不同行业进行智能化升级。

目前,DFM-2大模型已逾百亿级参数。

02

垂直行业的智能化前景

语音结合大模型,更像是《钢铁侠》里的"Jarvis"。

这是一条看起来很炫、做起来很难的技术路线。不过,让思必驰有信心的是,他们已经在包括前端声学信号处理、语音识别、声纹识别、自然语言理解及生成、对话管理和语音合成等一系列技术积累十余年。

此次敢于与众不同,实则属厚积薄发。

虽是智能化,但在车联网、物联网、金融和公安政务等场景中,不同领域对智能化的需求不同。所以,其在硬件功耗、算力、安全性、云端配置和跨系统操作等细节上的要求也不尽而同。

为了能达到更好的用户体验,让不同行业都能用上智能化产品,思必驰给出的方案是搭建专用模型、运用标准化解决方案帮助其构建全链路人机对话能力。"为此,我们推出由软及硬的多款标准化AI产品,包括对话软件、芯片、模组和整机产品。"思必驰董事长、CEO高始兴对数科星球(ID:digital-planet)说。

很显然,这种方式可更好地让大模型实现数据-能力的循环,同时,也对智能化供应商提出了不小的挑战。

高始兴认为,在未来,每个行业都可能会出现一个超级大脑或超级助理,而在这个过程中,智能化的增量场景中会率先吃到第一杯羹。

比如,在汽车或电动汽车行业中,人机对话将内嵌至智能系统中,以进一步激活用户在"第三空间"内的语音交互需求;

随着客厅、卧室、厨房、卫生间、阳台、运动休闲、娱乐、办公等各种场景逐步实现智能化升级,家电甚至茶吧机、麻将桌、按摩椅、跑步机等产品都将拥有新的智能化产品,人机对话将成为新产品的特色卖点。

值得注意的是,思必驰的"专用模型"更强调人机交互解决方案,是自然语言(尤其是语音)和硬件结合的桥梁,它属于针对垂域的、具有通用智能的行业语言大模型。该公司联合创始人、首席科学家俞凯强调:"我们和其他垂域的行业大模型没有竞争关系,各自在领域中将技术投入产业应用,是可以合作的对象。"

03

To B行业里的复杂性与特殊性

众所周知,人工智能技术的发展正在推动着各个行业的智能化升级,尤其是在To B领域。

对比To C领域,企业级市场对生成式内容的确切性和安全性要求更高。这既可以被看成是新的增量市场,也可以被看作是AI公司新的机遇。

思必驰给出的行业解法是,基于通用人工智能逐步发展出规模化定制能力和产品标准化能力。基于多种行业解决方案,以覆盖客户企业"千人千面"的需求。据俞凯透露,其旗下个性化语音交互方案已实现了人机口语对话系统的"柔性批量制造"。

其中,在汽车领域中,该公司的产品已进入车前装、后装市场,并取得了包括上汽通用五菱、长城、合众新能源、比亚迪、小鹏、理想等共计26家车企100多个车型的量产"上车"。另外,在其最新公布的合作名单中,还出现了梅赛德斯奔驰等国际合作伙伴。

在家电行业内,思必驰已揽获海尔、海信、长虹、美菱、老板电器、追觅、科沃斯和云米等多个头部合作伙伴。在新品中,智能助手和智能秘书成为了消费者喜闻乐见的功能之一。

在金融领域,语音的需求同样正在增长之中。以智能外呼机器人为例,思必驰已拥有交通银行、建设银行、浦发银行、招商银行和中信银行等多个客户。

自2007年创立、国内第一个将人机对话理念引入中国,再到2023年发布DFM-2东风大模型。这些年,高始兴、俞凯和思必驰的团队走过了人工智能最艰难的发展时期,开始迎来曙光。现在,这家公司所推出的解决方案正在大批量运用到各行各业中。

可以预见,在不远的将来,每个行业里都可以做出自己的"Jarvis"。

相关推荐
深度学习实战训练营1 小时前
基于CNN-RNN的影像报告生成
人工智能·深度学习
昨日之日20063 小时前
Moonshine - 新型开源ASR(语音识别)模型,体积小,速度快,比OpenAI Whisper快五倍 本地一键整合包下载
人工智能·whisper·语音识别
浮生如梦_3 小时前
Halcon基于laws纹理特征的SVM分类
图像处理·人工智能·算法·支持向量机·计算机视觉·分类·视觉检测
深度学习lover3 小时前
<项目代码>YOLOv8 苹果腐烂识别<目标检测>
人工智能·python·yolo·目标检测·计算机视觉·苹果腐烂识别
热爱跑步的恒川4 小时前
【论文复现】基于图卷积网络的轻量化推荐模型
网络·人工智能·开源·aigc·ai编程
阡之尘埃6 小时前
Python数据分析案例61——信贷风控评分卡模型(A卡)(scorecardpy 全面解析)
人工智能·python·机器学习·数据分析·智能风控·信贷风控
孙同学要努力8 小时前
全连接神经网络案例——手写数字识别
人工智能·深度学习·神经网络
Eric.Lee20218 小时前
yolo v5 开源项目
人工智能·yolo·目标检测·计算机视觉
其实吧39 小时前
基于Matlab的图像融合研究设计
人工智能·计算机视觉·matlab
丕羽9 小时前
【Pytorch】基本语法
人工智能·pytorch·python