语言模型测试系列【9】

语言模型

  1. 文心一言
  2. 讯飞星火
  3. 通义千问2.5
  4. 豆包
  5. 360智脑
  6. 百小应
  7. 腾讯元宝
  8. Kimi
  9. C知道

好长时间没有做语言模型的测试了,一方面是没有好的素材,各模型都在升级优化,而且频率很高;另一方面近期在阅读和学习其他的知识,所以更的也少了。本次发布的文章同时更新了部分大模型的称呼。

提问及回答

问题 :Qwen1.5-7B-Chat
说明 :对,没错,问题就是这个千问的语言模型,最近在研究语言模型这款的搭建和使用,不经意间就想问Qwen1.5-7B-Chat相关的内容,但不知道从何问起,于是就只是把模型名输出来,让个各大模型来给我提供一些灵感了。

文心一言

讯飞星火

通义千问2.5

豆包

360智脑

百小应

腾讯元宝

Kimi

C知道


对比分析

这次的的对比很明显的豆包文心一言讯飞星火 胜出,这两个大模型的回答都很准确,而且回答内容各有千秋,都能用上,特别是豆包 的理解过程,提供出了搜索来源;而文心一言 后面有度娘这么大一搜索平台支撑,确没有提供出这点功能展示,着实有点小失落;讯飞星火提供的摩搭平台的资料来源,着实是一大助力,对搭建模型的研究来说,很是及时。

至于腾讯元宝把这个模型占为己有的做法。。。,这里就不做评论了,貌似腾讯的好多应用都有类似案例

其他模型嘛,除了C知道的回答里可以转成"思维导图"的设计,着实是一个亮点。

从上面几个大模型的回答,从主观意识上对比如下:

模型名称 回答内容
文心一言 准确
讯飞星火 准确
通义千问2.5 没回答出来
豆包 准确
360智脑 没回答出来
百小应 没回答出来
腾讯元宝 回答错误
Kimi 没回答出来
C知道 没回答出来

总结

对于当前搜索模型的需求来说,讯飞星火 提供的摩搭资源链接,确实是很不错的回答;其次就是豆包 的搜索来源提供,可以让我们更方便的有据可循、追本溯源。
文心一言,我觉得可以多借鉴一下其他模型,继续优化自身,当然了,因为3.5是免费的,咱也没再测4.0版本,兴许做的更好呢。 ^v^

加油~~~

相关推荐
梦云澜44 分钟前
论文阅读(十二):全基因组关联研究中生物通路的图形建模
论文阅读·人工智能·深度学习
远洋录1 小时前
构建一个数据分析Agent:提升分析效率的实践
人工智能·ai·ai agent
IT古董2 小时前
【深度学习】常见模型-Transformer模型
人工智能·深度学习·transformer
沐雪架构师3 小时前
AI大模型开发原理篇-2:语言模型雏形之词袋模型
人工智能·语言模型·自然语言处理
python算法(魔法师版)4 小时前
深度学习深度解析:从基础到前沿
人工智能·深度学习
kakaZhui4 小时前
【llm对话系统】大模型源码分析之 LLaMA 位置编码 RoPE
人工智能·深度学习·chatgpt·aigc·llama
struggle20255 小时前
一个开源 GenBI AI 本地代理(确保本地数据安全),使数据驱动型团队能够与其数据进行互动,生成文本到 SQL、图表、电子表格、报告和 BI
人工智能·深度学习·目标检测·语言模型·自然语言处理·数据挖掘·集成学习
佛州小李哥5 小时前
通过亚马逊云科技Bedrock打造自定义AI智能体Agent(上)
人工智能·科技·ai·语言模型·云计算·aws·亚马逊云科技
云空6 小时前
《DeepSeek 网页/API 性能异常(DeepSeek Web/API Degraded Performance):网络安全日志》
运维·人工智能·web安全·网络安全·开源·网络攻击模型·安全威胁分析
AIGC大时代6 小时前
对比DeepSeek、ChatGPT和Kimi的学术写作关键词提取能力
论文阅读·人工智能·chatgpt·数据分析·prompt