时隔一年的测评:gpt3.5发展到什么程度了?

名人说:一花独放不是春,百花齐放花满园。------《增广贤文》
作者:Code_流苏(CSDN)(一个喜欢古诗词和编程的Coder😊)

目录

★观前提示以下内容仅为测试内容,不代表未来新版本如何测试体验,只讲述体验,本篇文章不做对比。

在人工智能领域,OpenAI的GPT(Generative Pre-trained Transformer)系列模型已经成为了一个名扬四海的名称。ChatGPT-3.5,作为这一系列的一个里程碑,不仅在技术界引起了广泛的关注,也在普通用户中掀起了一股学习和探索的热潮,这就不禁引发了一系列思考:

一、简要介绍

1、chatgpt是什么?


ChatGPTOpenAI开发的大语言模型 ,属于GPT(Generative Pre-trained Transformer)系列的一部分。它通过深度学习技术和大量数据训练,能够理解和生成自然语言文本。ChatGPT可以应用于多种场景,包括但不限于客户服务、教育辅导、内容创作等。

2、主要特点
  • 理解和生成文本:ChatGPT能够根据输入的文本理解上下文,并生成连贯、相关的回答。
  • 多样化应用:它可以用于问答系统、文本摘要、文章写作、编程代码辅助、语言翻译等多个领域。
  • 自然语言处理:ChatGPT在自然语言处理(NLP)方面表现出色,能够处理复杂的语言特征,包括语法、句式结构等。
  • 持续学习:虽然ChatGPT在部署后的学习能力有限,OpenAI定期更新模型,以包含新的数据和改进算法,使其性能持续提升。
3、工作原理

ChatGPT的工作原理 基于Transformer架构,这是一种深度学习模型,特别适用于处理序列化的数据,如文本。

模型通过"注意力机制"来理解文本中的每个词与其他词之间的关系,这使得ChatGPT能够生成连贯且相关性强的文本。

4、应用限制

尽管ChatGPT在多个领域表现出色,但它也有一些限制,例如:

  • 信息时效性:ChatGPT的知识是到训练数据截止日期为止的,对于之后发生的事件或信息可能不了解。
  • 误解与错误:尽管准确率较高,ChatGPT仍可能产生误解或错误信息,特别是在处理复杂问题或缺乏明确上下文时。
  • 创造性限制:虽然能够生成新颖的文本,但ChatGPT的创造性受到训练数据的限制,它的"创意"来自于已经存在的信息组合。
5、使用方法

官网注册使用即可:chatgpt官网

了解了以上内容之后,咱们一起去测试体验一下:

二、分类问题测试

测试采用多类问题提问,以检验其多方面的功能。

1、基础问答(5个)
  • Q1: 澳大利亚的首都是哪座城市?(✔)
  • Q2: 地球与太阳之间的距离是多少?(✔)
  • Q3: 水的沸点是多少度?(✔)
  • Q4: 比萨斜塔在哪个国家?(✔)
  • Q5: 世界上最长的河流是哪一条?(✔)

从回答来看,5个问题均正确✔,相比刚发布时gpt3.0出现常识性错误,正确率高了不少。

2、数学题解答(5个)
  • Q1:小明有12个苹果,他想平均分给他的3个朋友(12个苹果分给3个人),请问每个朋友可以得到几个苹果?(小学难度 ✔)

  • Q2:已知直角三角形的一条直角边长为5cm,另一条直角边长为12cm,求斜边的长度。(初中难度 ✔)

  • Q3:若一个二次函数表达式为 f ( x ) = a x 2 + b x + c ( a ≠ 0 ) f(x) = ax^2 + bx + c (a≠0) f(x)=ax2+bx+c(a=0),已知f(1)=0,f(2)=3,且f(x)图像经过点(3,10),请求出a、b、c的具体值。(初中难度 ✔)

  • Q4:在平面直角坐标系中,曲线C的方程为 y = x 3 − 6 x 2 + 9 x + 10 y = x^3 - 6x^2 + 9x + 10 y=x3−6x2+9x+10,求曲线C过原点处的切线方程。(高中难度 ✔)

这题虽然解对了,其实用到了一些高等数学的知识,这里要注意,高中数学涉及的并没有那么广泛。

  • Q5:计算函数 f(x) = x^3 - 2x^2 + x 在 x = 2 处的导数。(大学基础难度 ✔)
3、逻辑推理(5个)
  • Q1: 如果所有猫都喜欢吃鱼,而Tom是一只猫,那么Tom会喜欢吃鱼吗?(✔)
  • Q2: 假设A>B且B>C,请问A是否一定大于C?(✔)
  • Q3: 你有1000kg蘑菇,含水量是99%。现在晒几天,晒到含水量为98%,那需要晒掉多少水?(✖)

正确答案:500kg。1000kg蘑菇含水量99%,就是水重990kg,固体蘑菇10kg。降到含水量98%就是固体蘑菇只占2%,然后用10除以2%就能得出蘑菇重量是500kg。所以答案是晒干了500kg水。

  • Q4: 有一个没有刻度的长方形的塑料盒子,没有盖子,它的容积是1升。请问如果只能使用这个盒子称量依次,能够准确地量出多少升的水?(半✔半✖)

正确答案:如果只能使用这个盒子称量一次,能够正确地量出 0.5 升的水。也能量出 1/6 升,将长方形盒子倾斜,水位到达盒子的上一边及底下的边线即可。

  • Q5: 72、36、24、18、( )(✖)

正确答案:14.4

4、创造性写作(3个)
  • Q1: 请续写一个故事开头:"在一个寒冷的冬夜,小镇图书馆的灯突然熄灭了......"

写的有模有样,这一年进步了不少。

  • Q2: 编写一首关于秋天落叶的五言律诗。

押上了居然,就是意境表达的有些冗杂。

  • Q3: 写一个关于人工智能与人关系的短篇小说。

现在小说的前后逻辑性也更连贯了,牛!

5、代码编写(3个)
  • Q1: 用Python编写一个函数,用于判断一个数是否为质数。

    gpt所写代码如下:
python 复制代码
def is_prime(number):
    if number <= 1:
        return False
    if number <= 3:
        return True
    if number % 2 == 0 or number % 3 == 0:
        return False
    i = 5
    while i * i <= number:
        if number % i == 0 or number % (i + 2) == 0:
            return False
        i += 6
    return True

# 测试
print(is_prime(5))  # 输出: True
print(is_prime(10)) # 输出: False
print(is_prime(17)) # 输出: True
  • Q2: 用Python编写一个程序,检查一个字符串是否为回文(正读反读都一样的词)。

    gpt所写代码如下:
python 复制代码
def is_palindrome(s):
    # 去除字符串中的非字母字符并转换为小写
    s = ''.join(c.lower() for c in s if c.isalnum())
    # 检查字符串是否等于其反转
    return s == s[::-1]

# 测试
print(is_palindrome("A man, a plan, a canal, Panama"))  # 输出: True
print(is_palindrome("racecar"))                        # 输出: True
print(is_palindrome("hello"))                          # 输出: False

测试了下,成功运行并得到正确反馈。

  • Q3: 用Python编写一个程序,实现二叉树的深度优先搜索(DFS),并返回所有节点的遍历顺序。
python 复制代码
class TreeNode:
    def __init__(self, value):
        self.value = value
        self.left = None
        self.right = None

def dfs(root):
    if root is None:
        return []
    stack = [root]
    result = []
    while stack:
        node = stack.pop()
        result.append(node.value)
        if node.right:
            stack.append(node.right)
        if node.left:
            stack.append(node.left)
    return result

# 测试
# 构造二叉树
root = TreeNode(1)
root.left = TreeNode(2)
root.right = TreeNode(3)
root.left.left = TreeNode(4)
root.left.right = TreeNode(5)
root.right.left = TreeNode(6)
root.right.right = TreeNode(7)

print(dfs(root))  # 输出: [1, 2, 4, 5, 3, 6, 7]
6、对话理解与情感交流(2个)
  • Q1: 我今天心情不好,能给我讲个笑话吗?

虽然挺冷的,但是我确实笑了。

  • Q2: 你能帮我分析一下最近压力大的原因,并提供缓解压力的方法吗?

给的方法还不错,现在语言逻辑相比一年前也更好了。

7、翻译任务(1个)
  • Q: 将这段文字翻译成英语: "张骞(Zhang Qian)是中国第一个伟大的探险家。他不畏艰险,克服重重困难,两次出使西域,开通了中国同西亚和欧洲的通商关系,将中国的丝和丝织品运往西亚和欧洲,开拓了历史上著名的"丝绸之路"。同时,他又将西域的风土人情、地理文化以及特有物种等介绍到中原,极大地开阔了人们的视野。
    正如历史学家所指出的那样,如果没有张骞出使西域,就不可能有丝绸之路的开辟,也就不会有汉朝同西域或欧洲的文化交流。"(六级翻译原题
  • Q: 再将这段英语翻译成中文

可以看出,文本翻译的效果还是不错的。

8、策略规划(1个)
  • Q: 假设你是某初创公司的CEO,公司在市场扩张过程中遇到了资金短缺问题,你将如何制定一份详尽的战略计划,既保证业务持续增长又能吸引新的投资者?

这计划竟然有些合理?整体不错

本次测评就到这里,接下来总结一下感受。

三、测试感受

gpt3.5相比于一年前,能力明显地得到了提升,但是要想替代很多岗位目前还是很难的,我们要有危机感,但不能杞人忧天,提升自身能力才是重点。

放大了来说,GPT是自然语言处理领域的一个重要进展,通过模仿人类的对话方式,它在提供信息、协助文本创作等方面展现了巨大潜力。然而,gpt也有它的局限性,使用时要注意,以免造成不可挽回的损失。

关于测试暂时测试这些,很感谢你能看到这里,如有相关疑问,还请下方评论留言。
Code_流苏(CSDN) (一个喜欢古诗词和编程的Coder😊)
如果对大家有帮助的话,希望大家能多多点赞+关注!这样我的动力会更足!

相关推荐
deephub1 天前
LEC: 基于Transformer中间层隐藏状态的高效特征提取与内容安全分类方法
人工智能·深度学习·transformer·大语言模型·特征提取
三月七(爱看动漫的程序员)1 天前
Knowledge Graph Prompting for Multi-Document Question Answering
人工智能·gpt·学习·语言模型·自然语言处理·机器人·知识图谱
三月七(爱看动漫的程序员)1 天前
LEAST-TO-MOST PROMPTING ENABLES COMPLEX REASONING IN LARGE LANGUAGE MODELS---正文
人工智能·gpt·学习·机器学习·语言模型·自然语言处理·llama
流穿2 天前
WebSocket vs SSE:实时通信技术的对比与选择
网络·websocket·网络协议·大语言模型·sse
hunteritself2 天前
OpenAI直播发布第11天:ChatGPT桌面客户端升级,就这?
人工智能·gpt·chatgpt·语音识别·claude
ghostwritten2 天前
Linux 下的 GPT 和 MBR 分区表详解
linux·运维·gpt
旷野..2 天前
GPT 时代,精进编程思维 + 熟练 Prompt 是否是新的编程范式?
python·gpt·prompt
that's boy2 天前
ChatGPT Search开放:实时多模态搜索新体验
人工智能·gpt·chatgpt·openai·midjourney
云起无垠3 天前
第78期 | GPTSecurity周报
人工智能·gpt·网络安全·aigc
python_知世3 天前
基于LLaMA-Factory微调Llama3
人工智能·深度学习·程序人生·自然语言处理·大语言模型·llama·大模型微调