GPTZero:论文打假神器

记住这张脸他是全美学生的公敌。

别的学生在AI大浪潮间翻云覆雨,有的用GPT代写作业,有的用GPT代工论文,大家都忙的不亦乐乎。

正在大家都在欢呼雀跃跟作业拜拜时,就是这个小伙,普林斯顿大学的华裔小天才Edward Tian却反其道行之,用喝杯咖啡的功夫写了个专门检测文章是否由机器代写的照妖镜:GPTZero,它从文本困惑性和突发性入手,Zero背靠统计学的打分,得分越低就越可能被锤为AI代工。

在线体验网址:https://gptzero.me

看我先让GBD4随便写篇论文,再把生成的论文喂给Zero,Zero立马开锤:你的文章有AI代工嫌疑。

再换一篇真人写的论文测测,这次啊就喜获Zero颁发的合格证书。

(我用GPT Zero去检测我在微信公众号写的原创文章时,很多都被标记为AI代工,可能是我经常使用GPT,已经被同质化了吧)

神器一出,老师狂喜,而Edward Tian一夜成为学生公敌,哀嚎一片。

而不听劝的Edward Tian一边忙着不断修正肌肉的准确度,一边成功得到350万美元的融资和几十家教育相关组织建立合作关系。誓要帮助他们擒住AI间谍。

用魔法打败魔法,不管这事成没成,光反论文这事已经够他名垂青史了。

GPTZero是如何工作的?

在其核心,GPTZero是一个经过训练来进行推理的AI模型。它可以筛查文本 - 无论是句子、段落还是整篇文档 - 并预测这些文本是由人类编写的还是由AI生成的。它就像一只猎犬,可以从海量的文字中嗅探出AI内容。

GPTZero是通过一个大规模的人类编写和AI生成文本的数据集进行训练的,这些数据集从未在互联网上发布过。它被教会识别风格、结构以及其他语言特征中的细微差异,这些差异可以区分人类写作和AI内容。

为了判断一段摘录是否是机器人写的,GPTZero使用了两个指标:"困惑度"和"突发性"。困惑度测量文本的复杂程度;如果GPTZero对文本感到困惑,那么文本具有较高的复杂性,更有可能是人类编写的。但是,如果文本对机器人来说更为熟悉 ------ 因为它已经在这种数据上进行了训练 ------ 那么文本的复杂性会较低,因此更有可能是AI生成的。

另外,突发性是用来比较句子变化的。人类倾向于书写具有更高突发性的文本,例如,一些较长或复杂的句子与一些较短的句子混合出现。而AI生成的句子倾向于更统一。

参考资料:

1\]视频号:科技公园 \[2\]https://www.npr.org/2023/01/09/1147549845/gptzero-ai-chatgpt-edward-tian-plagiarism \[3\]https://blog.enterprisedna.co/gptzero/ 作者:人工智能大讲堂 https://www.bilibili.com/read/cv27597949/ 出处:bilibili

相关推荐
tzc_fly10 分钟前
AI作为操作系统已经不能阻挡了,尽管它还没来
人工智能·chatgpt
PKNLP21 分钟前
深度学习之神经网络1(Neural Network)
人工智能·深度学习·神经网络
文火冰糖的硅基工坊1 小时前
《投资-99》价值投资者的认知升级与交易规则重构 - 什么是周期性股票?有哪些周期性股票?不同周期性股票的周期多少?周期性股票的买入和卖出的特点?
大数据·人工智能·重构·架构·投资·投机
Elastic 中国社区官方博客1 小时前
Elasticsearch:使用推理端点及语义搜索演示
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
AI新兵1 小时前
深度学习基础:从原理到实践——第一章感知机(中)
人工智能·深度学习
liliangcsdn2 小时前
从LLM角度学习和了解MoE架构
人工智能·学习·transformer
ARM+FPGA+AI工业主板定制专家2 小时前
基于ZYNQ FPGA+AI+ARM 的卷积神经网络加速器设计
人工智能·fpga开发·cnn·无人机·rk3588
伏小白白白2 小时前
【论文精度-1】 组合优化中的机器学习:方法论之旅(Yoshua Bengio, 2021)
人工智能·机器学习·组合优化
CH3_CH2_CHO2 小时前
DAY03:【DL 第一弹】神经网络
人工智能·pytorch·深度学习·神经网络