GPTZero:论文打假神器

记住这张脸他是全美学生的公敌。

别的学生在AI大浪潮间翻云覆雨,有的用GPT代写作业,有的用GPT代工论文,大家都忙的不亦乐乎。

正在大家都在欢呼雀跃跟作业拜拜时,就是这个小伙,普林斯顿大学的华裔小天才Edward Tian却反其道行之,用喝杯咖啡的功夫写了个专门检测文章是否由机器代写的照妖镜:GPTZero,它从文本困惑性和突发性入手,Zero背靠统计学的打分,得分越低就越可能被锤为AI代工。

在线体验网址:https://gptzero.me

看我先让GBD4随便写篇论文,再把生成的论文喂给Zero,Zero立马开锤:你的文章有AI代工嫌疑。

再换一篇真人写的论文测测,这次啊就喜获Zero颁发的合格证书。

(我用GPT Zero去检测我在微信公众号写的原创文章时,很多都被标记为AI代工,可能是我经常使用GPT,已经被同质化了吧)

神器一出,老师狂喜,而Edward Tian一夜成为学生公敌,哀嚎一片。

而不听劝的Edward Tian一边忙着不断修正肌肉的准确度,一边成功得到350万美元的融资和几十家教育相关组织建立合作关系。誓要帮助他们擒住AI间谍。

用魔法打败魔法,不管这事成没成,光反论文这事已经够他名垂青史了。

GPTZero是如何工作的?

在其核心,GPTZero是一个经过训练来进行推理的AI模型。它可以筛查文本 - 无论是句子、段落还是整篇文档 - 并预测这些文本是由人类编写的还是由AI生成的。它就像一只猎犬,可以从海量的文字中嗅探出AI内容。

GPTZero是通过一个大规模的人类编写和AI生成文本的数据集进行训练的,这些数据集从未在互联网上发布过。它被教会识别风格、结构以及其他语言特征中的细微差异,这些差异可以区分人类写作和AI内容。

为了判断一段摘录是否是机器人写的,GPTZero使用了两个指标:"困惑度"和"突发性"。困惑度测量文本的复杂程度;如果GPTZero对文本感到困惑,那么文本具有较高的复杂性,更有可能是人类编写的。但是,如果文本对机器人来说更为熟悉 ------ 因为它已经在这种数据上进行了训练 ------ 那么文本的复杂性会较低,因此更有可能是AI生成的。

另外,突发性是用来比较句子变化的。人类倾向于书写具有更高突发性的文本,例如,一些较长或复杂的句子与一些较短的句子混合出现。而AI生成的句子倾向于更统一。

参考资料:

[1]视频号:科技公园

[2]https://www.npr.org/2023/01/09/1147549845/gptzero-ai-chatgpt-edward-tian-plagiarism

[3]https://blog.enterprisedna.co/gptzero/ 作者:人工智能大讲堂 https://www.bilibili.com/read/cv27597949/ 出处:bilibili

相关推荐
好喜欢吃红柚子几秒前
万字长文解读空间、通道注意力机制机制和超详细代码逐行分析(SE,CBAM,SGE,CA,ECA,TA)
人工智能·pytorch·python·计算机视觉·cnn
小馒头学python5 分钟前
机器学习是什么?AIGC又是什么?机器学习与AIGC未来科技的双引擎
人工智能·python·机器学习
神奇夜光杯14 分钟前
Python酷库之旅-第三方库Pandas(202)
开发语言·人工智能·python·excel·pandas·标准库及第三方库·学习与成长
正义的彬彬侠17 分钟前
《XGBoost算法的原理推导》12-14决策树复杂度的正则化项 公式解析
人工智能·决策树·机器学习·集成学习·boosting·xgboost
Debroon26 分钟前
RuleAlign 规则对齐框架:将医生的诊断规则形式化并注入模型,无需额外人工标注的自动对齐方法
人工智能
羊小猪~~33 分钟前
神经网络基础--什么是正向传播??什么是方向传播??
人工智能·pytorch·python·深度学习·神经网络·算法·机器学习
AI小杨34 分钟前
【车道线检测】一、传统车道线检测:基于霍夫变换的车道线检测史诗级详细教程
人工智能·opencv·计算机视觉·霍夫变换·车道线检测
晨曦_子画39 分钟前
编程语言之战:AI 之后的 Kotlin 与 Java
android·java·开发语言·人工智能·kotlin
道可云41 分钟前
道可云人工智能&元宇宙每日资讯|2024国际虚拟现实创新大会将在青岛举办
大数据·人工智能·3d·机器人·ar·vr
人工智能培训咨询叶梓1 小时前
探索开放资源上指令微调语言模型的现状
人工智能·语言模型·自然语言处理·性能优化·调优·大模型微调·指令微调