GPTZero:论文打假神器

记住这张脸他是全美学生的公敌。

别的学生在AI大浪潮间翻云覆雨,有的用GPT代写作业,有的用GPT代工论文,大家都忙的不亦乐乎。

正在大家都在欢呼雀跃跟作业拜拜时,就是这个小伙,普林斯顿大学的华裔小天才Edward Tian却反其道行之,用喝杯咖啡的功夫写了个专门检测文章是否由机器代写的照妖镜:GPTZero,它从文本困惑性和突发性入手,Zero背靠统计学的打分,得分越低就越可能被锤为AI代工。

在线体验网址:https://gptzero.me

看我先让GBD4随便写篇论文,再把生成的论文喂给Zero,Zero立马开锤:你的文章有AI代工嫌疑。

再换一篇真人写的论文测测,这次啊就喜获Zero颁发的合格证书。

(我用GPT Zero去检测我在微信公众号写的原创文章时,很多都被标记为AI代工,可能是我经常使用GPT,已经被同质化了吧)

神器一出,老师狂喜,而Edward Tian一夜成为学生公敌,哀嚎一片。

而不听劝的Edward Tian一边忙着不断修正肌肉的准确度,一边成功得到350万美元的融资和几十家教育相关组织建立合作关系。誓要帮助他们擒住AI间谍。

用魔法打败魔法,不管这事成没成,光反论文这事已经够他名垂青史了。

GPTZero是如何工作的?

在其核心,GPTZero是一个经过训练来进行推理的AI模型。它可以筛查文本 - 无论是句子、段落还是整篇文档 - 并预测这些文本是由人类编写的还是由AI生成的。它就像一只猎犬,可以从海量的文字中嗅探出AI内容。

GPTZero是通过一个大规模的人类编写和AI生成文本的数据集进行训练的,这些数据集从未在互联网上发布过。它被教会识别风格、结构以及其他语言特征中的细微差异,这些差异可以区分人类写作和AI内容。

为了判断一段摘录是否是机器人写的,GPTZero使用了两个指标:"困惑度"和"突发性"。困惑度测量文本的复杂程度;如果GPTZero对文本感到困惑,那么文本具有较高的复杂性,更有可能是人类编写的。但是,如果文本对机器人来说更为熟悉 ------ 因为它已经在这种数据上进行了训练 ------ 那么文本的复杂性会较低,因此更有可能是AI生成的。

另外,突发性是用来比较句子变化的。人类倾向于书写具有更高突发性的文本,例如,一些较长或复杂的句子与一些较短的句子混合出现。而AI生成的句子倾向于更统一。

参考资料:

1\]视频号:科技公园 \[2\]https://www.npr.org/2023/01/09/1147549845/gptzero-ai-chatgpt-edward-tian-plagiarism \[3\]https://blog.enterprisedna.co/gptzero/ 作者:人工智能大讲堂 https://www.bilibili.com/read/cv27597949/ 出处:bilibili

相关推荐
Shang1809893572616 分钟前
T41LQ 一款高性能、低功耗的系统级芯片(SoC) 适用于各种AIoT应用智能安防、智能家居方案优选T41L
人工智能·驱动开发·嵌入式硬件·fpga开发·信息与通信·信号处理·t41lq
Bony-27 分钟前
用于糖尿病视网膜病变图像生成的GAN
人工智能·神经网络·生成对抗网络
罗西的思考38 分钟前
【Agent】 ACE(Agentic Context Engineering)源码阅读笔记---(3)关键创新
人工智能·算法
Elastic 中国社区官方博客43 分钟前
通过混合搜索重排序提升多语言嵌入模型的相关性
大数据·数据库·人工智能·elasticsearch·搜索引擎·ai·全文检索
猫头虎1 小时前
昆仑芯 X HAMi X 百度智能云 | 昆仑芯 P800 XPU/vXPU 双模式算力调度方案落地
人工智能·百度·开源·aigc·文心一言·gpu算力·agi
大千AI助手1 小时前
探索LoSA:动态低秩稀疏自适应——大模型高效微调的新突破
人工智能·神经网络·lora·大模型·llm·大千ai助手·稀疏微调
说私域1 小时前
“开源链动2+1模式AI智能名片S2B2C商城小程序”在拉群营销中的应用与效果
人工智能·小程序
PyAIGCMaster2 小时前
钉钉的设计理念方面,我可以学习
人工智能·深度学习·学习·钉钉
sensen_kiss2 小时前
INT305 Machine Learning 机器学习 Pt.5 神经网络(Neural network)
人工智能·神经网络·机器学习
极造数字2 小时前
从EMS看分布式能源发展:挑战与机遇并存
人工智能·分布式·物联网·信息可视化·能源·制造