论文选题一直是大家发表论文的第一个卡点。
好的选题点不仅新颖性强,可操作性高,既能引起编辑和审稿人的喜爱,整个过程实现起来也不难,可以说是事半功倍;
不好的选题竞争激烈,相似度高,整个实验或论证过程实现难度高,花费时间长还不一定好发表。
用AI辅助选题一直是大家呼声很高的需求。但是AI选题有几个卡点:
1 有人是直接给一个主题,让AI推荐选题。
这个使用AI的方式非常不靠谱。AI虽然有世界知识,但是它有的是预训练的旧知识,某一个领域的最新进展它是不知道的。拿着旧地图去寻找新大陆,就别抱怨AI不靠谱了。
2 基于关键词在文献库检索得到的相关文献列表,让AI推荐选题。
需要经过主题分析,判断哪些领域过热,哪些领域是新兴领域有机会,进而得到有潜力的选题。之前的大模型还不具备多步骤行动的能力,所以推荐的选题质量一般。
最近又有学员提了选题的需求:看着别人发了很多关于某主题的文章,自己也想写,不知道从哪里切入。AI能不能帮着进行选题分析?
GPT-5这样的agentic模型,理论上应该比之前的模型对选题这样的复杂任务完成更好。
娜姐研究了一番,针对选题,GPT-5可以分步骤实现:
1 编写Python程序对附件文献进行分析,提取关键词,进行主题聚类,展示聚类效果;
2 基于主题分析,识别领域发展趋势,给出可行性高和新颖性高的选题列表;
3 对用户关注的选题进一步细化:进行实验规划,统计学分析,图表设计、注意事项等,加速课题实现。
推荐的选题列表,学员反馈很有启发,看完马上有方向了。
以下是效果展示:
1 主题建模分析:



基于主题建模分析的选题参考:



如果你对其中某几个选题感兴趣,还可以进一步细化:



这其中要注意几个问题:
1 附件文献读取不全。你给了2000条文献,AI只读取了500条,就开始分析。可想而知,这样分析出来的选题当然是不准确的;
2 回复答案太简略。大模型有一个节省token的倾向,GPT-5 thinking最长是20w上下文,但是在输出的时候它并不会按照最长的限度来输出,而是倾向于偷懒;
3 对指令的跟随不精确,经常偏离目标。
以上问题,娜姐在打磨提示词的时候都遇到了,通过研究模型厂商的cook book和通过输出来反复调整,都一一解决了。效果如上图所示。