大家好,我是祯民
2023 - 2024年间我在工作之余写了一本 AI 应用类的书籍,书名为《生成式AI应用开发:基于OpenAI API实现》,将于今年年后(2025.2)在清华大学出版社出版,很高兴能和大家分享这个消息~
现在还在封面选定的阶段,大家看看哪个封面比较好看,可以在评论区说说你的宝贵意见和想法,大家的想法我都会汇总给出版社的编辑老师们,一起决定封面的风格~!
本书还有一个读者群,里面有各路大咖、资深工程师和清华大学出版社的编辑老师们,感兴趣的同学可以在评论区留言,或者后台私信阿民提前加读者群,大家可以互相讨论不限于 AIGC 的各类技术、职业发展问题,定期群里还会有技术文档、面试总结等福利分享给大家,欢迎来撩~
本文是本书的内容安排原文,介绍了本书的适用同学和章节信息,供大家参考!
正文
目前国内现有的AI方向图书中更多的是ChatGPT的日常应用和大语言模型(Large Language Model,LLM)的精调,生成式AI应用的开发和落地还比较缺乏,本书的初衷就是希望可以弥补这一空白。
本书的重点是生成式应用的开发,也就是与AI相关的应用层。在实际的生成式AI应用开发中,虽然思路是可以共通的,但的确不同的载体和环境有一定的前置开发功能要求。比如本书的生成式AI应用开发中,涉及Node.js环境、浏览器环境、VSCode Host环境,虽然在每节开发过程中,会介绍一些开发相关的前置知识,但因为具体环境的开发功能不是本书重点,所以没办法面面俱到地详细介绍。
所以本书更适合有一定开发基础、使用过或者熟悉JavaScript和Python语言最佳,对开发环境和工具链有一些基础认知,同时对AI生成式应用感兴趣愿意深入的用户。对于完全没有开发经验且从零基础开始的用户来说,在学习过程中可能会遇到一些技术难题和信息不对称的问题,这可能会导致他们的学习曲线变得不平滑,甚至感到相当费劲。
本书的全部代码示例都会上传到网上,大家可以自行拉取结合章节内容调试学习加深印象。并且一些实际应用类的项目也会发布到对应平台,真正落地产生价值,借此希望给大家带来一个尽可能真实的项目学习体验,而非仅是一些纸上谈兵的示例。
回到正题,本书的正文部分由9章组成,具体的章节安排如下图所示。
第1章就是本书的绪论,让大家对生成式AI应用开发能有一个整体的认知。
第2章详细学习OpenAI API的细节,使用官方请求库去完成ChatGPT的请求,并且还会封装一个同类型请求库加深理解,这个库也会作为后续章节请求的基底。
第3章学习生成式应用中的基础应用ChatGPT,我们会从零实现一个类ChatGPT应用,并了解如何在实现ChatGPT的基础上泛化不同的角色应用,比如写作大师、在线医生、剧本杀、歌词续写等热门方向是如何搭建的。
第4章会结合飞书开放平台集成AI模型功能到飞书机器人,通过本章的学习,我们可以举一反三,将AI功能融入到日常工作学习的聊天中,同样的原理,我们也可以集成到微信小程序、企业微信、钉钉等交互平台中。
第5章和第6章会将AI融入到日常开发阶段中,通过开发VSCode插件的形式,为IDE赋能。不仅是个人开发提效,也能帮助到社区千千万万的开发者,同时这在互联网大厂中也有广泛的应用和工作岗位,对提升用户的市场竞争力很有帮助。其中第5章为VSCode插件开发的一些前置学习,第6章为AI代码辅助场景的一系列应用实战案例。
第7章将不局限于OpenAI API的使用,会深入学习开源模型社区Hugging Face,并实践如何对一个开源模型进行私有化部署和微调训练。通过本章的学习,相信大家对模型的私有化部署和精调训练会有更全面的认知,也具备使用、精调除GPT以外的不同类别模型满足实际业务场景特殊需求的能力。
第8章会学习检索增强生成技术RAG,在实际的大语言模型应用中,除了模型内置的功能外,可能还会有一些业务的文档需要模型能够借鉴,这些文档全量给模型体量过大,作为微调数据集体量又太小,成本性价比也不高,这种场景就需要对文档进行向量化和相似度匹配,进而充实Prompt,达到通过对向量知识库检索相似信息进而增强生成功能的目的。
第9章会深入Prompt Engineering,了解如何询问模型,组织优化Prompt可以拿到更有价值的答案,同时也会对目前的社区生态进行介绍,涵盖了主流的国内大模型和AI搭建应用平台Coze的相关知识点。通过本章的学习,将可以对常规开发模式外的一些调优手段、社区建设有更深入的了解,从而更高效高质量地开发复杂的生成式AI应用。
希望本书能成为大家在AGI新时代学习探索的起点,具备开发生成式AI应用的能力以及对整个AI生态产生一个全局广阔的视角。