南农团队研发 “古籍版ChatGPT”,取名:“荀子“

本心、输入输出、结果

文章目录

南农团队研发 "古籍版ChatGPT",取名:"荀子"


编辑:简简单单 Online zuozuo

地址:https://blog.csdn.net/qq_15071263

个人简介 : 简简单单Online zuozuo,目前主要从事 Java 相关工作,商业方向为 B、G 端,主要使用Java、Python 进行日常开发,喜欢探索各个方面的内容,对很多的方向、内容感兴趣 :目前对 AIGC、云计算、物联网方向感兴趣

未闻万里蓬莱,而窥先圣遗智。故,以此生筑梦,奔而逐之;以泰山之伟,攀而登之;以静雅素心,处世为人。

欢迎有兴趣的朋友相互交流,共同成长。微信: tja6288 商务合作/资料获取/技术交流


如果觉得本文对你有帮助,欢迎点赞、收藏、评论

前言

南农团队研发 "古籍版ChatGPT",取名:"荀子"

2023年12月11日,南京农业大学信息管理学院王东波团队日前研发出国内首个专门用于古籍处理与研究的智能工具------"荀子"古籍大语言模型,包含《四库全书》在内的古籍文献超20亿字大型语料库,具备自然语言理解、自动翻译、自动标引等功能。该模型已在GitHub、ModelScope等网站开源

王东波表示

荀子不仅是先秦伟大的朴素唯物主义思想家和散文家,对语言学理论的阐述也是开拓者,如此命名是纪念这位语言学先驱,"普通受众要走近繁体、竖版、没有句读的古文不是容易的事,'荀子'上线,意味着在智媒时代与古籍对话成为可能,古文阅读理解、标点添加、译为现代汉语------这些难啃的'硬骨头','荀子'可以轻松拿下。"专家则可借助"荀子"完成古籍词法分析、实体识别、关系抽取、文本分类与匹配、文本摘要等

期待通过"荀子"大语言模型,将古籍的智能化研究与跨学科人才培养结合,让学生既有前瞻的科研视野,又积累较深厚的人文底蕴,同时让更多受众接触、品读、传播古籍,唤活"故纸堆"

"荀子"

"荀子"的问世离不开高性能算力基础设施,也离不开团队长期积累精加工语料库,投喂了40亿字的混合语料数据。"模型的构建受算力、场景应用等影响,但精准度高的优质数据是关键。"王东波说,团队2008年接触古籍,2013年至今一直专注于人工精标注数据工作,"比如《岳阳楼记》,要训练机器标注其中的形容词,先要训练相关人员标注形容词,在大量人工标注的基础上让机器学习"。

团队

花有重开日,人无再少年

在这个充满困难和挑战的时期内,我们依然应该保持积极向上,放下遥不可及的欲望,平凡的普通人也可以成就自己的小梦想

在这个充满变化和无限可能的世界里,每一天都是新的开始。让我们拥抱今天,以积极乐观的心态去面对生活的挑战和机遇。

无论我们遇到什么困难,都要相信自己的力量和智慧,勇敢地迎接挑战。因为每一次的克服和超越,都将使我们的生命更加丰富多彩。

我们要学会欣赏生活中的美好事物,用感恩的心去珍惜所拥有的一切。这样,我们就会发现,快乐其实就在我们的身边,时时刻刻陪伴着我们。

让我们保持对未来的信心和热情,勇敢地追求自己的梦想。无论路途多么艰辛,只要我们坚持不懈,终将实现自己的目标。

让我们一起相信,只要我们心中充满阳光,就没有什么能够阻挡我们前进的步伐。让我们用积极乐观的心态,书写属于我们的精彩人生!

实践是检验真理的唯一标准

✅ 🥶 😎 😟 😲 😰 😭 😓

🔔️ 😂 😅 😍 😘 😚 😜 🤢

👿 💀 👽 👾 😻 💕 💔 💯

💦 💤 🤝 🙍‍♂️ 🙍 🍊 🍉 🍏

感谢亲的点赞、收藏、评论,一键三连支持,谢谢

相关推荐
小洛~·~1 小时前
多模态RAG与LlamaIndex——1.deepresearch调研
人工智能·python·深度学习·神经网络·chatgpt
Narutolxy10 小时前
大模型数据分析破局之路20250512
人工智能·chatgpt·数据分析
AIWritePaper智能写作探索1 天前
高质量学术引言如何妙用ChatGPT?如何写提示词?
人工智能·chatgpt·prompt·智能写作·aiwritepaper·引言
江鸟19981 天前
AI日报 · 2025年05月11日|传闻 OpenAI 考虑推出 ChatGPT “永久”订阅模式
人工智能·gpt·ai·chatgpt·github
知来者逆1 天前
AI 在模仿历史语言方面面临挑战:大型语言模型在生成历史风格文本时的困境与研究进展
人工智能·深度学习·语言模型·自然语言处理·chatgpt
AI Echoes2 天前
大模型(LLMs)强化学习——RLHF及其变种
人工智能·深度学习·算法·机器学习·chatgpt
没有梦想的咸鱼185-1037-16633 天前
【大语言模型ChatGPT4/4o 】“AI大模型+”多技术融合:赋能自然科学暨ChatGPT在地学、GIS、气象、农业、生态与环境领域中的应用
人工智能·python·机器学习·arcgis·语言模型·chatgpt·数据分析
yibuapi_com3 天前
Embedding 的数学特性与可视化解析
chatgpt·架构·langchain·embedding·claude·向量数据库·中转api
鸿蒙布道师4 天前
ChatGPT深度研究功能革新:GitHub直连与强化微调
人工智能·深度学习·神经网络·自然语言处理·chatgpt·数据挖掘·github
没有梦想的咸鱼185-1037-16634 天前
【大模型ChatGPT+ArcGIS】数据处理、空间分析、可视化及多案例综合应用
人工智能·arcgis·chatgpt·数据分析