南农团队研发 “古籍版ChatGPT”,取名:“荀子“

本心、输入输出、结果

文章目录

南农团队研发 "古籍版ChatGPT",取名:"荀子"


编辑:简简单单 Online zuozuo

地址:https://blog.csdn.net/qq_15071263

个人简介 : 简简单单Online zuozuo,目前主要从事 Java 相关工作,商业方向为 B、G 端,主要使用Java、Python 进行日常开发,喜欢探索各个方面的内容,对很多的方向、内容感兴趣 :目前对 AIGC、云计算、物联网方向感兴趣

未闻万里蓬莱,而窥先圣遗智。故,以此生筑梦,奔而逐之;以泰山之伟,攀而登之;以静雅素心,处世为人。

欢迎有兴趣的朋友相互交流,共同成长。微信: tja6288 商务合作/资料获取/技术交流


如果觉得本文对你有帮助,欢迎点赞、收藏、评论

前言

南农团队研发 "古籍版ChatGPT",取名:"荀子"

2023年12月11日,南京农业大学信息管理学院王东波团队日前研发出国内首个专门用于古籍处理与研究的智能工具------"荀子"古籍大语言模型,包含《四库全书》在内的古籍文献超20亿字大型语料库,具备自然语言理解、自动翻译、自动标引等功能。该模型已在GitHub、ModelScope等网站开源

王东波表示

荀子不仅是先秦伟大的朴素唯物主义思想家和散文家,对语言学理论的阐述也是开拓者,如此命名是纪念这位语言学先驱,"普通受众要走近繁体、竖版、没有句读的古文不是容易的事,'荀子'上线,意味着在智媒时代与古籍对话成为可能,古文阅读理解、标点添加、译为现代汉语------这些难啃的'硬骨头','荀子'可以轻松拿下。"专家则可借助"荀子"完成古籍词法分析、实体识别、关系抽取、文本分类与匹配、文本摘要等

期待通过"荀子"大语言模型,将古籍的智能化研究与跨学科人才培养结合,让学生既有前瞻的科研视野,又积累较深厚的人文底蕴,同时让更多受众接触、品读、传播古籍,唤活"故纸堆"

"荀子"

"荀子"的问世离不开高性能算力基础设施,也离不开团队长期积累精加工语料库,投喂了40亿字的混合语料数据。"模型的构建受算力、场景应用等影响,但精准度高的优质数据是关键。"王东波说,团队2008年接触古籍,2013年至今一直专注于人工精标注数据工作,"比如《岳阳楼记》,要训练机器标注其中的形容词,先要训练相关人员标注形容词,在大量人工标注的基础上让机器学习"。

团队

花有重开日,人无再少年

在这个充满困难和挑战的时期内,我们依然应该保持积极向上,放下遥不可及的欲望,平凡的普通人也可以成就自己的小梦想

在这个充满变化和无限可能的世界里,每一天都是新的开始。让我们拥抱今天,以积极乐观的心态去面对生活的挑战和机遇。

无论我们遇到什么困难,都要相信自己的力量和智慧,勇敢地迎接挑战。因为每一次的克服和超越,都将使我们的生命更加丰富多彩。

我们要学会欣赏生活中的美好事物,用感恩的心去珍惜所拥有的一切。这样,我们就会发现,快乐其实就在我们的身边,时时刻刻陪伴着我们。

让我们保持对未来的信心和热情,勇敢地追求自己的梦想。无论路途多么艰辛,只要我们坚持不懈,终将实现自己的目标。

让我们一起相信,只要我们心中充满阳光,就没有什么能够阻挡我们前进的步伐。让我们用积极乐观的心态,书写属于我们的精彩人生!

实践是检验真理的唯一标准

✅ 🥶 😎 😟 😲 😰 😭 😓

🔔️ 😂 😅 😍 😘 😚 😜 🤢

👿 💀 👽 👾 😻 💕 💔 💯

💦 💤 🤝 🙍‍♂️ 🙍 🍊 🍉 🍏

感谢亲的点赞、收藏、评论,一键三连支持,谢谢

相关推荐
catchadmin3 小时前
PHP 快速集成 ChatGPT 用 AI 让你的应用更聪明
人工智能·后端·chatgpt·php
桂花饼17 小时前
性能怪兽:GPT-5-Codex三大核心进化,重新定义AI编程
人工智能·chatgpt·aigc·gpt-5·gemini-2.5·grok4·it/互联网
HenrySmale20 小时前
论文笔记:How Can Recommender Systems Benefit from Large Language Models: A Survey
人工智能·语言模型·chatgpt
学境思源AcademicIdeas1 天前
我用ChatGPT完成选题的全过程复盘
人工智能·chatgpt
齐杰拉8 天前
useSse 开源:如何把流式数据请求/处理简化到极致
前端·chatgpt
量子位11 天前
GPT-5编程专用版发布!独立连续编程7小时,简单任务提速10倍,VS Code就能用
gpt·chatgpt
coder_pig11 天前
🤔 试试 OpenAI 的最强编程模型 "GPT-5-Codex"?
chatgpt·openai·claude
齐杰拉12 天前
源码精读:拆解 ChatGPT 打字机效果背后的数据流水线
前端·chatgpt
mit6.82413 天前
[code-review] 日志机制 | `LOG_LEVEL`
人工智能·chatgpt·代码复审
Orange_sparkle13 天前
解决Dify中接入xinference模型无法开关思考模式和使用function calling的问题
人工智能·深度学习·语言模型·chatgpt