南农团队研发 “古籍版ChatGPT”,取名:“荀子“

发布时间:2023年12月17日

本心、输入输出、结果

南农团队研发 “古籍版ChatGPT”,取名:“荀子”


编辑:简简单单 Online zuozuo
地址:https://blog.csdn.net/qq_15071263

个人简介 : 简简单单Online zuozuo,目前主要从事 Java 相关工作,商业方向为 B、G 端,主要使用Java、Python 进行日常开发,喜欢探索各个方面的内容,对很多的方向、内容感兴趣 :目前对 AIGC、云计算、物联网方向感兴趣

未闻万里蓬莱,而窥先圣遗智。故,以此生筑梦,奔而逐之;以泰山之伟,攀而登之;以静雅素心,处世为人。

欢迎有兴趣的朋友相互交流,共同成长。微信: tja6288 商务合作/资料获取/技术交流


如果觉得本文对你有帮助,欢迎点赞、收藏、评论

前言

南农团队研发 “古籍版ChatGPT”,取名:“荀子”

2023年12月11日,南京农业大学信息管理学院王东波团队日前研发出国内首个专门用于古籍处理与研究的智能工具——“荀子”古籍大语言模型,包含《四库全书》在内的古籍文献超20亿字大型语料库,具备自然语言理解、自动翻译、自动标引等功能。该模型已在GitHub、ModelScope等网站开源

在这里插入图片描述

在这里插入图片描述

王东波表示

荀子不仅是先秦伟大的朴素唯物主义思想家和散文家,对语言学理论的阐述也是开拓者,如此命名是纪念这位语言学先驱,“普通受众要走近繁体、竖版、没有句读的古文不是容易的事,‘荀子’上线,意味着在智媒时代与古籍对话成为可能,古文阅读理解、标点添加、译为现代汉语——这些难啃的‘硬骨头’,‘荀子’可以轻松拿下。”专家则可借助“荀子”完成古籍词法分析、实体识别、关系抽取、文本分类与匹配、文本摘要等

期待通过“荀子”大语言模型,将古籍的智能化研究与跨学科人才培养结合,让学生既有前瞻的科研视野,又积累较深厚的人文底蕴,同时让更多受众接触、品读、传播古籍,唤活“故纸堆”

在这里插入图片描述

“荀子”

“荀子”的问世离不开高性能算力基础设施,也离不开团队长期积累精加工语料库,投喂了40亿字的混合语料数据。“模型的构建受算力、场景应用等影响,但精准度高的优质数据是关键。”王东波说,团队2008年接触古籍,2013年至今一直专注于人工精标注数据工作,“比如《岳阳楼记》,要训练机器标注其中的形容词,先要训练相关人员标注形容词,在大量人工标注的基础上让机器学习”。

在这里插入图片描述

团队

在这里插入图片描述

在这里插入图片描述

花有重开日,人无再少年

在这个充满困难和挑战的时期内,我们依然应该保持积极向上,放下遥不可及的欲望,平凡的普通人也可以成就自己的小梦想

在这个充满变化和无限可能的世界里,每一天都是新的开始。让我们拥抱今天,以积极乐观的心态去面对生活的挑战和机遇。

无论我们遇到什么困难,都要相信自己的力量和智慧,勇敢地迎接挑战。因为每一次的克服和超越,都将使我们的生命更加丰富多彩。

我们要学会欣赏生活中的美好事物,用感恩的心去珍惜所拥有的一切。这样,我们就会发现,快乐其实就在我们的身边,时时刻刻陪伴着我们。

让我们保持对未来的信心和热情,勇敢地追求自己的梦想。无论路途多么艰辛,只要我们坚持不懈,终将实现自己的目标。

让我们一起相信,只要我们心中充满阳光,就没有什么能够阻挡我们前进的步伐。让我们用积极乐观的心态,书写属于我们的精彩人生!

实践是检验真理的唯一标准

? 🥶 😎 😟 😲 😰 😭 😓
🔔? 😂 😅 😍 😘 😚 😜 🤢
👿 💀 👽 👾 😻 💕 💔 💯
💦 💤 🤝 🙍?♂? 🙍 🍊 🍉 🍏

感谢亲的点赞、收藏、评论,一键三连支持,谢谢

在这里插入图片描述

文章来源:https://blog.csdn.net/qq_15071263/article/details/134957216
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。