百分科技书解数据科学,文本分析、知识图谱详解,实战案例呈现,助你深入理解技术原理,行业应用启发,助力创新发展。
本书内容
数据科学的关键技术包括数据存储计算、数据治理、结构化数据分析、语音分析、视觉分析、文本分析和知识图谱等方面。本书的重点是详细介绍文本分析和知识图谱方面的技术。文本分析技术主要包括文本预训练模型、多语种文本分析、文本情感分析、文本机器翻译、文本智能纠错、NL2SQL问答以及ChatGPT大语言模型等。知识图谱技术主要包括知识图谱构建和知识图谱问答等。本书将理论介绍和实践相结合,详细阐述各个技术主题的实现路线,并对应用于业界算法大赛中的技术方案和技巧进行源代码解读,帮助读者深入理解技术原理。最后,本书还介绍了文本分析和知识图谱技术在政务、公共安全、应急等多个行业中的智能应用实践案例。
本书作者
苏海波,清华大学电子工程系博士,副研究员,百分点科技首席算法科学家。擅长人工智能领域的自然语言理解、知识图谱、深度学习、个性化推荐以及计算广告技术,有丰富的研发实践经验;曾就职于新浪微博,负责广告系统的算法效果优化,以及信息流产品整体算法策略的设计及研发;现负责百分点大数据与人工智能核心算法,带领团队研发智能校对系统、智能问答系统、知识图谱系统等多款认知智能产品,荣获业界多项奖项,并获得不错的商业化落地效果。
多篇SCI和EI论文发表于 GLOBECOM、ICC、IEICE Transactions 等国外顶尖学术会议和期刊,获得国家发明专利20余项,曾担任科技部重点研发计划子课题负责人。获得2019年和2020年北京市科学技术进步奖,获得2019年全球人工智能与机器学习大会(AiCon)明星讲师,指导团队获得2021 CCKS(全国知识图谱与语义计算大会)知识图谱问答大赛的季军。
本书读者
《数据科学技术:文本分析和知识图谱》适合具备Python和机器学习技术基础的高等院校学生、文本分析(或者自然语言处理)以及知识图谱领域的算法工程师和研究机构的研究者阅读,也适合数据科学和人工智能领域的研究者作为参考书。
编辑推荐
《数据科学技术:文本分析和知识图谱》是一本深入浅出的数据科学技术指南。书中详细介绍了文本分析和知识图谱等关键技术,结合典型案例展示了数据科学在安全、应急等行业的应用实践。无论你是数据科学领域的专业人士还是对数据科学感兴趣的读者,这本书都能帮助你深入了解数据科学的基本概念、方法和最新技术。通过学习《数据科学技术:文本分析和知识图谱》,你将能够掌握数据科学的核心知识,为自己的职业发展和创新项目提供有力支持。
本文节选自《数据科学技术:文本分析和知识图谱》,内容发布获得作者和出版社授权。