2023 英特尔On技术创新大会直播 |打造自己的聊天机器人

发布时间:2023年12月20日

2023 英特尔On技术创新大会会议简介

在这里插入图片描述
2023 英特尔On技术创新大会是面向智算时代的开发者的一场技术大会,在世界很多地方有召开。2023年9月19日,2023英特尔on技术创新大会在美国加州圣何塞市开幕。2023年12月19日中国站正式开始。中国站的主题由帕特·基辛格开幕,并有多个中国专家深度讲解英特尔最新一代加速 AI 能力的计算平台,支持开放、多架构的软件方案和工具,塑造未来的技术和应用创新。
在这里插入图片描述

这场技术大会有很多的主题
在这里插入图片描述

内容丰富,挑选一个我感兴趣的主题进行记录分享。

主题-打造自己的聊天机器人

讲座目标

由于工作原因,我还是比较喜欢这个主题的,比较适合IT人员,这个主题是面向一个具体应用场景的,讲座由邓会鹏讲解,邓会鹏是英特尔AI解决方案架构师。
在这里插入图片描述
这不是第一次了解到邓老师,在今年(2023年)1024程序员节北京站的的活动上,邓老师就分享了《IA平台上优化GenAI开源工具》的主题,当时的主题内容如英特尔在基于量化加速的LLM推理部署中,基于CPU指令集,为大语言模型的量化以及高效推理设计的代码库BigDL-LLM优化方案。

本次讲座中,首先结合AI的流程,介绍了Intel AI 的软件产品组合。
在这里插入图片描述

然后提纲挈领的说明本次讲座的最终收获,

After this class, you will be able to:
本课程结束后,您将能够:
Successfully build a chatbot using Neural Chat within lntel Extension for Transformers
在Transformers的lntel扩展中使用神经聊天成功构建聊天机器人
Run LLM workflows for finetuning, quantization and inference deployment
运行LLM工作流以进行微调、量化和推理部署
在这里插入图片描述
还是主题明确,输出显著的,开始学习

Intel AI Software Portfolio技术

由于数据处理,建模需要多种类库,Intel提供了OneAPI MKL等多个底层的支撑平台,加速深度学习的运算。对于使用者,还提供了在线平台和Hugging Face等。
在这里插入图片描述

在Hugging Face社区,提供了训练微调部署的全套优化组件,这些组件是基于Intel对transformers,pytorch,DeepSpeed等的拓展支撑。在这里插入图片描述

聊天 Neural chat的代码实现

英特尔的Neural chat对知识抽取,微调和提示工程有很好的支持,同时提供多种模型,可以在英特尔的多种设备上运行,适配较好。
在这里插入图片描述

加载模型进行预测

这个功能的代码十分简介,便于快速入门,也可以自定义模型,是否使用CPU|GPU,是否需要语音支持等。
在这里插入图片描述

语言输入返回

ASR是自动语音识别,接下来把文本输入LLM,针对返回格式再用语音返回。
在这里插入图片描述代码实现
在这里插入图片描述

文本过滤

如果针对返回结果进行过滤呢,这里采用KV进行过滤,用星号进行过滤
在这里插入图片描述
代码实现
在这里插入图片描述

性能提升

采用提示词工程
检索增强
在这里插入图片描述如何完成信息检索增强呢,当我们问what is IDM2.0 ,我们会把这行结果与知识库中的数据进行匹配,得到的结果智能会提高很多。
在这里插入图片描述代码实现
在这里插入图片描述

微调代码实现

添加对应组件
在这里插入图片描述

推理代码实现

只需要修改微调后的模型路径
在这里插入图片描述

量化实现

大模型为了节省计算时间,可以使用量化,量化就是把大模型的参数精度减少些,然后计算速度就会提示,也是一个很常见的推理性能提升手段
在这里插入图片描述

主题感悟

大模型与大多数人的使用越来越近了,基于英特尔的大模型的部署推理微调量化过程十分的便捷,可以说10行代码就可以部署推理本地的一个大模型,同时英特尔还提供了很多大模型以供选择。
基于英特尔的这系列组件还是挺友好的,封装了很多细节,也保留了一定的自由度,对于大模型的IT使用者来说,基于这些上层的API可以某种程度上提示大模型的部署推理量化速度,还是值得尝试的
大厂出品,必属精品💯

参考资源

在这里插入图片描述

Build LLM demo on Intel? Xeon? platform:
intel-extension-for-transformers/intel_extension_for_transformers/neural_chat at main · intel/intel-extension-for-transformers (github.com)
https://www.intel.com/content/www/us/en/developer/topic-technology/artificial-intelligence/overview.html
Get developer resources from Intel and Hugging Face:
https://www.intel.com/content/www/us/en/developer/ecosystem/hugging-face.html
Visit Neural Chat Github?:
https://github.com/intel/intel-extension-for-transformers/tree/main/intel_extension_for_transformers/neural_chat

文章来源:https://blog.csdn.net/m0_38139250/article/details/135094543
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。