实验内容包含要进行什么实验,实验的目的是什么,实验用到的算法及其原理的简单介绍。
利用所学知识,使用决策树实现Iris鸢尾花数据集分类任务。
Iris鸢尾花数|据集:包含花萼长度、花萼宽度、花瓣长度、花瓣宽度四个属性,用于预测鸢尾花种类,标签0、1、2分别表示山鸢尾、变色鸢尾、维吉尼亚鸢尾。
若实验内容皆为指定内容,则此部分则可省略;若实验内容包括自主设计模型等内容,则需要在此部分写明设计思路、流程,并画出模型图并使用相应的文字进行描述。
简单介绍实验环境和涉及的数据集。
下载地址:https://archive.ics.uci.edu/ml/datasets/Iris也可使用scklearn自带的Iris数据集
手动实现ID3,C4.5,CART的任意一种
使用scklearn实现对应决策树分类模型
比较手动实现模型和scklearn自带模型实现结果的差异并分析实验结果。
实验过程包括整个实验流程说明和在编写代码时一些需要注意的事项,可附代码片段进行说明;
注:为了代码片段尽量的美观、统一,建议附代码片段时只附加关键的片段,不要全部粘贴,并尽量使用下面提供的网站进行代码高亮等格式转换后再粘贴。
https://highlightcode.com/
首先,使用datasets.load_iris()从sk