基于MATLAB编程的孤立森林异常数据检测(代码完整,数据齐全)

发布时间:2024年01月15日

目录

摘要
简介
孤立森林定义
孤立森林基本思想
基于孤立森林异常数据检测的代码
结果分析
完整代码下载:基于孤立森林的异常数据检测,基于孤立森林的目标检测(代码完整,数据齐全)资源-CSDN文库 https://download.csdn.net/download/abc991835105/88740408

摘要

孤立森林简介,孤立森林原理,孤立森林公式,基于孤立森林的异常数据检测,基于孤立森林的目标检测

简介:

孤立森林算法是一种适用于连续数据的无监督异常检测方法,由南京大学周志华教授等人于2008年首次提出,之后又于2012年提出了改进版本。与其他异常检测算法通过距离,密度等量化指标来刻画样本间的疏离程度不同,孤立森林算法通过对样本点的孤立来检测异常值。具体来说,该算法利用一种名为孤立树的二叉搜索树结构来孤立样本。由于异常值的数量较少且与大部分样本的疏离性,因此,异常值会被更早的孤立出来,也即异常值会距离的根节点更近,而正常值则会距离根节点有更远的距离。此外,相较于LOF,K-means等传统算法,孤立森林算法对高纬数据有较好的鲁棒性。

孤立森林定义:
我们先给出孤立树(Isolation Tree)和样本点在孤立树中的路径长度的定义

孤立树:若为孤立树的一个节点,存在两种情况:没有子节点的外部节点,有两个子节点和一个test的内部节点。在的test由一个属性和一个分割点组成,的点属于,反之属于。

样本点在孤立树中的路径长度:样本点从的根节点到叶子节点经过的

文章来源:https://blog.csdn.net/abc991835105/article/details/135592404
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。