249 人学过
在接下来的章节中,您将了解Weka,该软件可以轻松完成机器学习任务,并让您舒适地处理大数据。
1 Weka安装
本实验主要介绍Weka,该软件可以轻松完成机器学习任务,并让您舒适地处理大数据。
在接下来的章节中,您将了解Weka,该软件可以轻松完成机器学习任务,并让您舒适地处理大数据。
2 Weka-启动资源管理器
在本章中,让我们研究资源管理器提供的用于处理大数据的各种功能。
在本章中,让我们研究资源管理器提供的用于处理大数据的各种功能。
3 Weka-加载数据
在本章中,我们从用于预处理数据的第一个选项卡开始。这对于您将应用于数据以建立模型的所有算法都是通用的,并且是WEKA中所有后续操作的通用步骤。
在本章中,我们从用于预处理数据的第一个选项卡开始。这对于您将应用于数据以建立模型的所有算法都是通用的,并且是WEKA中所有后续操作的通用步骤。
为了使机器学习算法具有可接受的准确性,必须首先清除数据很重要。这是因为从该字段收集的原始数据可能包含空值,不相关的列等。
4 Weka-文件格式
WEKA支持多种文件格式的数据。在本章中将学习Weka支持的文件各种文件格式。
WEKA支持多种文件格式的数据。
在本章中将学习Weka支持的文件各种文件格式。
5 Weka - 预处理数据
在本章中将学习预处理数据。
从现场收集的数据包含许多不需要的东西,这些东西会导致错误的分析。例如,数据可能包含空字段,可能包含与当前分析无关的列,依此类推。因此,必须对数据进行预处理才能满足您要查找的分析类型的要求。这是在预处理模块中完成的。
在本章中将学习预处理数据。
6 Weka - 分类器
本实验,我们将学习如何在天气数据上建立这样的树分类器,以决定比赛条件。
许多机器学习应用程序与分类有关。例如,您可能希望将肿瘤分类为恶性或良性。您可能要根据天气情况决定是否玩户外游戏。通常,此决定取决于天气的几个特征/条件。因此,您可能更喜欢使用树分类器来决定是否玩游戏。
在本章中,我们将学习如何在天气数据上建立这样的树分类器,以决定比赛条件。
7 Weka - 聚类
本实验主要介绍Weka中的聚类算法操作
聚类算法在整个数据集中查找相似实例的组。WEKA支持多种聚类算法,例如EM,FilteredClusterer,HierarchicalClusterer,SimpleKMeans等。您应该完全理解这些算法以充分利用WEKA功能。
与分类一样,WEKA允许您以图形方式可视化检测到的群集。
为了演示聚类,我们将使用提供的虹膜数据库。数据集包含三个类别,每个类别有50个实例。每个类别都指一种虹膜植物。
8 Weka - 关联
本实验将学习Weka - 关联的操作。据观察,购买啤酒的人也同时购买尿布。那是一起购买啤酒和尿布的协会。尽管这似乎不太令人信服,但该关联规则是从大型超市数据库中提取的。同样,花生酱和面包之间可能存在关联。 找到这样的关联对超市来说至关重要,因为他们会在啤酒旁边堆放尿布,以便客户可以轻松找到这两种商品,从而增加了超市的销售量。 该先验算法是这样的一个算法,ML是找出可能的协会,并创建关联规则。WEKA提供了Apriori算法的实现。您可以在计算这些规则时定义最小支持和可接受的置信度。您将把Apriori算法应用于WEKA安装中提供的超级市场数据。
据观察,购买啤酒的人也同时购买尿布。那是一起购买啤酒和尿布的协会。尽管这似乎不太令人信服,但该关联规则是从大型超市数据库中提取的。同样,花生酱和面包之间可能存在关联。
找到这样的关联对超市来说至关重要,因为他们会在啤酒旁边堆放尿布,以便客户可以轻松找到这两种商品,从而增加了超市的销售量。
该先验算法是这样的一个算法,ML是找出可能的协会,并创建关联规则。WEKA提供了Apriori算法的实现。您可以在计算这些规则时定义最小支持和可接受的置信度。您将把Apriori算法应用于WEKA安装中提供的超级市场数据。
9 Weka - 功能选择
本实验主要介绍Weka的功能选择,当数据库包含大量属性时,将有几个属性在您当前正在寻找的分析中变得不重要。因此,从数据集中删除不需要的属性成为开发良好的机器学习模型的重要任务。您可以目视检查整个数据集,并确定不相关的属性。对于包含大量属性的数据库(例如您在上一课中看到的超级市场案例)而言,这可能是一项艰巨的任务。幸运的是,WEKA提供了用于功能选择的自动化工具。 本实验将在包含大量属性的数据库上演示此功能。
当数据库包含大量属性时,将有几个属性在您当前正在寻找的分析中变得不重要。因此,从数据集中删除不需要的属性成为开发良好的机器学习模型的重要任务。
您可以目视检查整个数据集,并确定不相关的属性。对于包含大量属性的数据库(例如您在上一课中看到的超级市场案例)而言,这可能是一项艰巨的任务。幸运的是,WEKA提供了用于功能选择的自动化工具。
本章将在包含大量属性的数据库上演示此功能。