机器学习|划分聚类之 K-Means 详解 (Python 语言描述)

划分聚类，顾名思义，通过划分的方式将数据集划分为多个不重叠的子集（簇），每一个子集作为一个聚类（类别）。

在划分的过程中，首先由用户确定划分子集的个数 `k`，然后随机选定 `k` 个点作为每一个子集的中心点，接下来通过迭代的方式：计算数据集中每个点与各个中心点之间的距离，更新中心点的位置；最终将数据集划分为 `k` 个子集，即将数据划分为 `k` 类。

而评估划分的好坏标准就是：保证同一划分的样本之间的差异尽可能的小，且不同划分中的样本差异尽可能的大。

2019-02-07

机器学习 / 装袋 / 提升

35 分钟读完 (大约 5238 个字)

机器学习|装袋和提升方法详解 (Python 语言描述)

前面的文章都是独立的讲解每一个分类器的分类过程，每一个分类器都有其独有的特点并非常适合某些数据。但在实际中，可能没有那样合适的数据，在应用前面的分类器时，可能会出现分类准确率低的问题。为解决这样的问题，集成学习便被提出，利用多个弱分类器结合的方式使得分类准确率提高。本次详细讲解了集成学习中十分经典的几个算法：装袋（Bagging）中的 Bagging tree 和随机森林（Ramdom Forest）以及提升（Boosting）中的 Adaboost 和梯度提升树（GBDT）。

2019-02-01

机器学习 / 决策树

44 分钟读完 (大约 6610 个字)

机器学习|决策树详解 (Python 语言描述)

决策树是一种特殊的树形结构，一般由节点和有向边组成。其中，节点表示特征、属性或者一个类，而有向边包含判断条件。决策树从根节点开始延伸，经过不同的判断条件后，到达不同的子节点。而上层子节点又可以作为父节点被进一步划分为下层子节点。一般情况下，我们从根节点输入数据，经过多次判断后，这些数据就会被分为不同的类别。这就构成了一颗简单的分类决策树。

2019-01-31

机器学习 / 感知机 / 人工神经网络

1 小时读完 (大约 8060 个字)

机器学习|感知机和人工神经网络详解 (Python 语言描述)

人工神经网络是一种发展时间较早且十分常用的机器学习算法。因其模仿人类神经元工作的特点，在监督学习和非监督学习领域都给予了人工神经网络较高的期望。目前，由传统人工神经网络发展而来的卷积神经网络、循环神经网络已经成为了深度学习的基石。本篇文章中，我们将从人工神经网络的原型感知机出发，介绍机器学习中人工神经网络的特点及应用。

机器学习|划分聚类之 K-Means 详解 (Python 语言描述)

机器学习|装袋和提升方法详解 (Python 语言描述)

机器学习|决策树详解 (Python 语言描述)

机器学习|感知机和人工神经网络详解 (Python 语言描述)

链接

分类

标签云

最新文章

归档

标签

最新文章

归档

标签

Your browser is out-of-date!