机器学习算法:
机器学习中应用最广泛的两种算法是监督学习 (Supervised Learning)和非监督学习 (Non-Supervised Learning),但也有其他的机器学习算法。以下是最流行类型的概述。
什么是监督学习算法?
监督学习算法使用标签实例进行训练,比方说输入对象的已知期望输出值。例如,设备的某一块数据点可能标记为“F”(失败)或“R”(运行)。学习算法接收一组输入数据和对应的正确输出,通过比较实际输出与正确输出来找出误差,再对模型做出相应地修改。监督学习通过分类、回归、预测和梯度增强等方法,利用模型预测更多不含标签数据的标签值。监督学习广泛使用在应用程序中,尤其是利用历史数据预测未来可能发生的事件。例如,它可以预测何时信用卡交易可能具有欺诈性,或者哪位保险客户可能提出索赔。
什么是半监督学习算法?
半监督学习算法( Semi-Supervised Learning) 与监督学习算法有着相同的原理。但半监督学习算法同时使用标记和未标记的数据进行训练——通常是少量的标记数据和大量的未标记数据(因为未标记的数据成本更低,也较易获得)。它可以与分类、回归和预测等方法一起使用。当数据标记成本过高,无法实现彻底地标记训练过程时,半监督学习是非常有用的。比如早期的通过网络摄像头识别人脸的实例。
什么是无监督学习算法?
无监督学习算法(Unsupervised Learning)用于没有历史标签的数据。系统不会被告知“正确答案”。算法必须计算出所显示的内容。我们的目标是探索数据并从中找到一些结构。无监督学习在交易数据上工作得很好。例如,它可以利用相似的属性来识别客户阶层,从而定义营销活动的客户群。或者,它可以找到主要属性来区分客户阶层。当下流行的技术有:自组织映射神经网络、最近邻映射、k-均值聚类和奇异值矩阵分解。这些算法还用于分割文本主题、类目推荐和识别数据异常值。
什么是强化学习算法?
强化学习算法(Reinforcement Learning)通常用于机器人学、电子游戏和电子导航。强化学习最重要的是重复试验以推算出最佳算法。这种类型的学习有三个主要组成部分:代理(学习者或决策者)、环境(代理所处的环境)和操作(代理可以做什么)。目标是让代理在规定时间内选择操作以获得尽可能多的预期奖励。通过遵循一个好的策略,代理能更快地实现目标。因此,强化学习的目标是获悉最佳策略。人类通常一周可以创造一到两个好的模型;机器学习每周可以创建数千个模型。