Master连胜引爆AI 该懂点机器学习了-服务器专区

Master连胜引爆AI 该懂点机器学习了

作者：陈毅东译编辑：陈毅东 2017-01-06 14:09 IT168网站原创

　　【IT168技术】近日，Master连胜世界围棋高手，并承认其为谷歌的AlphaGo，再次引爆了人们对人工智能和机器学习的兴趣。对于普通吃瓜群众而言该懂点机器学习的基础知识了。

　　什么是机器学习?

　　Berkeley的定义最为简单。机器学习：是人工智能(AI)的分支，探索如何让计算机根据经验改善他们的表现。但定义并不完整，为此通过这篇文章为我们掌握机器学习知识体系建立一些基础。

　　人工智能的分支：通过人工智能的研究和开发，计算机及其系统被赋予成功完成通常需要人类智能行为才能完成任务的能力。机器学习是这个过程的一部分，它是我们训练计算机完成所述任务的技术和过程。

　　探索方法：机器学习技术仍然是雏形。用于训练计算机的一些模型已经被使用，如我们将在下面看到的，但是预期将随时间的推移，发展出更多的模型。需要指出的事，在训练计算机时可以使用不同的模型，因为不同的业务问题需要不同的模型支撑。

　　提高其表现：对于计算机来完成人工智能的任务，它需要实践和适应。机器学习模型需要使用数据进行训练，在大多数情况下，需要一点人工帮助。

　　基于经验：提升AI的经验离不开数据的支持。随着更多的数据被反馈到系统中，计算机的响应能力和预判能力的精准度都会提升。更准确地理解数据意味着更好的完成任务或增加其预测洞察时的信心。

　　示例：

　　1.提供训练数据和条件，比如信用卡交易的数据。

　　2.构建和训练机器学习算法模型，比如检测欺诈性交易。

　　3.训练数据进行扩展，比如看上去像欺诈交易的数据，但其实这些数据并不存在欺诈交易。

　　如图：

　　机器学习如何工作?

　　机器学习通常是在黑盒情况下运行的。让我们来看看训练过程本身，以更好地了解机器学习如何通过数据创造价值。

　　收集：机器学习依赖于数据。第一步是确保你有你想要解决的问题所规定的正确数据。考虑数据收集能力，数据的来源，数据所需的格式，等等。

　　清理：数据可以由不同的来源生成，包含不同的文件格式，并以不同的语言表示。可能需要从数据集中添加或删除信息，因为数据信息的不完整肯定会有，也可能包含不需要的或不相关的条目。所以数据的准备情况将影响可用性和结果的可靠性。

　　拆分：根据数据集的大小，可能只需要一部分，这通常被称为抽样。从所选样本中，可用数据数据应分为两组：一组用于训练算法，另一组来进行评估。

　　训练：如通常在神经网络中看到的，这个阶段基本上旨在找到将准确地完成所选目标的数学函数。使用数据集的一部分，算法将尝试处理数据，测量其自身的性能并自动调整其参数，直到它能够以足够的可靠性持续产生所需的结果。

　　评估：一旦算法在训练数据上执行良好，它的表现将再次用尚未见到的数据来测量，而且需要时进行额外调整。此过程是为了避免机器学习发生仅对训练数据的训练上表现良好。

　　优化：同时模型针对目标应用程序的集成进行优化，以确保它尽可能轻量和快速。

　　不同类型的机器学习算法

　　有许多不同的模型算法可以在机器学习中使用，但它们通常分为三种不同类型的学习：监督，无监督和强化。根据完成任务的不同，不同模型的合适程度和表现也不同。

　　监督学习：在这种类型的学习中，训练数据有标签。这意味着学习算法在读取数据时已经给出了答案。它不是找到答案，而是旨在找到关系，以便在引入未知数据时，它可以正确地分类或预测它们。

▲如图：数据标记

　　分类算法，比如信用卡历史交易，学习算法可以为每个交易被标记安全或可疑。它将学习这两个分类之间的关系，然后可以根据分类参数(例如，购买位置，交易之间的时间等)适当地给未知交易标记标签。

▲如图：分类算法

　　回归算法学习用于预测连续数据，比如股价分析和预测。

▲如图：回归算法

　　无监督学习：在这种情况下，学习算法在训练期间没有给出答案。其目的是找到数据之间有意义的关系，它的价值在于发现相关性。例如，聚类算法是推荐系统中无监督学习的常见用法(例如，鸡尾酒问题)。

▲如图：聚类算法

　　强化学习：是监督和无监督学习之间的混合。它通常用于解决更复杂的问题，是将环境互动结合起来的方式，而这离不开环境互动中需要的代理终端和学习。比如在实践中，涉及从控制机器人手臂，以找到最有效的电机组合；机器人导航，避免碰撞行为的学习；游戏也非常适合强化学习，如游戏、扑克，这其中最为有代表性的是谷歌的AlphaGo在与人类的围棋竞技。

　　机器学习的应用

　　机器学习发展在企业中的分为三个阶段，可理解为：描述性的，预测性的和规范性的。

　　描述阶段是指记录和分析历史数据以增加商业智能。向管理人员提供描述性信息，并更好地了解过去行动和过去决定的结果判断。这个过程现在是全世界大多数大型企业的典型案例，例如，审查销售记录和匹配促销活动，以了解其影响和投资回报率。

　　应用机器学习的第二阶段是预测。收集数据并使用它来预测特定的结果，以便更快速和更准确地做出决定。这个应用阶段目前被大多数企业所接受。

　　然而，机器学习的第三和非常先进阶段正在被许多企业所接纳，并被应用在新的领域并大力推进。在寻求有效和高效的商业实践时，机器学习预测行为或结果是不够的。其原因在于，与动机和环境结合是非常好的决策的先决条件。具体来说，当人和机器共同努力时，这个阶段是可能的。机器学习用于找到有意义的关系并预测结果，而数据专家担任翻译者，以了解为什么存在关系。这样，可以更精确地规定动作。

　　此外，以下是一些机器学习可以解决什么问题的企业名录。

　　物流和生产

　　Rethink Robotics使用机器学习训练他们的机器人手臂和提高生产效率;

　　JaybridgeRobotics的工业级车辆自动化，实现更高效的运营;

　　Nanotronics的自动化光学显微镜;

　　Netflix和Amazon根据用户需求优化资源分配;

　　其他例子包括：预测ERP/ERM需求;预测资产故障和维护，提高质量保证，提高生产线效率。

　　销售和营销

　　6sense提供的智能B2B分析预测;

　　Salesforce Einstein帮助预测销售机会和自动化任务;

　　Fusemachines提供自动化销售任务助理

　　AirPR提供增强公关绩效的洞察能力

　　还有如预测客户的生命周期价值，提高客户细分精度，检测客户购物模式，以及优化用户的应用体验等

　　人力资源

　　Entelo帮助招聘员工和甄别候选人;

　　hiQ协助管理人员管理;

　　金融

　　Cerebellum Capital和Sentient使用机器学习增强投资管理决策;

　　Dataminr帮助企业从社交媒体中提供有价值信息，来应对因突发事件所引起的金融风险;

　　还有如，检测欺诈行为和预测股票价格等应用。

　　卫生保健

　　Atomwise利用预测模型，提供药物预测服务;

　　Deep6 Analytics识别合格的患者进行临床试验;

　　还包括，如更准确地诊断疾病，改善个性化护理和评估健康风险等。

关注我们