探寻DarwinML1.0的秘密企业可以用它做什么？-服务器专区

探寻DarwinML1.0的秘密企业可以用它做什么？

作者：李佳惠编辑：李佳惠 2018-08-04 08:41 IT168网站原创

　　这年头，企业不贴一个人工智能标签就好像被时代抛弃了，跟不上所谓的潮流。我们相信在不久的将来不应用人工智能的企业，核心竞争力确实会下降，但光贴标签是不够的。

　　小编近日遇到一个不讲AI是什么的人工智能公司，他们讲的是企业可以用人工智能做什么。

　　8月2日，探智立方正式发布人工智能模型自动化设计平台—DarwinML1.0，该平台以机器学习(AutoML)为核心技术，以基因进化理论为设计思想，用户只需具备人工智能基本概念，即可设计开发机器学习模型，从而缩短建模人员及数据科学家创建模型的时间及门槛，提升效率，满足面向定制化场景的人工智能模型创建需求。

　　什么是AutoML?

　　传统上，术语AutoML用于描述模型选择和/或超参数优化的自动化方法。这些方法适用于许多类型的算法，例如随机森林、神经网络等。说白了，AutoML 最核心的内容其实就是用计算力和数学方法自动做数据特征提取以及模型建模。

　　而在业界，大多数的数据科学家和算法科学家的工作内容就是模型调优和设计，但既有的模型无法满足业务需求，定制化的设计开发又很耗费时间，对于一些企业来说，甚至不能负担起招聘博士专家。

　　由此，探智立方DarwinML 1.0应运而生，它不仅能够解决”效率“的问题，将模型优化的过程抽象成纯数学问题，利用机器学习的算力、以搜索拟合的方式在尽可能短的时间内寻找全局非常好的解决方案，而且相较传统的机器学习模型，由专家驱动的机制转换成了由业务驱动，极大程度上释放了分析师、开发者的时间，从而可以投入更多的时间进行创新。

　　除此之外，所谓的自动化机器学习(AutoML)究竟和人工建模相比有什么实打实的优势呢?从探智立方给出的用CIFAR-10数据集进行测试的深度学习案例上，我们找到了一个数字化的答案。

　　时效方面，通常用户把比较好的论文的模型转换成自己可用的模型并且优化需要2个深度学习模型开发人员2个月左右的时间，而DarwinML只需要1周的时间。

　　内容上，直接使用开源模型或论文模型，会使得计算力有浪费的情况，而DarwinML平台从数据特点出发，效率和准确率都得到了保证。

　　窥视模型设计的全过程

　　我们经常听说的一些机器学习的项目，实际它的结构差别是很小的，一个效果好的模型通常需要大量的经验调优，这个过程包括：数据预处理、特征选择、模型算法的选择、调参、上线后的模型优化升级、效果评估。

　　首先，DarwinML 平台会提取数据的统计信息。

　　然后它开始自动进行模型设计。在进化到每一代时，都会对模型进行一次评估，以选择继续演化的方向，同时防止种群，也就是所有模型的整体早熟(避免重复使用前期效果比较好的相同或者相近的模型，尽量让选择在解空间里分散化)。

　　当演化到达客户的准确率或者时间限制要求后，DarwinML 平台会再固定模型结构进行一次参数精调，同时进行超参数的局部优化。

　　最后，在整个过程结束后，以报告的形式将模型的特征、硬件配置、各项表现指标返回给用户。

　　值得一提的是DarwinML 平台是一个全生命周期管理平台，基于其基因库，平台具有自我演化、自主设计的特性，可以加快模型设计收敛速度，提供ML模型可解释性，能够无缝与生产系统对接，并对生产模型实时优化。最终实现AI真正的“平民化”，重构人工智能开发生态。

　　出现其他AutoML 开源工具，选谁?

　　深度学习通常比较复杂，从零开发是比较难的事情，但目前市面上已经有一些公司提供自动化的深度学习平台，如微软的CustomVision.AI、谷歌的 Cloud AutoML，第四范式、智铀科技也推出了AutoML。这里不得不说说最近大火的

　　Google AutoML。

　　首先，我们看看探智立方给出的Google AutoML和DarwinML 1.0的区别：

　　DarwinML使用演化算法AutoML 系统，根据数据特征不同自动设计适合的模型，而Google AutoML是从现有的模型库选择合适的模型针对数据做迁移学习，有数据后，进行评估模型。
　　DarwinML通过大量公有数据持续更新AI基因库，从而使得AI模型的设计能力逐步提升，设计速度更快。庞大的神经元基因库，可以支持不同行业。
　　拥有超过人类数据科学家设计能力的潜质

　　Google AutoML在经历过一系列的吹捧之后，也有Rachel Thomas等大牛对它表示质疑，提出了开发者们需要“设计不同功能的神经网络”吗?神经网络是否能用有效的方法解决类似的问题呢?巨大的计算力真的可以替代机器学习专家吗?等类似问题。

　　AutoML或许还在路上，但让深度学习、机器学习不再处于神坛，走向“平民化”是未来发展的一个趋势，是包括谷歌、探智立方努力的方向所在。

　　此外，对于市面上出现的其他一些开源工具，产品总监宋煜表示，“并不担心一个AutoML产品出来之后挤占市场份额。当大家都接受做模型是劳动密集型的事情，并且希望用机器去代替的时候，反而更有利于DarwinML。谁的效率高用户就会选择谁!”

　　人工智能赋能定制模型创建

　　人工智能产业链中，紧密结合技术层和应用层，实现人工智能应用落地，是极为重要又必要的一点。DarwinML平台，正是专注于这一点，同时，从各个维度满足企业级客户对于人工智能的渴望。

　　探智立方首席运营官施东峰表示，公司以快速建立定制化模型为服务目标，从模型设计、共享、迁移、生产的角度打造一个满足金融、物联网、教育、医疗等行业用户人工智能需求的平台。

　　产品总监宋煜也提到，“平台所提供的应用案例是跨行业的。我们在金融领域里做风控相关模型、在保险领域里做图像识别模型、在医疗领域里做医疗电子档案和专业术语的语音识别、在制造业进行质检和良品率分析。”

　　写在最后，在人工智能快速发展的浪潮下，机器学习模型设计需求快速增长与人工智能人才供给不足的矛盾发展的必然结果，就是AutoML能力的普及化。尽管AutoML在全球范围内，产品与解决方案都处于探索期，但开发门槛的降低、模型设计主体的转变，势必会使整个领域都产生颠覆性变化，而探智立方在AutoML领域中国市场的发展，我们静候佳音。