还在用“手动档”跑机器学习?

百家 作者:企业网D1net 2022-10-11 18:07:09

播种施肥费时费力?

自动化

物流分拣追求速度?

自动化

工业装配琐碎危险?

自动化


随着自动化触角深入到社会各个方面,处于技能金字塔顶端的机器学习,如今正乘着自动化的东风,降低数据科学在企业环境下的运行门槛,帮助非技术人员使用机器学习解决业务问题。

在自动化机器学习模式下,像预处理和清理数据、选择和设计适当的特征、调整和优化模型等重复型、手动密集型的机器学习任务得以大大简化,以往要花费几天、几个月的模型创建任务,如今几小时甚至几分钟之内就能完成。

即便没有高深的数学、统计学、编程知识,普通员工也能开发模型进行相对简单的数据分析;而对于专业的数据科学家,自动化机器学习可以加速前期数据准备工作,提高AI开发效率。

自动化机器学习究竟有多强大?咱们通过一个实例具体感受一下。


当自动化遇上

大规模机器学习


Epsilon隶属于阳狮集团,总部位于美国德克萨斯州,是一家提供数据管理、邮件营销、忠实客户计划的平台。Epsilon在全球40多个办事处拥有8,000多名员工,曾被《广告时代》评为全球最大的客户关系管理/直复营销公司,是许多财富500强公司忠诚度计划背后的不容忽视的营销力量。


Epsilon旗下数据交流共享平台Abacus管理着3000多家品牌商的交易数据,在客户开展营销活动前,Abacus会为他们定制一个可能对其产品目录、价格等感兴趣的消费者名单,从而更准确地锁定潜在用户

一年当中,Epsilon会创建超过10万机器学习模型,处理的数据集经常在TB级别,如此规模的运营下原有系统遭遇吞吐量挑战,为了提高机器学习效率,Epsilon选择将尽可能多的数据科学工作自动化。带着这个目标,Epsilon部署了H2O.ai的无人驾驶AI(Driverless AI)和戴尔基础架构

Epsilon每天需要发送和处理10亿封电子邮件,管理超过6亿会员。为了处理如此大量的数据,Epsilon基于Dell PowerEdge R740xd服务器构建了Agility HarmonyTM多通道消息传递平台

各种大数据技术堆栈在Harmony上运行着,包括 Hadoop、Cassandra 和memcached 大数据集群,PowerEdge R740xd为这些集群提供底层支撑。PowerEdge R740xd灵活、可扩展的架构给Epsilon留下了深刻印象,不论需要多少CPU功率、内存还是存储数据集群,它都可以根据快速变化的需求支持不同类型的工作负载。

Epsilon运营高级副总裁JunChen表示:

在快节奏的数据分析世界中,最大的挑战是如何跟上快速发展的技术,同时确保员工具备必要的技能。戴尔科技集团帮助Epsilon将Harmony的平台容量扩展时间从几个月缩短到几周,而领先的交付速度正是Epsilon区别于其他竞争者的关键优势之一。


借助H2O.ai无人驾驶AI和戴尔基础架构解决方案,Epsilon简化了AI开发流程,其数据科学团队能够持续监测模型和受众结构,确保模型满足客户目标,并在发生变化时快速调整。该解决方案还允许Abacus会员通过营销活动定位15,000个高度相关的潜在客户,并将响应率提高了3%-5%。这个数字可能看起来很小,但背后意味着巨大的收入增长。

以某个同时向消费端、企业级用户销售礼品的品牌为例,该会员的直邮回复率提高了1.10%,仅一场营销活动就带来了900万美元的额外收入。要知道,Epsilon每年管理的营销活动超过8000个,因此这对整个Abacus会员平台的影响相当深远。


交钥匙的

AI自动化方案 


正是基于简单、功能强大的自动化AI工具,无需高深复杂的数据科学专门知识,Epsilon团队人员也能快速部署机器学习模型,实现高效的业务转化。

为了实现这样的成果,组织需要为员工提供硬件和软件的正确组合。您可以像Epsilon一样自主挑选软件和硬件进行搭配,但与此同时还有更省心省力、高效便捷的交钥匙式解决方案供您选择——经过工程验证的AI设计

这里推荐戴尔科技集团和合作伙伴联合开发的经过验证的AI设计解决方案——Automatic Machine Learning(AutoML),该方案包括用于自动化机器学习的H2O无人驾驶AI、用于云原生AI开发和部署NVIDIA AI Enterprise SuiteTM,在VMware vSphere®上交付,TanzuTM部署在经过工程验证和优化的戴尔基础架构堆栈上(包括VxRail V670或PowerEdge R750xa服务器、PowerSwitch网络和PowerScale F600存储)。

戴尔AutoML解决方案可以自动执行耗时的数据科学任务(如算法选择、特征生成、超参数调整、迭代建模和模型评估等),快速比较数千种组合和迭代,在几分钟或几小时内找到最佳模型,帮助组织快速发现隐藏在数据中的业务价值,轻松解决复杂问题

PowerEdge服务器为这套方案提供计算支持,闪存、最新处理器和具有灵活本地存储的内存使PowerEdge服务器成为人工智能的基本选择,其无与伦比的性能和多功能配置,可满足机器学习工作负载在大规模分析性能、高并发、处理能力、吞吐量等方面的严苛要求。

在这一联合解决方案落地过程中,戴尔科技集团30多年高效可靠的解决方案部署经验、世界一流的专家支持团队可以帮助您简化复杂性并尽快上线新的IT投资;另外,戴尔APEX即服务允许您灵活付费,通过简单一致的云体验即服务获得本地、云端、边缘部署的人工智能解决方案,缓解前期资金投入压力,改善现金流。

AI时代汹涌来袭,创新角逐愈演愈烈,在戴尔经过工程验证的AI解决方案支持下,企业将大大简化机器学习,加速实现AI创新。 

END

国庆将至,福利先行

0元试用,无需归还

免费抽取福利,百分之百中奖

扫描下图二维码

开启十月好运气

关注公众号:拾黑(shiheibook)了解更多

[广告]赞助链接:

四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

公众号 关注网络尖刀微信公众号
随时掌握互联网精彩
赞助链接