欢迎光临
我们一直在努力
您的位置:首页>资讯 >

机器学习挑战入门前需要了解的内容

机器学习的回报可能很有吸引力,现在可能会让你想要开始。但是,与此同时,在开始自己的项目之前,您需要考虑机器学习挑战。

这篇文章并不是要吓跑你; 相反,它意味着确保你做好准备,并且在开始之前你仔细考虑了你需要考虑的事项。

我们采访了Oracle信息管理平台团队的数据科学家Brian MacDonald,了解他所看到的陷阱以及公司可以采取哪些措施来避免它们。

这些机器学习挑战包括:

解决技能差距问题

了解如何管理您的数据

操作数据

1.解决机器学习技能差距问题

当然,最大的困难是在大数据环境中使用机器学习所带来的技能差距。有一些人认为大数据让生活变得美丽,而且很容易上手。

你要找到的最大挑战是发现合适的人。对于熟练掌握机器学习和小型游泳池的人来说,有很大的需求。但正如我们在关于机器学习成功的文章中所描述的那样 ,拥有高管支持是关键。如果你有行政支持,你也将获得资金来寻找和招募那些有价值的人。

这是值得思考的问题。如果您处于对成本非常敏感的情况,因为熟练的数据科学家很昂贵,那么您可能没有足够的业务问题来使机器学习值得做。

假设一位技术熟练的数据科学家花费您的公司30万美元到400,000美元(包括所有福利和激励措施)。如果那个人无法帮助你解决每年至少价值一百万的问题,那么你可能不需要那个人。对?

另一方面,如果你真的相信这个人(或团队)可以帮助你解决数以千万计的问题,那么你还在等什么呢?

很难找到人。但如果它对贵公司来说真的很重要,你就可以找到它们。

这是另一个需要考虑的问题:工具和软件。虽然有一些工具可以提供帮助,但您很少能够找到所需的精确,完美的 机器学习工具 ,并且开箱即用。你将不得不考虑你将要使用的工具。

Python,R,SQL,TensorFlow?如果您使用它们,它们将如何与您的数据湖一起使用?您将如何处理可能带来挑战的设置和配置?在开始之前仔细考虑细节并确保您有足够的资金。

2.了解如何管理大数据

机器学习是一个混乱的过程。只是拥有一个大数据平台并不会自动意味着它会更容易。事实上,它可能会变得更加混乱,因为你会有 更多的 数据。该数据使您可以执行更多操作,但这也意味着必须完成更多数据准备工作。

你必须从整体上思考如何解决这个问题。以下是一些需要考虑的问题:

您的数据来自哪里?

你怎么解决这个问题?

您希望如何处理数据准备?

一旦完成,您将如何构建模型并实现一切操作?

如果您还没有良好的BI实践或分析实践,并且如果您没有以所有可以想到的方式使用数据,那么跳转到机器学习确实是一个挑战。已经有数据驱动的决策绝对是至关重要的。如果您没有,我们建议您在开始机器学习之前将其安装到位。

如果你决定开始,这里有一些其他的考虑因素。在开始之前仔细考虑它们:

快速变化

在机器学习领域,创新正在迅速发展,这意味着快速变革。今天有什么好处明天可能不太好,你不能总是依赖软件,因为它是一个更不稳定的空间。您可能会遇到更多不同版本和冲突的问题。

纯粹的数据量

通过机器学习,您将不得不处理数据 - 批次和许多不同类型的数据。了解您是否使用了所有这些,流程,是否采样等等 - 所有这些都是一个挑战,尤其是当您深入了解数据并处理数据移动时。

确保您能够面对这一挑战并确保您制定计划。

3.操作您的大数据

大多数数据科学家面临的最大问题是什么?它正在运作数据。

假设您已经构建了一个模型,它可以预测导致流失的因素。你如何将这种模式传达给可能影响这些数字的人?你怎么能把它带到CRM或移动应用程序?

如果您有预测设备故障的模型,您如何及时将其交给操作员以防止出现故障?采用模型并使其可操作性存在许多挑战。这可能是目前数据科学家面临的最大技术挑战。

您可以构建世界上最美丽的模型。但是,如果它不能真正影响公司的利润,那么你的高级管理层真的会关心吗?您可能认为您讨价还价的部分只是为了提供数据。但事实并非如此。您必须确保实际使用您的数据。获得行政支持对此非常有帮助。

所以机器学习并不容易。但它可以完成大事。为了激励您并提醒您可能的事情,我们将分享一个真实的客户示例和他们的机器学习项目。

真实机器学习和大数据示例

该公司是美国最大的无线语音和数据通信服务提供商之一。

业务挑战:

· 信用风险:他们通过融资部门进行的设备租赁和贷款计划每年都要注销大量的坏账。他们希望减少不良贷款和违约,这将显着增加每年数百万的底线。此外,影响待处理集合的能力将极大地帮助现金流。

· 客户体验和个性化:客户流失每年使该公司损失数百万美元。通过个性化和细分,及早识别和定位潜在流失和新的高价值客户可以大大增加净新用户的数量并减少客户流失。

· 运营效率:该公司通过网络优化和数据货币化寻求增强的目标营销和活动有效性。

技术挑战:

·该电信公司希望更早发现欺诈活动,并整合来自多个结构化和非结构化来源的数据,以改善客户评分。这将使公司能够提供定制服务并降低风险。

·他们还希望能够存储和分析大量客户数据,以帮助业务部门更好地分割客户并预测他们的个性化优惠行为。

·他们寻求通过新的先进的假设分析来优化定价。

为了实现这一目标,该公司购买了各种 Oracle大数据产品, 包括Oracle Data Gate for Big Data,这是Oracle数据集成平台云的一部分。

解决技能差距,管理数据和实施数据是需要解决的挑战 - 但它们可以成功处理。结果可能令人难以置信。 有关更多信息,请阅读有关 机器学习成功提示的更多信息。

如果您想尝试构建数据湖并使用机器学习数据, Oracle提供免费试用。立即注册,看看你能做些什么。

免责声明:本网站图片,文字之类版权申明,因为网站可以由注册用户自行上传图片或文字,本网站无法鉴别所上传图片或文字的知识版权,如果侵犯,请及时通知我们,本网站将在第一时间及时删除。