如何满足机器学习和数据分析的需要

发布时间：2021-03-07 15:15:56 所属栏目：外闻来源：互联网

导读：机器学习算法可以在无监督的情况下运行，随着深度学习算法的连续层处理多个级别的数据分析，I/O配置文件会导致高度随机访问。机器学习和人工智能培训通常以批处理模式运行，在此模式下，数据科学家可以创建机器学习人工智能模型，针对数据进行测试，并随着时

机器学习算法可以在无监督的情况下运行，随着深度学习算法的连续层处理多个级别的数据分析，I/O配置文件会导致高度随机访问。机器学习和人工智能培训通常以批处理模式运行，在此模式下，数据科学家可以创建机器学习人工智能模型，针对数据进行测试，并随着时间推移完善模型。这种方法要求低延迟以确保快速执行，因为更短的模型测试时间意味着更多的迭代和更好的模型。

因此，组织选择的特定存储产品应基于其所做的工作类型以及所需的机器学习和人工智能培训。无论哪种情况，获得存储产品的性价比都会有一些折衷。

分层方法

在购买任何存储产品时，成本与性能是一个关键考虑因素。如果有这个选择，大多数组织都会购买速度尽可能快的存储设备。然而，获得更高性能需要付出更大的代价。通常，高性能系统不会扩展到数PB的范围内。加上假设随时分析的数据工作集将成为整个数据资产的子集，很容易看出存储分层是设计机器学习和人工智能数据存储的必要部分。

在机器学习和人工智能的背景下，分层到底意味着什么?传统的分层产品从固定存储池发展为复杂系统，根据使用频率和可用池容量优化单个存储块的位置。但是由于数据的处理方式，这种方法并不能很好地满足机器学习和人工智能的要求。

自动化分层产品假定数据经过对业务非常重要的生命周期。新的数据是非常重要的，并且将被频繁访问。随着时间的推移，数据的价值逐渐降低，它可以移动到成本更低、性能更低的产品存储中。

用于机器学习和人工智能分析的数据使不同的整个数据集变为活动状态并用于分析，同时需要在任何时候使用整个数据集。这意味着使用中的数据必须位于性能一致的存储层上，因为访问中的任何变化都会影响模型训练等问题。

机器学习和人工智能模型开发中的数据处理的随机性，意味着试图随着时间动态重新平衡数据的反应性存储平台算法将不起作用。这些算法假设一个规模较小且相对静态的工作集，该工作集随时间的推移而逐渐变化。在机器学习和人工智能中，数据访问配置文件将更加随机，因此很难预测要缓存哪些数据以及如何调整缓

（编辑：桂林站长网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!

为何机器人一定要长得	亚马逊云服务出现大面
高通骁龙新平台揭露 4	黑色星期五疯狂不再