云计算产业看国家“新基建”
|
3. 数据的初步探索 在这一步骤中会发现所有对研究结果、预测以及目标有影响的数据特征。如果你有一个巨大的数据块,在该步骤中对其进行抽样,使分析更易于管理。应遵循以下步骤:
4. 探索性数据分析,以准备数据 是时候通过定义用于数据转换、清理、特征选择/设计和缩放的函数来执行前一步的发现了。
最好的做法是让项目的每一部分都经过检查。正如阿图·葛文德在其《清单革命》(The Checklist Manifesto)中所说:“我们所知事物的数量和其复杂性已经超过了我们能正确、安全、可靠地传达其优点的能力范畴。” 所以,看看这个简洁明了的项目任务表,它将帮你减少工作量,提高产出! 机器学习项目清单 在几乎每个机器学习项目中都必须执行8-10个步骤,其中一些步骤可以按顺序交替执行。 1. 从高层次的角度定义问题 为了理解和阐明问题的业务逻辑,任务表应该告知:
2. 识别数据源并获取数据 在大多数情况下,如果拥有数据,并且希望定义相关问题以更好地利用传入的数据,可以在第一步之前执行此步骤。 基于问题的定义,我们需要确定数据的来源,可以是数据库、数据存储库、传感器等。对于要在生产中部署的应用程序,需通过开发数据管道来自动执行此步骤,以保持传入数据流入系统。
(编辑:桂林站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |

