「美梦孵化器」为你定制真人版盗梦空间
|
人们通常将容器与虚拟机进行比较,尽管容器规模更小并且需要的开销更少。这两种应用程序可以采用相同的基础设施,这一点很诱人。实际上,容器与虚拟机有很大不同。如果目标是使基于容器的应用程序环境的价值最大化,那么了解这些差异如何影响IT基础设施设计是至关重要的。 容器与虚拟机之间的主要区别 与虚拟机不同,容器持续的时间是短暂的,它们会自动启动和关闭。但是像虚拟机一样,容器需要访问持久性存储,以在生产环境中发挥其全部潜力。如果没有持久性存储,则在容器关闭时数据会“死亡”。基于容器的应用程序的企业级存储基础设施必须提供功能强大的持久存储。但这只是一个开始,为了更好地发展,容器环境需要支持容器具有轻量、移动和短暂特性的存储生态系统。 容器相对于虚拟机的优势 企业在设计强调容器与虚拟机相比具有优势的存储生态系统时,首先要确定与虚拟机不同的容器的关键方面: (1) 容器轻量化意味着更大的移动性。容器是为移动性而设计的,这与可以移动但主要是为固定状态的虚拟机不同。因此,容器更有可能使用公共云服务进行部署,并在混合云和多云环境之间移动。 在ESG公司对基于容器的应用程序环境的研究中,70%的受访者表示,他们更喜欢将公共云和私有数据中心结合用于基于容器的应用程序。而在对支持容器环境的存储管理员的另一项调查中,超过三分之一的受访者表示,在混合云或多云环境中管理容器存储是他们与存储相关的最大挑战之一。对于虚拟机,有可能进出云平台。对于基于容器的环境具有这种移动性是人们所期望的。 (2) 容器的短暂特性要求具有更高的性能。与虚拟机相比,容器的另一个优点是它们的短暂特性。具有即时性的容器必须迅速运转起来,而传统的IT流程不能减慢短暂的、加速的应用程序环境。 例如,没有时间提交故障单让存储管理员人工配置卷。容器在大多数情况下必须自动配置大量资源:重构当今的许多应用程序可能会导致数百个(甚至数千个)微服务同时运行。支持的存储环境必须能够快速一致地处理对新存储资源的大量请求。
这一要求不仅提高了对使用容器的良好存储性能的需求,而且还意味着存储基础设施必须更好地交付数据服务,例如调配新的卷。在ESG公司进行的一项研究中,超过三分之一的支持容器环境的存储管理员认为,存储性能是他们与存储相关的最大的持久性难挑战之一,将近三分之一的存储管理员将存储资源调配的速度视为最大的挑战。 词频统计 词频统计即统计分词后文本的词频,目的是找出对文本影响最大的词汇,是文本挖掘的重要手段。统计这些词出现的频率可以帮助我们了解文章重点强调了什么,进而方便后续构建模型。
比如我们可以统计四大名著之一《红楼梦》中词频在前 28 的词语,结果如下: 现代企业的成功取决于以数据为中心的规划速度和效率。数据提供了一种战略优势,为开发人员提供正确的工具和数据对于满足业务需求至关重要。
因此,企业正在迅速认识到容器相对于虚拟机的优势,以实现ITOps和DevOps实践的现代化。在对IT存储管理员最近的一项调查中,Enterprise Storage Group(ESG)公司发现,41%的受访者表示将容器用于生产应用程序,另外33%的受访者表示将容器用于测试/开发活动。 停用词 我们人类在接受消息时,都会滤除无效信息,筛选有用信息。对于自然语言来说,去停用词是一种很明智的操作。 一篇文本,不管是中文还是英文,都有用来起连接作用的连词、虚词、语气词等无意义的词,比如「的」、「吧」、「但是」等等。这些词没有具体的含义,只是起到衔接句子以及增强语气的作用。这些词对文本分析也没有任何帮助,因此我们需要对分词后的数据做停用词处理。 但是我们应该谨慎决定该去除哪类停用词。
下图列出了一些常用的停用词表,你可以参照需求,选择要去除的停用词。 (编辑:桂林站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |



