目前已有的资料采掘工具,例如Weka[4]、SPSS、SQL Server等,为用户分析提供了一个友好的界面,但是,这些方法都不适用于大规模的数据分析。同时使用这些工具时,用户很难添加新的算法程序。为了解决现有工具和产品在大数据挖掘中的局限性,WIMI微美全息(NASDAQ:WIMI)开发了一个新的平台——基于数据挖掘算法分析的人工智能信息管理平台,并取得了软件著作权。这是一个用户友好并支持在分布式环境中进行高效率计算和快速集成的数据挖掘系统,该平台支持数据分析人员快速、有效地进行数据挖掘任务。
WIMI微美全息(NASDAQ:WIMI)研发的基于数据挖掘算法分析的人工智能信息管理平台,采用人工智能、机器学习和深度学习技术,从海量的数据中提取隐藏的、先前未知的、具有潜在价值的信息。它的主要目标是从大量的数据源中抽取出超集的信息,并将其融合,以揭示其深层结构和内部联系。将信息建立于分布式异构环境之上,可以大大减少不同物理环境给构建数据分析任务带来的复杂度,充分利用分布式计算的能力提升数据分析的效率。另外,平台的计算资源是可动态增减的,使其具备根据具体分析任务数量进行在线调整计算物理资源的能力。最后,友好的用户接口为基于平台构建不同的大数据挖掘
应用提供了极大的便捷。
WIMI微美全息的该平台利用遗传算法,粗集方法,决策树方法和神经网络方法,将数据挖掘的一般步骤分为:分析问题:确定源数据库是否符合数据挖掘标准;对数据进行提取、清理和验证,去除数据中的噪声,获得数据完整、格式统一的数据;创建和调试模型:将选用的数据挖掘算法应用到数据中创建模型,通过数据来对模型进行校验和调整,以获得满足使用要求的数据模型;维护数据挖掘模型:随着数据量的增加,一些关键信息的改变有可能严重模型的精度,需对模型进行调整和维护,严重模型的准确性和模型维护是数据挖掘的重要环节。通过模型维护可以保持模型的活力,不断改进模型。
随着大数据时代的来临,各行各业所积累的数据呈爆炸式增长,数据挖掘在各个领域的需求将会越来越强烈,与各个专业领域的结合也将会越来越广泛。无论是在科学领域还是工程领域、理论研究还是现实生活中,WIMI微美全息的基于数据挖掘算法分析的人工智能信息管理平台将有着极为广阔的发展前景。