数据挖掘(DATA Mining),是从大量的、不完全的、有噪声的、模糊的、随机的实际应用数据中,提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的过程。它是一门涉及数据库管理、人工智能、机器学习、模式识别及数据可视化等学科的边缘学科,揭示了存在于数据里的模式及数据间的关系,强调对大量观测到的数据库进行处理。用统计的观点看,数据挖掘可以看成是通过计算机对大量的复杂数据集进行的自动探索性分析。
数据挖掘的第一步是描述数据计算统计变量,比如平均值、均方差等,再用图表或图片直观地表示出来;第二步是用历史数据建立一个预测模型,然后再用另外一些数据对这个模型进行测试;最后一步是验证预测模型。通过对预测模型进行实际数据和环境的实践验证,达到服务企业决策的目的。与传统数据分析的本质区别在于,数据挖掘是在没有明确假设的前提下去挖掘信息、发现知识。因此,数据挖掘所得到的信息应具有先前未知、有效和可实用三个特征。
案例展示:智慧公交调度平台 海融智慧公交整体解决方案通过GPS/北斗卫星定位技术、4G/5G无线网络通信技术、GIS地理信息技术、以及大数据储存等多种技术融合,全面推动城市、农村公共交通管理现代化、安全监管规范化、运营调度智能化、决策支持科学化、信息服务一体化,从而提高公共交通运输企业服务管理水平,提升公共交通吸引力,让公众出行更便捷安全、绿色环保。