data preprocessing:数据预处理
数据预处理(data preprocessing)形容任意一种对生数据进行处理,用来为另一处理过程做准备的处理类型。通常作为初步的数据挖掘实践方案,数据预处理可根据用户需求将数据转换为一种更加容易并有效处理的格式——例如,在神经网络中。有一些不同的工具和方法可以用来进行预处理,其中包括采样——从大量的数据中选择有代表性的子集;转换——对生数据进行操作,用来产生单一输入;降噪——删除数据噪音;标准化——组织数据,使其能够被更有效地访问;重要内容摘要——提出某些对某些特定环境重要的特定的数据。 在客户关系管理(CRM)环境中,数据预处理是网络挖掘的一个组件。网络使用日志可以被预处理,以便于提取有意义的数据集,这个数据集被称为用户事务,由一组组的URL介绍组成。也可以检索用户会话来辨认用户身份,网络站点请求,以及他们的订单,还有他们在每个站点上访问的时间。一旦这些被从生数据中提取出来,它们会带来能够猜测用户目的的更为有用的信息,包括顾客调查、市场销售,或个性化定制等。
最近更新时间:2009-03-02 EN