TechTarget数据库 > 百科词汇

data profiling:数据剖析

数据剖析(data profiling)也叫做数据考古(data archeology),是数据集(data set)内部为达一致性、单值性和逻辑性而进行的数值质量的统计分析及评估。

  数据剖析(data profiling)分析出来的内容可用来确定为其它目的使用现有数据时有多难。它还可用来提供评估数据质量(data quality)的度量并确定元数据是否精确地描述了源数据里的实际值。数据剖析过程不能识别精确的数据,它只能识别业务规则(business rule)违反行为或异常现象。

  剖析工具通过探测数据集里及之间收集数据值间存在的关系来评估数据的实际内容、结构和质量(quality)。举例来说,通过检查表(table)中每一列不同值的频次分布,分析员可以洞悉每一列的类型和运用。跨列分析可用于公开嵌入值依赖,表内分析让分析员发现代表实体间外关键字(foreign key)关系的重叠值集。

  另见:数据建模(data modeling)、数据字典(data dictionary

最近更新时间:2011-02-24 翻译:徐艳EN

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。