解读Teradata数据仓库地理空间解决方案

日期: 2011-08-08 作者:Teradata 来源:TechTarget中国

  长期以来,商务智能主要关注解决”谁、什么、为什么以及怎样”之类的问题,业务分析员很少能使用地理空间信息支持他们的工作。然而,业务数据中包含了很多地理空间相关的元素,例如地址、天气数据、电话号码以及邮政编码等。然而,把地理空间数据和业务数据进行整合和分析一直是非常困难的。幸运的是,最近技术上的突破已经允许用户使用地理空间信息支持一种全新的数据分析方式:地理空间信息智能。

  地理空间信息助力商务智能

  最基本的地理空间信息是“位置点”,一个位置点一般使用经度和纬度来表示。在复杂的场景中,一个位置点不仅包括经纬度,还包括高度。多个位置点就可以用来表达线、多边形甚至立方体。.在很多情况下,地理空间信息已经在数据库系统中,只是存在的格式很难用来进行量化的分析,例如,数据分析人员无法通过邮寄地址计算出距离。通过一些简单的技术手段,这些数据可以被转换成可度量的地理空间信息“位置点”。决策者然后能根据这些信息做出更好的选择,以及发现更多的机遇。地理空间信息为商务智能带来了大量的新的可能性:

  > 通过整合地理空间信息和业务数据,企业可以创建交互式地图,允许用户钻取任何地点的详细信息

  > 分析员能了解分支机构的业绩与周边消费者特征(年龄、性别、收入、家庭组成等)的关系和趋势

  > 零售企业能发现门店的销售额与周边人口数量以及竞争对手的关系

  > 快速消费品企业能够确认投诉用户的地点,当需要召回缺陷产品时,能够快速执行并建立跟踪机制

  > 销售代表能根据目标客户的地理分布决定最佳的客户拜访计划

  > 航运业管理者能根据港口的地理位置以及运输货物信息决定最佳的航运计划和路线

  地理空间信息和数据仓库

  在一些行业,使用地理空间信息做出业务决策并不是新事物。速递公司、石油公司以及政府部门已近使用相关的地理信息技术十多年了。拥有深厚技术和业务背景的分析员使用地理空间数据库、第三方调查统计数据以及特殊的地理信息系统软件(GIS)规划最优的运输线路、放置新的输电线路以及决定钻探的位置等。

  然而,这些传统的地理信息系统主要是特定部门定制的应用,运行在专用的服务器上,满足特殊的业务需求,同时对用户的要求很高。从技术角度来看,这些特殊的地理信息系统本质上就是专用的电子地图,它们的功能逐渐被基于互联网技术的通用电子地图应用所取代,例如“谷歌地球”。

  随着地理空间信息使用的增长,企业正在重新评估他们使用地理空间信息的方式。今天最新的平台和技术,已经允许企业在可接受成本的范围内把地理空间信息集成到大多数标准的商务智能架构中。用户友好的接口屏蔽了地理信息系统的复杂性。更重要的是,地理空间信息被整合到其他系统中。

  同时,业务用户正逐渐熟悉地理空间技术。随着通用的地理地图应用以及车载或基于移动电话的全球定位系统使用的普及,业务用户开始习惯从地理空间的角度考虑和分析数据。

  作为这些趋势的结果,企业逐步开始把各个部门的、孤立的、专用的地理信息系统中的数据迁移到企业级数据仓库及商务智能工具中。用户几乎不需要数学或统计方面的培训就可以通过友好的用户接口访问及分析地理空间信息;数据仓库内的跨部门的业务数据和地理空间信息的整合满足了企业级的地理空间信息分析需求;数据仓库的强大的数据库内分析功能为用户提供快速、精准的地理空间数据处理分析服务,避免了建立专用的分析平台的需求。

  机遇和挑战

  企业应尽早的使用地理空间信息智能,以保持在业界的竞争性。研究表明,早期的使用者通过使用地理空间信息智能,帮助企业节省成本、更快更有效的做出决策、提升客户服务水品和满意度、降低风险以及提高运营效率。在一个保险公司的案例中,通过使用地理空间信息智能,该企业把风险评估应用的处理处理时间从三个小时缩短到五分钟。

  成功的实施地理空间信息智能面临很多挑战。其中最主要的挑战就是如何把地理空间信息智能融入企业整体的商务智能中。科技部门和业务部门都不熟悉地理空间信息,不知道如何把地理空间信息和其他业务数据进行整合,也不清楚如何使用地理空间信息进行数据分析。幸运的是,一些数据仓库/商务智能厂商开始提供相关的解决方案,帮助用户实施和使用地理空间信息智能,最终促使用户对业务和数据有深入的理解,并使用这些数据和技术自助做出分析和决策。

  Teradata地理空间解决方案

  Teradata公司作为世界上领先的数据仓库厂商,近期正式推出了基于Teradata数据库系统的地理空间解决方案。Teradata地理空间解决方案由新的空间数据类型及相关的空间函数、主流的地理空间数据格式的导入导出工具,以及第三方的地理空间信息展现工具共同组成。Teradata地理空间解决方案完全兼容国际标准化组织定义的SQL多媒体及应用包中的地理空间标准(SQL/MM Spatial),并且针对Teradata数据库进行优化,为用户提供最好的数据库内分析性能。

  地理空间数据类型

  新的地理空间数据类型“ST_GEOMETRY”表达了所有在SQL/MM Spatial标准中定义的空间数据类型,包括点、线、曲线、折线、多边形等。在数据库内部,所有ST_GEOMETRY类型的数据使用基于二进制的WKB格式存储,而在数据库外部,采用基于文本的WKT格式来表示。

  大量的空间函数用来对地理空间数据进行计算和分析。空间函数同样遵照SQL/MM Spatial标准,按照功能分为四种类型:Attribute,Spatial,Topology intersection和Measurement。Attribute类型函数用于空间数据对象属性的读取和设置;Spatial类型函数用于计算空间数据对象之间的距离、交集、合集、边界等;Topology intersection类型函数判断空间数据对象之间的关系,是否包含、是否交界等;Measurement类型函数计算空间对象的周长、面积、半径等。

  Teradata在ST_GEOMETRY空间数据类型的基础上进行扩展,定义了新的空间数据类型Geosequence。Geosequence的主要的特性是增加了时间属性,能用来计算物体运行的轨迹及速度。

  地理空间数据导入

  Teradata数据库中的地理空间信息需要从其他专用系统导入或从第三方数据提供商购买。如果地理空间信息是以通用的WKT或WKB格式提供,可以使用Teradata SQL或TPump工具导入到数据库中。另外,Teradata公司提供新的工具TDGeoImport,这种工具可以把其他通用格式的地理空间信息转换为WKB格式,并导入到Teradata数据库中。当前Teradata支持主流的开源组织或专业厂商的地理空间信息格式,包括OpenGIS的WKB/WKT、ERSI的ShapeFile、MapInfo的TAB以及美国测绘局的TIGER /Line格式。

  地理空间数据分析

  商务智能应用可以使用Teradata SQL的空间函数分析地理空间信息及相关的其他业务信息。即使应用不能自动生成相关的SQL语句,手工编写的SQL也能为常用的报表、仪表盘等提供地理空间智能,或者为复杂的地理空间分析需求提供答案。

  许多Teradata合作伙伴的产品允许用户或开发人员在查询中嵌入手工编写的SQL。Teradata合作伙伴Tableau软件在最近发布的一篇文章中详细描述了如何使用手工编写的SQL来完成地理空间分析的方式。文章中的案例包括在仪表盘应用中计算距离及其他一些空间数值。随着用户兴趣的增长,我们期望更多的商务智能工具或应用将提供自动化地理空间相关SQL生成的功能。

  行业案例分析

  已经有很多企业把地理空间信息集成到他们的企业级数据仓库中,并开始实施一些全新的数据分析引用。以下是一些不同行业的案例分析。

  保险行业

  保险公司高度依赖预测分析和风险评估。数据仓库中的地理空间信息为保险行业开启了一面全新的数据分析窗口:

  > 快速的分析并确认在高风险区域的客户的数量及购买的保险的种类,允许保险公司及时采取措施规避或减少风险。

  > 分析各个区域的地质信息、天气信息、建筑结构、历史赔付记录以及不同自然灾害(洪水、飓风、火灾、地震等)的发生情况,最终制定不同区域不同险种的保险政策和价格。

  如下图所示,气象部门预测有飓风会经过某一区域,并绘制出路线图(深红线),以及可能的影响区域(淡红色区域),虽然保险分析人员能从这张图上很直观的理解飓风的影响范围,但是并不能知道有多少客户在这个区域内,因此不能做出业务决策。

  利用Teradata的地理空间信息技术,分析人员能够通过简单的SQL就可以回答以下的问题:

  > 在飓风的途径范围有哪些客户及联系方式

  > 每个受影响的客户的保险代理人及联系方式

  > 预计受影响的程度及损失的程度

  SELECT (C.id, C.name, C.policy, C.Contact)

  FROM Insurance_Customers C, Regions R

  WHERE R.id = 5

  AND C.location.ST_Within(R.geometry) = 1;

  查询的结果如下:

  零售行业

  零售企业已经了解到分析客户信息及购买行为的价值,并实际运用到商务智能中。而结合地理空间信息,能帮助企业回答那些以前无法解决的问题,包括“客户住在哪里?哪些服务和产品能吸引那些住在较远区域的客户?”以及“新的竞争对手的零售门店开业可能会导致本区域哪些高价值客户流失?”等问题。

  如下图所示,企业使用地理空间信息能提升整体的竞争性和盈利水平:

  > 精确的分析不同区域内的客户数量、分布、消费习惯,设置合理的产品价格和库存量

  > 合理的规划免费班车路线及投递服务区域,用最少的资源服务最大的、最有价值的客户群体

  > 精确的预测竞争对手带来的影响,提升整体市场营销活动的成功率

  金融行业

  零售银行一直持续的努力在减少运营成本的同时为用户提供更好的服务。地理空间信息分析能够帮助银行达到这些目标,主要的方式包括:

  > 针对自助柜员机的使用情况及周边用户分布,决定自助柜员机的分布的位置及数量,确保在方便用户使用的同时,减少不必要的资源浪费

  > 执行中小企业贷款密度分析时,确保银行不会在同一个市场或商场内投放太多的贷款给商户;主要的原因是当一个商户经营失败时,往往会对周边的商户的运营有负面的影响,因此可能会对银行带来更多的风险

  > 当开设新的网点时,确保网点的位置能吸引和保留高端的客户;分析的内容包括区域内客户的分布以及竞争对手的位置分析等

我们一直都在努力坚持原创.......请不要一声不吭,就悄悄拿走。

我原创,你原创,我们的内容世界才会更加精彩!

【所有原创内容版权均属TechTarget,欢迎大家转发分享。但未经授权,严禁任何媒体(平面媒体、网络媒体、自媒体等)以及微信公众号复制、转载、摘编或以其他方式进行使用。】

微信公众号

TechTarget微信公众号二维码

TechTarget

官方微博

TechTarget中国官方微博二维码

TechTarget中国

电子邮件地址不会被公开。 必填项已用*标注

敬请读者发表评论,本站保留删除与本文无关和不雅评论的权力。

作者

Teradata
Teradata

大数据分析服务供应商

相关推荐