[ 来源: | 作者: | 时间:2007-07-21 | 收藏 | 推荐 ] 【大 中 小】
#e#
Sybase的数据仓库方法从根本上就不同于其他的关系型数据库提供商。Sybase认为,传统的关系型方法以及ROLAP方法效率很低,要想获得足够的性能,必须通过高额的成本,在额外的硬件、软件、资源、钱、时间上进行大量投资,否则不可能达到。因此,Sybase已经开发了一个新的逆向关系型数据库——它是基于列的,而非基于行的。
Sybase IQ与传统数据库在数据压缩方面的典型对比 免费资源www.it55.com
我们开始审视Sybase IQ时发现,Sybase对其使用列方法的好处所做的论述相当令人信服。然而,通过对数据仓库不断增加需求、迅猛增长的来自Web的数据与用户所带来的分析和报表(更不必提即将到来的RFID应用),以及客户的经验等等,我们现在可以证明,Sybase IQ提供了一个远比那些传统的关系型数据库供应商更优越的方法。下面,就让我们一起看看Sybase IQ在列存储、数据压缩、索引等技术方面的革命性创举。
列存储 it55.com
不同于传统的关系型数据库其数据在表中是按行存储的,Sybase IQ是通过表中的列来存储与访问数据的。尽管这种方式很明显的不太适合于交易环境,在交易环境中,一个事务与一行数据有效对应,而在查询进程环境中,很显然,查询是基于特定的列来选择的。 vd;k;l www.it55.com rdfg
列方式所带来的重要好处之一就是,由于查询中的选择规则是通过列来定义的,因此整个数据库是自动索引化的。事实上,情况并不像上述的这样简单,Sybase IQ有各种方法支持基于列的索引,我们将在下面就此讨论。 sflj www.it55.com kg^&fgd
使用列方法的另一个结果就是,Sybase IQ在压缩方面比传统的关系型数据库更加有效(据Sybase所称,效果可提高5倍之多)。这个原因,无消说,是由于同一列中的所有数据域有相同的数据类型。因此,每一列都可以为优化的效率与检索进行压缩。相比来讲,基于行的存储,各个不同的域拥有各不相同的数据类型,这非常适合于交易进程。在这样的环境中,不断变换理想的压缩算法是不可行的,这意味着任何压缩都将可能是一种最低通用的规则。
基于列的方法的另一个重要优势是完全基于所有读出的数据量。无论何时你从传统的数据库中访问数据,需要读出完整的每一行,而不管你实际所感兴趣的是哪些域。实际上,这可能意味着读300个字节的数据仅仅检索20个字符的数据。但是,基于列来读取数据,你仅仅需要读出你想要了解的数据。当然,读取一条单独的记录时,性能上的不同可以忽略,但是许多查询需要进行全表扫描。当读取数百万行数据时,性能的不同就会非常显著。
(编辑:IT资讯之家 www.it55.com)