设为首页 收藏本站
查看: 674|回复: 0

[经验分享] Oracle 表和索引的设计

[复制链接]

尚未签到

发表于 2016-8-2 20:27:13 | 显示全部楼层 |阅读模式
表设计, 是灵活扩展性及性能之间的一个折中。 为了达到灵活扩展以及将来不可预知的加载问题, 那么表设计就应该跟模型设计一样, 能够被演化到第三方的标准形式, 当然, 用户为了核心的业务性能需求, 可以选择性的忽略这点 。

        这些技术的例子有很多, 例如storing tables pre-joined,the addition of derived columns, and aggregate values。 Oracle提供了许多方法存储aggregates and pre-joined数据通过clustering and materialized view功能。这些特性应该在一个表的简单设计中采用。
     
      同样, 我们应该主意关注那些核心的业务表, 这样能够更有效的达到性能要求, 当然, 如果那些非核心表引起了性能瓶颈的话, 因该立刻去修改它们。

     索引的设计, 是一个大的迭代过程, 它基于应用中SQL的产生。 当然, 我们首先应该对那些有主键限制, 以及肯定经常被用得的字段敏感。 比如姓名之类的。随着开发和真是数据测试的进展, 一些确定的查询语句有性能提高要求时, 建立一个更好的index是一个好的方案。  下面列出重建索引时 , 应该考虑的设计方案。

  

  • Appending Columns to an Index or Using Index-Organized Tables
  • Using a Different Index Type
  • Finding the Cost of an Index
  • Serializing within Indexes
  • Ordering Columns in an Index


Appending Columns to an Index or Using Index-Organized Tables
从执行计划中, 提高查询速度的一个最简单的方法就是减少表的访问 (减少逻辑I/O), 这个可能通过给查询中的column加上索引。 这些columns是在select 对象column, 以及任何需要join和排序的columns. 这个方案,对那些在线及时反映的系统来说特别有用, 因为减少了 I/O的时间。  这个方案, 应该在系统有适当数据, 第一次测试时采用。

对这个技术, 非常多的一种形式是建立一个 index-organized table (IOT)。 但是, 你必须注意, 在IOT中不断增长的leaf, 并不会消弱减少I/O的目标。

Using a Different Index Type
有很多的索引类型, 不同的类型有不用的适用场景。 下面, 介绍下不同 索引的性能特点。

1. B-Tree Indexes
这是标准的索引类型, 非常适合主键和highly-selective (值分布广泛)索引,B树索引可用于获取那些被索引排序过的数据。

2. Bitmap Indexes  

位图索引适合值分布小的数据 (例如性别), 通过压缩技术, 用最小的I/O可以生成大量的rowids (能够定位到数据的location). 在non-selective的column上联合位图索引, 可以有效地使用AND 和OR操作 (最小的I/O读取大量的rowid)。 对于使用count()的查询, 位图索引也能加快速度, 因为查询能够在索引中获得。


3.Function-based Indexes

       这些索引, allow通过B树索引, 从数据库中经过函数获取数据。 对于使用nulls, 函数索引有一些限制, 而且需要查询优化器开启。
       函数索引, 对于在composite columns上的查询, 特别有效率。比如 (销售价格 - 折扣) x 数量。 销售价格 , 折扣,  数量都是数据库中的列。 另外一个例子就是UPPER 函数。

4. Partitioned Indexes
Partitioning a global index allows partition pruning to take place within an index access, which results in reduced I/Os. By definition of good range or list partitioning, fast index scans of the correct index partitions can result in very fast query times.

5. Reverse Key Indexes
这个索引的设计是为了降低不断插入的应用中的索引污点。 对于插入的性能, 这种索引是很卓越的。但是, 它不能用于index range scans。

查找索引的Cost
创建和维护索引结构, 是会非常高价的。 它会消耗磁盘空间, CPU, 以及 I/O。 设计者必须要确定索引的好处超过缺点。

使用这么一个简单的法则去判断维护一个索引的cost:
每个维护的索引, 在insert, update, delete上的时间消耗, 差不多是实际DML语句的三倍。这个意思就是说, 如果你插入一个有三个索引的表, 它所消耗的时间, 大约是没有索引的10倍。 对于DML, 特别是插入频繁的应用, 索引的建立需要慎重。需要在查询和插入之间有个折中。
      

Serializing within Indexes
Use of sequences, or timestamps, to generate key values that are indexed themselves can lead to database hotspot problems, which affect response time and throughput. 这是由于,线形增长的key能导致一个right-growing index。为了避免这个问题, try to generate keys that insert over the full range of the index. This results in a well-balanced index that is more scalable and space efficient. You can achieve this by using a reverse key index or using a cycling sequence to prefix and sequence values.

Ordering Columns in an Index

在创建索引时, 设计者需要灵活的在上面创建规则。 这需要看应用环境, 可以使用下面两种方法去对索引的列排序。

  • 把频繁查询的列放在前面。 这个方法, 在大部分时候都适用。 因为它能够使最小的I/O(访问真是的rowid)提供最快的访问速度。这个技术主要用在主键和大量的扫描查询。
  • 通过clustering 和排序, 减少I/O。 在大范围的扫描时, I/Os can usually be reduced by ordering the columns in the least selective order, or in a manner that sorts the data in the way it should be retrieved.详情参考:http://download.oracle.com/docs/cd/B19306_01/server.102/b14211/data_acc.htm#g27061


使用视图
视图可以加快和简化应用设计。 一个简单的视图, 对于那些主要就是涉及查询, 显示, 收集和存储得开发人员, 可以掩饰复杂的数据模型。

但是, 在视图提供一个clean 编程接口的同时, 能够导致非优化, resource-intensive的查询。 一个worst type使用view , 就是当一个视图引用另外一个视图, 且用在查询的join中。 在大多数情况下, 开发人员之间使用数据库表查询就可以了, 因为视图的内在特性, 它是优化器很难选定一个最优的执行计划。

SQL执行效率
在任何系统开发的设计和架构中, 应该是开发人员关注SQL的执行效率。 为了实现这个, 开发环境需要支持下面的特点:
#


  • 优秀的连接管理连接数据库, 是一个expensive且 highly unscalable 操作。  因此, 应该尽可能的减少并发的数据库连接。一个简单的应用中, 用户在系统初始化时候连接是比较理想的。 但是, 在一个基于web或者多层的应用中, 设计者应该使用数据库连接池且并不为每个用户重新建立连接。
  • 好的Cursor 使用和管理SQL的执行有很多步骤, 包括语义分析, 安全检查,生成执行计划以及加载共享的结构到shared pool。 其中,解析有硬解析和软解析。
    硬解析: SQL在首次提交的时候, 在shared pool中不能被匹配。 Hard parses are the most resource-intensive and unscalable, because they perform all the operations involved in a parse.

    软解析: SQL 在首次提交, 但在shared pool中能被匹配。 这个匹配的(前面用户执行的结果)内容就作为结果。SQL 被共享能提高性能。 但软解析不是理想的。 因为还是需要语义和安全检查。

    所以,解析应该尽可能的简化。 开发者应该设计SQL解析一次, 多次使用。 这通过cursors完成。  有经验的开发者, 应该非常首先重开和重执行cursors的概念。

    开发者, 应该使SQL在共享池中。 为了达到这目的, 在查询中, 使用变量邦定可以实现这功能。例如:  
    Statement with bind variables:

    SELECT * FROM employees
      WHERE last_name LIKE :1;


运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-252163-1-1.html 上篇帖子: Oracle数据迁移到Sybase数据库 下篇帖子: oracle中函数的介绍及使用
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表