|
1. 合成索引(Synthetic Index)
合成索引就是根据具体的来生成hash值,查找的时候通过hash值来查找就可以了。像blob、text这种数据直接放在where条件中查询效率是非常低的,所以可以使用合成索引。由于索引是hashcode,所以合成索引只能用于精确查询,对'<'、'>'等范围查找是没有作用的。我们可以使用MD5()、SHA1()或者CRC32()来生成索引,也可以在Java等编程语言中生成。如果生成的hash字符串尾部有空格,就不能存入char类型字段里,因为char会去掉尾部空格。
1
2
3
4
5
6
7
| create table synthetic_test(
id int,
content text,
hash_index varchar(50)
);
insert into synthetic_test values (1, 'abcd', md5(content));
|
这个时候我们就可以直接使用下面的SQL来查询:
1
| select * from synthetic_test where hash_index = MD5('abcd');
|
2. 前缀索引(Prefix Index)
如果我们想对text或者blob进行模糊查找,我们可以使用前缀索引。先来看例子:
1
2
3
4
5
6
7
| create table prefix_test(
id int,
content text
);
insert into prefix_test values (1, repeat('A', 50));
insert into prefix_test values (2, repeat('B', 50));
insert into prefix_test values (3, repeat('C', 50));
|
从上面可以看出,type=ALL,表名该表并未使用索引,所以查询时是效率最差的全表扫描。下面我来建立索引:
1
| create index prefix_index on prefix_test (content(50));
|
上面的50表示prefix length,表示要以content内容的前多少位为标准建立索引。到底设置多少合适,这里就涉及到一个“索引选择性”的概念,不明白的可以参考这篇文章:http://www.cnblogs.com/snake-hand/archive/2008/04/22/2452384.html
再次select的时候,就使用了索引。但要注意:前缀索引只能匹配'XXX%'这种格式,'%XXX'是使用不到索引的。
|
|
|