设为首页 收藏本站
查看: 569|回复: 0

[经验分享] 在SQL Server 2005中用存储过程实现搜索功能

[复制链接]

尚未签到

发表于 2015-7-1 05:50:14 | 显示全部楼层 |阅读模式
现在很多网站都提供了站内的搜索功能,有的很简单在SQL语句里加一个条件如:where names like ‘%words%’就可以实现最基本的搜索了。

   我们来看看功能强大一点,复杂一点的搜索是如何实现的(在SQL SERVER200/2005通过存储过程实现搜索算法)。

   我们把用户的搜索可以分为以下两种:
   1.精确搜索,就是把用户输入的各个词语当成一个整体,不分割搜索.
   2.像百度,GOOGLE一样的,按空格把输入的每一个词分离,只要包含这些词语,而不管出现的顺序,称为ALL-Word Search.
   3.对输入的词只要有一个出现就为匹配 称为Any-Word Search


一、对搜索结果进行排序的算法
   在前面提到的LIKE语句最大的问题就是搜索的结果是没有经过排序的,我们不知道结果出现在的顺序是如何的,因为它是随机的。像百度,GOOGLE都会对结果用算法进行排序再显示的.好我们也来建立一个简单的排序法。一个很常见的算法是计算关键词在被搜索内容中出现的次数,次数最多的排在结果的第一位。我们的是在存储过程中实现这个算法的,而在SQLSERVER中没有提供计算关键词在被搜索内容中出现的次数这样的函数,我们要自己写一个UDF(User-Defined Functions),UDF是SQLSERVER的内部函数,可以被存储过程调用或者被其他UDF调用。函数如下:


  

1 DSC0000.gif CREATE FUNCTION dbo.WordCount
2
3(@Word VARCHAR(15),
4
5@Phrase VARCHAR(1000))
6
7RETURNS SMALLINT
8
9AS
10
11BEGIN
12
13 DSC0001.gif DSC0002.gif /**//* 如果@Word 或者@Phrase 为空返回 0 */
14
15IF @Word IS NULL OR @Phrase IS NULL RETURN 0
16
17/**//* @BiggerWord 比@Word长一个字符 */
18
19DECLARE @BiggerWord VARCHAR(21)
20
21SELECT @BiggerWord = @Word + 'x'
22
23/**//*在 @Phrase用@BiggerWord替换@Word */
24
25DECLARE @BiggerPhrase VARCHAR(2000)
26
27SELECT @BiggerPhrase = REPLACE (@Phrase, @Word, @BiggerWord)
28
29/**//* 相减结果就是出现的次数了 */
30
31RETURN LEN(@BiggerPhrase) - LEN(@Phrase)
32
33END
34
以上就是整个UDF,它用了一个很高效的方法来计算关键词出现的次数。

二、参数传递
用户输入的关键词从一个到多个不等,我们可以把参数固定为@word1~@word5,这样比较方面实现。当用户输入超过5个时,忽略不计,少于5个的地方视为空。其实GOOGLE也是这样做的,只是GOOGLE的最大词语限制是10个。


三、搜索的实现过程


假定我们对Product表进行搜索,Product字段有:Id,Name ,Descripton(产品描述),搜索要同时对Name 和 Description进行。
Any-World Search实现如下:




1SELECT Product.Name,
2       3 * WordCount(@Word1, Name) + WordCount(@Word1, Description) +
3
4       3 * WordCount(@Word2, Name) + WordCount(@Word2, Description) +
5
6       DSC0003.gif
7
8       AS Rank
9FROM Product
10
11
这里对Name赋予权重为3,Description为1(大家根据实际情况赋予不同的权重),Rank是计算列,通过前面定义的UDF计算所关键词出现的次数乘上权重等到的。


同样的All-Word Search实现如下:


  

1SELECT Product.Name,
2
3       (3 * WordCount(@Word1, Name) + WordCount(@Word1, Description)) *
4
5       CASE
6
7          WHEN @Word2 IS NULL THEN 1
8
9            ELSE 3 * WordCount(@Word2, Name) + WordCount(@Word2, Description)
10
11       END *
12
13      
14
15       AS Rank
16
17FROM Product
18
    这时把每个关键词出现的次数相乘只要一个没出现RANK就为0,为0就是搜索结果为空。
还可以这样实现:




1SELECT Product.Name,
2       CASE
3         WHEN @Word1 IS NULL THEN 0
4         ELSE ISNULL(NULLIF(dbo.WordCount(@Word1, Name + ' ' + Description), 0), -1000)
5       END +
6       CASE
7         WHEN @Word2 IS NULL THEN 0
8         ELSE ISNULL(NULLIF(dbo.WordCount(@Word2, Name + ' ' + Description), 0), -1000)
9       END +
10      
11       AS Rank
12FROM Product对没出现的关键词赋值-1000,这样Rank就肯定为负数,负数表示搜索结果为空。


四、对结果进行分页
搜索的结果可能很多,对结果分页可以提高性能。我在如何在数据层分页以提高性能已经说明了如何用存储过程进行分页了,这里就不在详细复述了。
过程简单来说就是创建一个临时表,表中包含行号,读取时按行号来读取数据


五、完整代码
     经过前面的分析,完整代码如下:




  1CREATE PROCEDURE SearchCatalog
  2(      
  3 @PageNumber TINYINT,
  4 @ProductsPerPage TINYINT,
  5 @HowManyResults SMALLINT OUTPUT,
  6 @AllWords BIT,
  7 @Word1 VARCHAR(15) = NULL,
  8 @Word2 VARCHAR(15) = NULL,
  9 @Word3 VARCHAR(15) = NULL,
10 @Word4 VARCHAR(15) = NULL,
11 @Word5 VARCHAR(15) = NULL)
12AS
13/**//* 创建临时表,保存搜索的结果(Sql Server2005适用,Sql Server2000见如何在数据层分页以提高性能) */
14DECLARE @Products TABLE
15(RowNumber SMALLINT IDENTITY (1,1) NOT NULL,
16 ID INT,
17 Name VARCHAR(50),
18 Description VARCHAR(1000),
19Rank INT)
20
21/**//* Any-words search */
22IF @AllWords = 0
23   INSERT INTO @Products           
24   SELECT ID, Name, Description,
25        3 * dbo.WordCount(@Word1, Name) + dbo.WordCount(@Word1, Description) +
26
27        3 * dbo.WordCount(@Word2, Name) + dbo.WordCount(@Word2, Description) +
28
29        3 * dbo.WordCount(@Word3, Name) + dbo.WordCount(@Word3, Description) +
30
31        3 * dbo.WordCount(@Word4, Name) + dbo.WordCount(@Word4, Description) +
32
33        3 * dbo.WordCount(@Word5, Name) + dbo.WordCount(@Word5, Description)
34
35          AS Rank
36
37   FROM Product
38   ORDER BY Rank DESC
39
40/**//* all-words search */
41
42IF @AllWords = 1
43
44   INSERT INTO @Products           
45
46   SELECT ID, Name, Description,
47
48          (3 * dbo.WordCount(@Word1, Name) + dbo.WordCount
49
50(@Word1, Description)) *
51
52          CASE
53
54           WHEN @Word2 IS NULL THEN 1
55
56           ELSE 3 * dbo.WordCount(@Word2, Name) + dbo.WordCount(@Word2,
57
58Description)
59
60          END *
61
62          CASE
63
64           WHEN @Word3 IS NULL THEN 1
65
66           ELSE 3 * dbo.WordCount(@Word3, Name) + dbo.WordCount(@Word3,
67
68Description)
69
70          END *
71
72          CASE
73
74           WHEN @Word4 IS NULL THEN 1
75
76           ELSE 3 * dbo.WordCount(@Word4, Name) + dbo.WordCount(@Word4,
77
78Description)
79
80          END *
81
82          CASE
83
84           WHEN @Word5 IS NULL THEN 1
85
86           ELSE 3 * dbo.WordCount(@Word5, Name) + dbo.WordCount(@Word5,
87
88Description)
89
90          END
91
92          AS Rank
93
94   FROM Product
95
96   ORDER BY Rank DESC
97
98/**//* 在外部变量保存搜索结果数 */
99
100SELECT @HowManyResults = COUNT(*)
101
102FROM @Products
103
104WHERE Rank > 0
105
106/**//* 按页返回结果*/
107
108SELECT ProductID, Name, Description, Price, Image1FileName,
109
110 Image2FileName, Rank
111
112FROM @Products
113
114WHERE Rank > 0
115
116  AND RowNumber BETWEEN (@PageNumber-1) * @ProductsPerPage + 1
117
118                    AND @PageNumber * @ProductsPerPage
119ORDER BY Rank DESC
至此一个简单的搜索算法就实现了。

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-82055-1-1.html 上篇帖子: SQL Server 2008 R2 中英文 开发版/企业版/标准版 链接地址 下篇帖子: sql server 复制,镜像,日志传输及故障转移集群区别
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表