|
全文检索提供了基于字符串、二进制数据的智能单词短语的搜索,使得非结构化数据的搜索更为灵活,而且全文检索的执行效率比普通的like查询好很多。在SQL Server2008中全文检索功能已经集成到了数据库中,全文目录不在单独存储在文件系统中,现在也集成在数据库中。
与普通的B树聚集索引、非聚集索引不同,全文索引是由文本数据的索引标记组成的压缩的索引结构。标记是SQL Server在索引过程中标识的单词或字符串。使用特殊的全文检索功能可以在字符模式上扩展单词或短语的搜索,并基于其他单词的变形词、同义词、通配符、近义词进行搜索。
一个全文目录属于一个数据库,一个数据库可以有多个全文目录。
--1.1附加数据库 exec sp_attach_db @dbname = 'AdventureWorks', @filename1 = 'c:\AdventureWorks_Data.mdf' --1.2由于这个数据库是2005版本的,而开发环境是2008,所以必须修改兼容级别> 基本搜索
--查询基于变形的,字面的,同义的匹配方式搜索全文列 --会返回要搜索文本中包含的单词以及单词的同义词,变形词(复数)的记录 SELECT DOCUMENT, DOCUMENTSUMMARY from production.Document WHERE FREETEXT (DOCUMENT, --带全文索引的列名 'change pedal'); --要搜索的文本 --以精确或模糊的单词和短语匹配,来搜索非结构化文本数据 --当搜索一个单词时,双引号不是必要的,只需要单引号 select * from production.Document where contains(DocumentSummary,'"replacing" OR "pedals"') 高级搜索与排名
--1.1使用通配符,*是一个或多个字符的通配符 select Document, DocumentSummary from Production.Document where contains(DocumentSummary,'"import*" or "re*"') --1.2相邻查询,near关键字 select Document, DocumentSummary from Production.Document where contains(DocumentSummary,'oil NEAR grease') --词oil与,grease和frequency两个词相邻 select Document, DocumentSummary from Production.Document where contains(DocumentSummary,'oil NEAR grease AND frequency') /*=================================================== 搜索变形形式的语法: FORMSOF( [inflectional | thesaurus],simple_term,... inflectional:指定要对指定的简单字词使用与语言相关的词干分析器 thesaurus:指定使用对应于列全文语言或指定的查询语言的同义词库 =====================================================*/ --1.3基于变形形式,搜索匹配搜索项的行 select DOCUMENT, DOCUMENTSUMMARY FROM Production.Document WHERE contains(DocumentSummary,'FORMSOF(inflectional,replace)') --1.4基于同义词(分类词汇汇编),搜索匹配搜索项的行 select DOCUMENT, DOCUMENTSUMMARY FROM Production.Document WHERE contains(DocumentSummary,'FORMSOF(thesaurus,replace,vital)') /*================================================== freetexttable与freetext相比,可以像表一样在from子句中引用, 而且可以用key来关联数据. freetexttable返回的结果集包含了key和rank两列: 1.key是定义在全文索引中的唯一键,主键,key只用于关联. 2.rank是一个行在结果集中正确性的评估值. =====================================================*/ --1.5根据含义返回排名搜索结果 select f.rank, Document, DocumentSummary from Production.Document d inner join freetexttable(Production.Document, --全文索引的表名 documentsummary, --索引列 'bicycle', --要搜索的字符串 LANGUAGE 'English', --指定语言 3)f --按照排名的top n匹配 on d.DocumentID = f.[KEY] --必须写成[key] ORDER BY RANK DESC /*=============================================== isabout为搜索项分配一个权值, 这个值用来影响搜索项在结果排名中的权值: ISABOUT(search_term [weight (值)]) 权值范围:0.0~1.0 =================================================*/ --1.6根据权值返回排名搜索结果 select f.rank, d.Document, d.DocumentSummary from Production.Document d inner join containstable(Production.Document, DocumentSummary, 'ISABOUT( bicycle weight(.9), seat weight(.1))' )f on d.DocumentID = f.[key] order by RANK desc --contains中也可以指定权值 select d.Document, d.DocumentSummary from Production.Document d where contains(DocumentSummary, 'ISABOUT( bicycle weight(.9), seat weight(.1))')
|
|