设为首页 收藏本站
查看: 1055|回复: 0

[经验分享] SharePoint 2013 搜索——部署

[复制链接]
累计签到:4 天
连续签到:1 天
发表于 2015-9-24 08:55:13 | 显示全部楼层 |阅读模式
前言
  今年上半年就主要和微软的SharePoint打交道了,没想到我也有忙的不可开交的时候,时间过得真快。总的来说,我们希望对60,000,000个页面进行爬网和索引,从而提供搜索的功能。撇开具体的需求不说,第一步肯定是抓取数据。为了保证数据能够在较短的时间内抓取完毕,服务器场的部署和搜索拓扑规划是非常重要的。这篇文章也主要记录这个方面的内容,写这篇文章的目的主要是备忘(同时,由于接触部署时间不长,有错误的地方希望大家斧正)。

三层服务器场
  总体规划为三层服务器场,即WEB前端,应用程序(Application)和数据库。WEB层主要是通过IIS承载WEB站点,提供访问入口。Application层主要承载一系列的服务,其中包含我们所关心的搜索服务。数据层主要是数据库。每个层都可以实现容错和负载均衡。详细内容参考这里。但是这些方面不是我所关心的,如标题所言,我所关心的是SharePoint的搜索拓扑。

搜索拓扑
  SharePoint2013 整合了FAST Search产品,所以其搜索管理是独立的。从[管理中心]-[服务应用程序管理]-[ Search Service Application]可以导航到搜索管理界面。在这个页面中,上部分是搜索服务的状态,下部分是拓扑。如果是单台机子安装的(非场)SharePoint 2013,可以看见拓扑是非常简单的,也就是所有的搜索组件都运行在这台机子上了。MSDN上有一个作为示例的40,000,000个项的拓扑。详情看这里。在这个例子中,是完全实现容错的,使用了“双份”的物理机来防止单点故障,数据库则使用了SQL Server2012的always on功能。在单台物理服务器内则使用虚拟化来将各个组件分离。
  在此次测试中,我计划索引10M个数据项,所以只需要一个索引分区,同时不考虑容错。所以使用了6台服务器。其中,1台WEB,4台Application Server,1台数据库。SharePoint的安装过程不赘述(需要注意1:SQL Server不能选择Express版本的,否则在运行配置向导的时候将无法连接到数据库[同时还要注意防火墙的问题,测试环境是全部关闭防火墙的。]2:Windows Server 2012的.NET 3.5的安装不是很方便,需要手动进行。)。搜索组建的规划如下:双份的爬网和内容处理,其余组建单份。拓扑图如下(来自CA):
DSC0000.jpg
  至于如何配置搜索服务拓扑,参考这里。这里记录几点:
  1.SharePoint 2013和搜索相关的cmdlet指令都以动词 + SPEnterpriseSearch(SP企业级搜索)开头,通过TAB可以方便检索这些指令。
  2.在这些cmdlet中,如果有需要-SearchApplication参数的,如果主动指定,则可以传递对象变量,如果被动要求提供值,则只能使用ID(一个长串)。例如:


DSC0001.gif DSC0002.gif View Code


PS C:\Users\administrator.OW> $ssa = Get-SPEnterpriseSearchServiceApplication
PS C:\Users\administrator.OW> Get-SPEnterpriseSearchTopology -SearchApplicatio
$ssa

TopologyId     : daf2e79c-9bbc-4bd7-844e-680e14332d1e
CreationDate   : 2013/3/13 14:52:00
State          : Inactive
ComponentCount : 6
TopologyId     : b8782635-ffc1-4895-b20b-e813174d6767
CreationDate   : 2013/3/13 15:22:00
State          : Active
ComponentCount : 8

PS C:\Users\administrator.OW> Get-SPEnterpriseSearchTopology
位于命令管道位置 1 的 cmdlet Get-SPEnterpriseSearchTopology
请为以下参数提供值:
SearchApplication: $ssa
Get-SPEnterpriseSearchTopology : 找不到搜索应用程序 $ssa。
所在位置 行:1 字符: 1
+ Get-SPEnterpriseSearchTopology
+ ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
+ CategoryInfo          : InvalidData: (Microsoft.Offic...tSearchTopology:
GetSearchTopology) [Get-SPEnterpriseSearchTopology],KeyNotFoundException
+ FullyQualifiedErrorId : Microsoft.Office.Server.Search.Cmdlet.GetSearchT
opology
  这时候,如果提供“$ssa的Id”则可以正常运行。(注意,不是引用,而是串)
  3.Get-SPEnterpriseSearchServiceInstance 的Identtiy参数可以是ServerName,但不一定要带上完全限定域名,有时带上了会出错。
  4.观察示例拓扑是可以发现一些规律的:爬网组和内容处理适合放一起,索引和查询适合放一起。管理和分析则不会耗费太多系统资源,可以灵活安排。另外,WEB层的服务器也可以承载一个查询组件。(称为带查询组建的WEB服务器)
  对于上图中的拓扑,使用的cmdlet为:(勘误:我将41,62的内容处理指定为了管理组件...非常不好意思...这里只标注,不修改了。)


View Code


PS C:\Users\administrator.OW> $ssa = Get-SPEnterpriseSearchServiceApplication
PS C:\Users\administrator.OW> $newtopo = New-SPEnterpriseSearchTopology -SearchA
pplication $ssa
PS C:\Users\administrator.OW> $31 = Get-SPEnterpriseSearchServiceInstance -Ident
ity 31-app
PS C:\Users\administrator.OW> $41 = Get-SPEnterpriseSearchServiceInstance -Ident
ity 41-app
PS C:\Users\administrator.OW> $61 = Get-SPEnterpriseSearchServiceInstance -Ident
ity 61-app
PS C:\Users\administrator.OW> $62 = Get-SPEnterpriseSearchServiceInstance -Ident
ity 62-app
PS C:\Users\administrator.OW> $ana = New-SPEnterpriseSearchAnalyticsProcessingCo
mponent -SearchTopology $newtopo -SearchServiceInstance $61
PS C:\Users\administrator.OW> $admin = New-SPEnterpriseSearchAdminComponent -Sea
rchTopology $newtopo -SearchServiceInstance $61
PS C:\Users\administrator.OW> $crawl1 = New-SPEnterpriseSearchCrawlComponent -Se
archTopology $newtopo -SearchServiceInstance $41
PS C:\Users\administrator.OW> $crawl2 = New-SPEnterpriseSearchCrawlComponent -Se
archTopology $newtopo -SearchServiceInstance $62
PS C:\Users\administrator.OW> $content1 = New-SPEnterpriseSearchAdminComponent -
SearchTopology $newtopo -SearchServiceInstance $41
PS C:\Users\administrator.OW> $content2 = New-SPEnterpriseSearchAdminComponent -
SearchTopology $newtopo -SearchServiceInstance $62
PS C:\Users\administrator.OW> $index = New-SPEnterpriseSearchIndexComponent -Sea
rchTopology $newtopo -SearchServiceInstance $31 -IndexPartition 0
PS C:\Users\administrator.OW> $query = New-SPEnterpriseSearchQueryProcessingComp
onent -SearchTopology $newtopo -SearchServiceInstance $31
PS C:\Users\administrator.OW>
  由于拓扑没激活,没办法在CA中查看,这里使用PowerShell整理下。
DSC0003.jpg

性能
  自然很关心爬网速度,和各个服务器的资源。这里是一些记录。
DSC0004.jpg
  思考:随着爬网数量的增加,索引和查询占用的资源提升比较明显。同时,在搜索中心进行搜索的效率也下降。可以考虑在WEB服务器上添加一个查询组建,并在管理和分析服务器上增加一个内容处理组件。然后进行测试和观察。

问题
  同时碰到一个问题:
  在MSDN上说,每10M的记录要添加一个索引分区,每20M的记录要添加一个爬网数据库。添加爬网数据库的我倒是找到了cmdlet,但是添加索引分区的还真没找到。
  找到了,在这里。
  也想到一个问题:
  CA中的搜索管理能看到爬网速率,不知道能不能配置公开搜索耗时。
  如果使用REST API进行搜索的话,确实可以返回搜索耗时的信息。

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-117977-1-1.html 上篇帖子: 一步一步学习sharepoint2010 workflow 系列第一部分:sharepoint工作流简介 第1章 在你的业务流程上使用sharepoint工作流 下篇帖子: SharePoint 2010 常用技巧及方法总结
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表