设为首页 收藏本站
查看: 889|回复: 0

[经验分享] Office SharePoint Server 2007 搜索模块的两个“大”问题

[复制链接]

尚未签到

发表于 2019-2-4 16:27:03 | 显示全部楼层 |阅读模式
  OK,这篇blog算是来给Office SharePoint Server 2007 “揭丑”了,确切来说,是给Office SharePoint Server 2007中的搜索功能模块“揭丑”。其实,这里要说的两个问题很早就已经暴露出来了,但是为啥直到现在才进行“揭丑”行动呢?因为直到现在,我才能确定这两个问题已经有解决之道(或者有望解决),呵呵,否则,仅仅说问题,而不说怎么解决,您不是会更郁闷吗...

先来说第一个问题:不能正确对路径大小写敏感的内容源进行爬网。

Windows操作系统的一个特点就是对文件(或者文件夹)路径的大小写是不敏感的,也就是说,我们在Windows操作系统里面指定一个文件的路径,比如“C:\a.tmp”,如果你使用“c:\A.TMP”也是完全没有问题的。所以,构建在Windows IIS之上的Web应用,基本上对于路径也是大小写不敏感的,比如用户浏览“http://www.microsoft.com/products”和“http://www.microsoft.com/Products”对于服务器而言是一回事。但是这个假设仅仅在Windows平台上才适用,对于非Windows操作系统,它完全有可能对于路径是大小写敏感的,也就是说,对于一个构建在非Windows平台上的Web应用来说,“http://webapp/portal”和“http://webapp/Portal”对于服务器而言可是不一样的。

这似乎和我们平时的使用体验不一样,有人会说,“俺访问俺们公司一个Unix+Apache+Java的Web应用时,输入URL就从来没注意过大小写啊!”嗯,这应该是因为,要么Web服务器就配置成了大小写不敏感,要么Web服务器会自动进行大小写纠错,也就是说,如果你在浏览器中敲入“http://webapp/portal”,这个http访问到了Web服务器之后,Web服务器自动将这个请求导向到“http://webapp/Portal”上。

现在再回到正题上,由于Office SharePoint Server 2007是一个完全基于Windows平台的应用,所以,在当初对它的搜索爬网引擎进行设计时,就设计成了这样:当爬网引擎得到一个URL后,爬网引擎不管3721,就先把这个URL的字母全部转换成小写,然后再去访问它。比如,爬网引擎在爬一个Web应用首页时,得到了首页上的一个链接“http://webapp/News”,那么爬网引擎会直接把这个URL转换成“http://webapp/news”,然后再去访问它。如果这个Web应用恰好就是路径大小写敏感的,那么,嘿嘿,Office SharePoint Server 2007的爬网引擎就抓瞎了...

暂且不论当初为啥要这样设计,但是这的确是一个相当大的问题,因为如果我们需要Office SharePoint Server 2007对一个路径大小写的Web应用进行爬网(其实这样的Web应用数量是不少的),那么Office SharePoint Server 2007除了在日志里面纪录一些错误信息之外(甚至在日志中,这些URL都是全部小写的...),它几乎不能为我们爬任何有用的内容。

值得庆幸的是,现在我们对于这个问题有了解决办法,KB 932619描述了这个问题以及解决方法:安装hotfix 932620和hotfix 932621,然后按照KB 932619中的描述修改注册表就OK了。

第二个问题:不能对基于Forms验证的Web应用进行爬网

现在Office SharePoint Server 2007只能对要么匿名访问、要么基于Windows集成认证的Web应用进行爬网,但是对于大量的基于Forms验证的Web应用,却无能为力。幸运的是,很快微软也会发布相应的hotfix来增加对基于Forms验证的Web应用进行爬网的功能了(发布后我会在blog上告诉大家)。




运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-671879-1-1.html 上篇帖子: Office SharePoint Server 2007 (Beta2) 管理、部署文档 下篇帖子: 自定义SharePoint新网站创建过程(2)
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表