设为首页 收藏本站
查看: 799|回复: 0

[经验分享] python调用 bing api search接口 技术

[复制链接]

尚未签到

发表于 2017-5-3 06:21:34 | 显示全部楼层 |阅读模式
0x01 微软bingapi现在也放开了,可以供大家使用了,以前的v1板的时候采用的是appid的方式,这个网上有很多介绍了,可惜现在这个接口取消了,取而代之是新的认证方式
 
0x02 首先可以参考http://blogs.msdn.com/b/translation/p/gettingstarted1.aspx这个文章讲的就比较细了,注意的点不多,
 
0x3 首先注册的时候bing的应用(先注册个账号什么的就不用多说了),下来关键就是注册bingsearch api 应用
https://datamarket.azure.com/browse/data?price=free&sort=name
这里面找

DSC0000.jpg
 
点击进去,我们大多数穷人就选这个了

DSC0001.jpg
 
一路next下去,到最后完成后,可以打开My Account,看到如下界面就说明成功了,其中核心是Primary Account Key

DSC0002.jpg
 
<!--[endif]-->
 
0x04 下来核心就是怎么用了,这里的文档讲的也比较细
https://skydrive.live.com/view.aspx?resid=9C9479871FBFA822!112&app=Word&authkey=!ANNnJQREB0kDC04
这里注意的点就比较多了,首先最重要的是api的认证方式,有两种,一种是OAuth2,一种是基本的401认证,其中OAuth2的方式比较正规和复杂点,但是管理性强些,而401认证就比较简单粗暴了,我用的是401认证的方式
 
0x05 401认证,顾名思义就是利用http 包头增加Authorization basic字段来实现认证。要注意的是这里认证的密码就是前面提到的Primary Account Key,用户名为空,
python中就是这个样子:
https:// api.datamarket.azure.com/Bing/Search/Web?'+ urllib.urlencode(payload)
AccountKey要注意的是,401认证的实质是在包头增加Authorization basic,而这里如果要直接代码实现的话,包头的内容应该增加如下:
Authorization basic base64.encode(":"+AccountKey)
一定要注意虽然用户名为空,但是冒号不能少,然后base64编码后,发送
payload的字段也很关键:

DSC0003.jpg
 

DSC0004.jpg
 
其中比较重要的是四个字段如下
$format  决定了返回的格式样式,是xml还是json,例如 $format=json
$top     决定了每一次返回的结果个数,类似于数据库分页中的limit,(0-50)。  
$skip    决定了返回的起始数字,类似与数据库分页的start
Query    就是实际查询的语句,特别要注意,这里的查询语句需要用两个单引  号括起来,不然会报错注意要url编码下
其中前三个字段的开头都要有$符号,千万不能忘。
 
0x06 返回的json格式目前是
    
DSC0005.jpg
 

 
0x07 附上一段python利用代码
 

# coding=utf-8
"""
Created on 2013-1-24
@author: icefish
"""
import urllib
import urllib2
import base64
try:
import json
except ImportError:
import simplejson as json
#这里填上你申请到的bing的accout key 就可以了   
AccountKey='XXXXXXX.....'
top=50
skip=0
format='json'
def BingSearch(query):
payload={}
payload['$top']=top
payload['$skip']=skip
payload['$format']=format
payload['Query']="'"+query+"'"
url='https://api.datamarket.azure.com/Bing/Search/Web?' + urllib.urlencode(payload)     
sAuth='Basic '+base64.b64encode(':'+AccountKey)
headers = { }
headers['Authorization']= sAuth
try:
req = urllib2.Request(url,headers=headers)        
response = urllib2.urlopen(req)
the_page=response.read()
#print the_page
data=json.loads(the_page)
return data
except Exception as e:
print e
#print e.info()
if __name__ == '__main__':
data=BingSearch("abc")
print data
 

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-372230-1-1.html 上篇帖子: python 处理Excel2003与2007的工具 下篇帖子: 函数、程序-python综合练习 -by小雨
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表