|
主题:用新浪微博API积累了微博广场的1.4万条数据,我选择了21个字段输出为TXT文件,想用Python稍微处理一下,统计一下这1.4万条微博里面表情使用情况,统计结构在最后。
无聊的时候用了下新浪JAVA版的API,对JAVA还不熟悉,但是稍微改一下还是没问题的,数据保存为TXT文件,再用Python处理,JAVA部分很简单,Python部分只涉及到表情的正则提取,都不好意思写出来了。
1、调用新浪JAVA API下载微博广场数据
步骤思路:
初始化API的Weibo类,设置Token后,设置下载间隔,然后重复调用getPublicTimeline()函数就可以了,下面是主要类的代码:
这个不是完整的代码,没有初始化暂停间隔,可以掠过,很简单。
View Code
1 class WriteWeiboData{
2 private int n;
3 public WriteWeiboData(int count)
4 {
5 this.n=count;
6 }
7 public void Start(){
8 System.setProperty("weibo4j.oauth.consumerKey", Weibo.CONSUMER_KEY);
9 System.setProperty("weibo4j.oauth.consumerSecret", Weibo.CONSUMER_SECRET);
10 try {
11 //获取前20条最新更新的公共微博消息
12 Weibo weibo = new Weibo();
13 //weibo.setToken(args[0],args[1]);
14 weibo.setToken("keystring", "keyscrect");
15 for(int i=0;i |
|
|