xiaoxue85 发表于 2015-4-20 05:14:55

Python 新浪微博 各种表情使用频率

  主题:用新浪微博API积累了微博广场的1.4万条数据,我选择了21个字段输出为TXT文件,想用Python稍微处理一下,统计一下这1.4万条微博里面表情使用情况,统计结构在最后。
  无聊的时候用了下新浪JAVA版的API,对JAVA还不熟悉,但是稍微改一下还是没问题的,数据保存为TXT文件,再用Python处理,JAVA部分很简单,Python部分只涉及到表情的正则提取,都不好意思写出来了。
  1、调用新浪JAVA API下载微博广场数据
步骤思路:
初始化API的Weibo类,设置Token后,设置下载间隔,然后重复调用getPublicTimeline()函数就可以了,下面是主要类的代码:
这个不是完整的代码,没有初始化暂停间隔,可以掠过,很简单。


View Code


1 class WriteWeiboData{
2   private int n;
3   public WriteWeiboData(int count)
4   {
5         this.n=count;
6   }
7   public void Start(){
8         System.setProperty("weibo4j.oauth.consumerKey", Weibo.CONSUMER_KEY);
9         System.setProperty("weibo4j.oauth.consumerSecret", Weibo.CONSUMER_SECRET);
10         try {
11             //获取前20条最新更新的公共微博消息
12             Weibo weibo = new Weibo();
13             //weibo.setToken(args,args);
14             weibo.setToken("keystring", "keyscrect");
15             for(int i=0;i
页: [1]
查看完整版本: Python 新浪微博 各种表情使用频率