设为首页 收藏本站
查看: 848|回复: 0

[经验分享] 云课堂-Python学习笔记(7)

[复制链接]

尚未签到

发表于 2015-12-2 13:25:01 | 显示全部楼层 |阅读模式
  一、字典
  1、什么是字典
  1、一系列键-值(key-value)对
    2、通过“键”查找对应的“值”
    3、类似纸质字典,通过单词索引表找到其对应的定义
      C++:map、Java:HashTable or HashMap
      例如:电话本
  2、创建字典
  使用{}创建字典
  使用:指明键:值对
      my_dict={'John':86411234,'Bob':24896880,'Mike':354859977}
  3、访问字典
使用[]运算符,键作为索引
增加一个新的对



1 my_dict={'John':86411234,'Bob':24896880,'Mike':354859977}
2 print my_dict['John']
3 my_dict['Tom'] = 9864433679
4 print my_dict
  4、字典运算符和方法



1 len(my_dict):字典中键-值对的数量
2 key in my_dict:快速判断key是否为字典中的键:时间复杂度O(1)
3 等价于my_dict.has_key(key)
4 for key in my_dict:枚举字典中的键,注:键是无序的
  更多方法:



1 my_dict.items():全部键-值对
2 my_dict.keys():全部键
3 my_dict.values():全部值
4 my_dict.clear():清空字典
  5、示例1:读取一个字符串,计算每个字母出现的个数
  方案一:生成26个变量,代表字母出现的个数
  方案二:生成具有26个元素的列表,将每个字母转化为对象的索引值



1 s = 'abdddeyyyrewgq'
2 lst = [0]*26
3 for i in s :
4     lst[ord(i)-97] +=1
5     
6 print lst
  方案三:生成一个字典,字母做键,对应出现的次数做值



s = raw_input()
d ={}
for i in s :
if i in d:
d += 1
else:
d = 1
print d
  示例2:读取小说emma.txt,打印前10个最常见的单词


DSC0000.gif DSC0001.gif


1 f= open('emma.txt')
2 word_freq = {}
3 for line in f:
4     words = line.strip().split()
5     for word in words:
6         if word in word_freq:
7             word_freq[word] += 1
8         else:
9             word_freq[word] = 1
10            
11 freq_word = []
12 for word,freq in word_freq.items():
13     freq_word.append((freq,word))
14 freq_word.sort(reverse = True)
15
16 for freq,word in freq_word[:10]:
17     print word
18 f.close()
View Code  示例3:翻转字典:生成一个新字典,其键为原来字典的值,值为原来字典的键





1 d1 = {'zhang':123,'wang':456,'Li':123,'zhao':456}
2 d2 = {}
3 for name,room in d1.items():
4     if room in d2:
5         d2[room].append(name)
6     else :
7         d2[room] = [name]
8 print d2
View Code  二、集合(set) 
  1、集合:无序不重复元素集,和字典类似,但是无值
  2、创建:
    x = set()
    x={key1,key2,....}
  3、添加和删除
    x.add('body'
    x.remove('body')
  4、集合的运算符:
    -:差集
    &:交集
    |:并集
    !=:不等于
    ==:等于
    in:成员
    for key in set :枚举
  5、示例:中文分词
    我/爱/北京/天安门
    算法:正向最大匹配
      从左到右尽可能取长的词





1 def load_dict(filename):
2     word_dict = set()
3     max_len = 1
4     f = open(filename)
5     for line in f:
6         word = unicode(line.strip(),'utf-8')
7         word_dict.add(word)
8         if len(word) > max_len:
9             max_len = len(word)
10     return max_len,word_dict
11
12 def fmm_word_seg(sent,max_len,word_dict):
13     begin = 0
14     words = []
15     sent = unicode(sent,'utf-8')
16     
17     while begin < len(sent):
18         for end in range(begin + max_len,begin,-1):
19             if sent[begin:end] in word_dict:
20                 words.append(sent[begin:end])
21                 break
22             begin = end
23     return words
24 max_len,word_dict = load_dict('lexicon.dic')
25
26 sent = raw_input('Input a sententce:')
27 words = fmm_word_seg(sent,max_len,word_dict)
28 for word in words:
29     print word
View Code  

运维网声明 1、欢迎大家加入本站运维交流群:群②:261659950 群⑤:202807635 群⑦870801961 群⑧679858003
2、本站所有主题由该帖子作者发表,该帖子作者与运维网享有帖子相关版权
3、所有作品的著作权均归原作者享有,请您和我们一样尊重他人的著作权等合法权益。如果您对作品感到满意,请购买正版
4、禁止制作、复制、发布和传播具有反动、淫秽、色情、暴力、凶杀等内容的信息,一经发现立即删除。若您因此触犯法律,一切后果自负,我们对此不承担任何责任
5、所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其内容的准确性、可靠性、正当性、安全性、合法性等负责,亦不承担任何法律责任
6、所有作品仅供您个人学习、研究或欣赏,不得用于商业或者其他用途,否则,一切后果均由您自己承担,我们对此不承担任何法律责任
7、如涉及侵犯版权等问题,请您及时通知我们,我们将立即采取措施予以解决
8、联系人Email:admin@iyunv.com 网址:www.yunweiku.com

所有资源均系网友上传或者通过网络收集,我们仅提供一个展示、介绍、观摩学习的平台,我们不对其承担任何法律责任,如涉及侵犯版权等问题,请您及时通知我们,我们将立即处理,联系人Email:kefu@iyunv.com,QQ:1061981298 本贴地址:https://www.yunweiku.com/thread-146354-1-1.html 上篇帖子: [转载]Deploying Python with uWSGI and Nginx on Ubuntu 13.10 下篇帖子: python获取知乎日报另存为txt文件
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

扫码加入运维网微信交流群X

扫码加入运维网微信交流群

扫描二维码加入运维网微信交流群,最新一手资源尽在官方微信交流群!快快加入我们吧...

扫描微信二维码查看详情

客服E-mail:kefu@iyunv.com 客服QQ:1061981298


QQ群⑦:运维网交流群⑦ QQ群⑧:运维网交流群⑧ k8s群:运维网kubernetes交流群


提醒:禁止发布任何违反国家法律、法规的言论与图片等内容;本站内容均来自个人观点与网络等信息,非本站认同之观点.


本站大部分资源是网友从网上搜集分享而来,其版权均归原作者及其网站所有,我们尊重他人的合法权益,如有内容侵犯您的合法权益,请及时与我们联系进行核实删除!



合作伙伴: 青云cloud

快速回复 返回顶部 返回列表