yt-summer 发表于 2017-4-30 15:05:33

python 中文分词 (windows) pymmseg

  pymmseg windows下中文分词, 下载附件, 直接 import 目录就行了。
  #coding=utf-8
  from pymmseg import mmseg   
  mmseg.dict_load_defaults()    
  text = '今天的天气真好啊,我们一起出去玩一下吧'
  algor = mmseg.Algorithm(text)    
  word  = []
  for tok in algor:    
  word.append(tok.text)
  print ' '.join(word).decode('utf8').encode('gb2312')
  命令行cmd下的效果:
  G:\git\Graduation-Design\src\web>aa.py
  今天 的 天气真好 啊 , 我们 一起 出去 玩 一下 吧
  ====================================
  之前下载了一个 inpout32.dll 文件放到了 c:/windows/system32/目录, 不知这是不是必须的。
页: [1]
查看完整版本: python 中文分词 (windows) pymmseg