zuier 发表于 2018-12-24 09:57:09

PHP计算文档频率与特征向量

步骤:
(1)读取3篇txt格式的英文文档;
(2)对每篇文档进行分词;
(3)利用正则表达式去掉逗号、句号等标点符号;
(4)计算文档频率;
   (5)统计特征向量
  




页: [1]
查看完整版本: PHP计算文档频率与特征向量