运维网's Archiver
论坛
›
php
› PHP计算文档频率与特征向量
zuier
发表于 2018-12-24 09:57:09
PHP计算文档频率与特征向量
步骤:
(1)读取3篇txt格式的英文文档;
(2)对每篇文档进行分词;
(3)利用正则表达式去掉逗号、句号等标点符号;
(4)计算文档频率;
(5)统计特征向量
页:
[1]
查看完整版本:
PHP计算文档频率与特征向量