发布网友 发布时间:2022-04-24 22:28
共1个回答
热心网友 时间:2023-04-27 08:47
想要进行词频统计,你要多的第一部是要得到里面有多少个词。也就是首先你要对全文进行切分,按照词性 动词、名词、语气词等多种词性区分开,显然,如果你想从0开始这么做,你还需要有一个词典,这个词典应当包括了多有的词,然后挨个字去字典里找匹配,才能分开。
对于个人开发者来说这很难。但好在有很多大的云计算服务商他们已经将这种事情给我们做好了,虽然并非那么完美,你有需要的话 可以搜索一下 新浪SAE所提供的分词服务。追问谢谢,我想问一下如何用新浪的sae,对词的频率如何进行统计
追答注册个sae的账号,他们有详细的文档介绍