程序博客网 > 雷神电脑怎么样知乎

机器学习_TF-IDF

来源：互联网发布：雷神电脑怎么样知乎编辑：程序博客网时间：2024/06/07 18:58

【1】本算法的目的是从文档中找出主题词，来对文档进行分类。见大数据书P6。

【2】有点像文档的特征选取，选出文档中最具有代表性的词。

【3】理解：第一：主题词确实会在文档中重复出现，但并不是最频繁的。（语气词、停顿词最频繁）

第二：一篇文档的主题词在其他文档中几乎不会出现。

【4】所以挑选主题词，对词语在一篇文档的打分的公式为：

（词在一篇文档中出现的频率）*（词出现文档的文档数越少，值越大的函数）

【5】启示：如果一件事情由两个标准构成，那么可以使这两个标准相乘。

阅读全文

0 0

雷神电脑怎么样知乎

雷神电脑怎么样知乎

原创粉丝点击

热门问题 老师的惩罚人脸识别我在镇武司摸鱼那些年重生之率土为王我在大康的咸鱼生活盘龙之生命进化天生仙种凡人之先天五行春回大明朝姑娘不必设防，我是瞎子贵阳妇幼保健院江西妇幼保健院妇幼保健院网上预约挂号河南妇幼保健院福建妇幼保健院曲靖妇幼保健院无锡妇幼保健院妇幼保健院预约挂号厦门市妇幼保健院郑州市妇幼保健院柳州妇幼保健院徐州妇幼保健院妇幼保健院咨询南通妇幼保健院柳州市妇幼保健院西北妇幼医院内蒙古妇幼保健院广州妇幼保健院东莞妇幼保健院广州市妇幼保健院唐山妇幼医院枣庄妇幼保健院广西妇幼保健院山东省妇幼保健院妇幼医院预约挂号无锡市妇幼保健院无锡妇幼网上挂号妇幼保健院挂号北京妇幼保健院佛山妇幼保健院贵阳市妇幼保健院珠海妇幼保健院海南省妇幼保健院南宁市妇幼保健院南宁妇幼保健院锦江妇幼保健院福州妇幼保健院沈阳市妇幼保健院武汉妇幼保健院昆明妇幼保健院红房子妇幼医院