TF-IDF
来源:互联网 发布:淘宝网折叠沙发床单人 编辑:程序博客网 时间:2024/05/01 18:18
一:TF-IDF基本意思
TF-IDF --->term frequency - inverse document frequency (词频--逆向文件频率)
TF:term frequency :这个单词在这篇文章中出现的概率
IDF:inverse document frequency 倒排文件频率:包含该单词的文档总数
TF*IDF 的大小 ----》作为该单词区分类别能力的大小
二:TF-IDF的弊端
文档d属于D类,d中的一个单词在D类频繁的出现从一定程度上反映这个单词能够代表能够描述这一类文章,能够很好的区分不同类型的文章。
但是按照TF-IDF,这个单词的作为区分不同类别文档的概率值会很小
0 0
- TF/IDF
- TF-IDF
- TF-IDF
- TF-IDF
- TF-IDF
- TF-IDF
- TF-IDF
- TF-IDF
- TF-IDF
- TF-IDF
- TF-IDF
- TF-IDF
- tf-idf
- tf-idf
- TF-IDF
- tf-idf
- TF-IDF
- TF-IDF
- 求商求模运算
- HDU 2647 Reward(图论-拓扑排序)
- eclipse 技巧
- 本人很迷茫的说
- 给定一个二进制数,要求循环移位,在原二进制数中操作(C语言)
- TF-IDF
- 雾山的Java学习笔记---I/O(三)(处理流)
- Ubuntu 下字体问题链接搜集
- Visual C++ 2012入门经典(第6版) 课后练习(第06章)
- static的含义以及其在C/C++中的区别
- HDU1754-I Hate It
- 【Leetcode长征系列】Valid Sudoku
- APC Silcon 60kv - What do all the abbreviations mean
- [Phonegap+Sencha Touch] 移动开发7、Sencha Touch图标的使用与自定义