这是一个创建于 4214 天前的主题,其中的信息可能已经有所发展或是发生改变。
业余在做一个机器抓取网上文章在整合发布的网站。现在想用机器学习之类的技术能把文章按不同的内容进行分类,请问应该怎么做?谢谢!
4 条回复 • 1970-01-01 08:00:00 +08:00
![likai](https://cdn.v2ex.com/gravatar/4e0888f96a9339fdff0d645c1fee3117?s=48&d=retro) |
|
1
likai 2013-08-04 21:28:56 +08:00 via Android 1
中文分词作tag
|
![maxint64](https://cdn.v2ex.com/avatar/4c1c/58fb/36832_normal.png?m=1625327979) |
|
3
maxint64 2013-08-04 22:17:59 +08:00
分词是第一步,之后是为文章建立模型,然后是做聚类。
|
![binux](https://cdn.v2ex.com/avatar/247d/87b0/8105_normal.png?m=1407157990) |
|
4
binux 2013-08-04 22:23:07 +08:00
标记,分词,找个库扔进去训练就完了 如果觉得觉得麻烦,手动提取特征tag
|