V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  rockivy  ›  全部回复第 10 页 / 共 14 页
回复总数  274
1 ... 2  3  4  5  6  7  8  9  10  11 ... 14  
2016-10-20 11:19:13 +08:00
回复了 wisdomgarden 创建的主题 酷工作 [西安] Wisdom Garden 再发招聘贴 求勾搭~
路过帮顶,很赞的公司
PLA-046, 所以你是来开车的对吗
2016-09-14 09:17:46 +08:00
回复了 tsaoyu 创建的主题 Python 无人帆船 一颗赛艇
excited! 滋瓷一下
2016-08-02 08:56:20 +08:00
回复了 uuuing 创建的主题 求职 坐标西安,求个内推。PHP 开发工程师,可前端。
@uuuing 加我 QQ 59676837 详细谈谈?
2016-06-17 10:32:59 +08:00
回复了 seoguess 创建的主题 Python 关于 flask 处理数据的问题
建议看看 flask-appbuilder ( https://github.com/dpgaspar/Flask-AppBuilder
建好 model 之后,只需要简单几行 View 配置代码,
就可以直接生成 CRUD 页面及功能,简直是 demo 和各种 mini 项目开发的神器。
貌似不错的公司,希望西安有越来越多这样有趣的公司,
路过帮顶下~~~
2016-04-03 08:40:18 +08:00
回复了 huson 创建的主题 随想 高速惊魂, 6 车连环追尾,被卡在中间
楼主是在西汉高速?
2016-03-31 10:58:30 +08:00
回复了 qisuker 创建的主题 Python 全新译作《Python 进阶》首发
已 star , thx
2016-03-21 17:06:12 +08:00
回复了 pinggjayy 创建的主题 Java java 查看线程状态
visualvm 连上看看?
2016-03-18 11:28:40 +08:00
回复了 ben548 创建的主题 Redis redis 中 mget 操作最大能取出多少条数据
可以使用 scan 命令遍历整库导出, scan 支持指定每次导出的数据条数
2016-02-29 09:06:11 +08:00
回复了 rockivy 创建的主题 Python sklearn 文本分类器做预测时,如何拿到预测结果。。。
@demon014 上面忘记 @了。。。
2016-02-29 09:05:16 +08:00
回复了 rockivy 创建的主题 Python sklearn 文本分类器做预测时,如何拿到预测结果。。。
大规模的抓取推荐 scrapy 。
不过我这边的规模很小,就自己用 python 写了几个简单的小爬虫,在我的 github 上有,你可以找找看。
2016-02-25 11:31:47 +08:00
回复了 rockivy 创建的主题 Python sklearn 文本分类器做预测时,如何拿到预测结果。。。
@demon014 很简单,两个方法:
1. 使用 load_files 加载待分类 txt 文件,则需要按照上面的所说的,新增一级 unknown 目录;
2. 不使用 load_files 加载,直接将待分类的 txt read 出来,作为 list 的一个 element ,将这个 list 扔给 predict 去做预测即可。(多个 txt 就是多个 list element )
3. 如果训练或是待分类数据在一个 txt ,以 [行] 来区分,我改了一下 sklearn.datasets.load_files 方法,可以将每行加载为一个样本,代码见:
https://github.com/rocky1001/Machine-Learning/blob/master/text_classifier/load_files.py
2016-02-04 18:04:36 +08:00
回复了 iamlittle 创建的主题 职场话题 搜房真是日了狗了,年终奖还没谱呢,又摊下这种任务了
@xgowex 居然有这种的,长见识了。。。
2016-02-01 14:50:42 +08:00
回复了 rockivy 创建的主题 Python sklearn 文本分类器做预测时,如何拿到预测结果。。。
@RangerWolf @KIDJourney 及楼上各位:
代码我放在了:
https://github.com/rocky1001/Machine-Learning/tree/master/text_classifier

netease_news_classifier.py 是完整代码(包括模型训练与加载待预测数据)
netease_traning_data.zip 是使用的训练数据,大约抓取了网易新闻 11 个频道下 3-5 天的新闻正文数据
netease_predict_data.zip 是待预测数据目录,里面新建了 unknown 这一级 folder ,解决了原 po 的问题。

有需要的同学可以参考~~~
2016-01-31 17:39:21 +08:00
回复了 rockivy 创建的主题 Python sklearn 文本分类器做预测时,如何拿到预测结果。。。
@RangerWolf 可以的,明天到公司后贴,贴好了通知你
2016-01-28 18:56:09 +08:00
回复了 rockivy 创建的主题 Python sklearn 文本分类器做预测时,如何拿到预测结果。。。
上面是为了攒人品, 添加的问题解决方案,
供有需要的同学参考~~~
1 ... 2  3  4  5  6  7  8  9  10  11 ... 14  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5591 人在线   最高记录 6543   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 38ms · UTC 06:34 · PVG 14:34 · LAX 23:34 · JFK 02:34
Developed with CodeLauncher
♥ Do have faith in what you're doing.