V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  nealot  ›  全部回复第 5 页 / 共 5 页
回复总数  92
1  2  3  4  5  
2020-08-22 15:17:45 +08:00
回复了 nealot 创建的主题 程序员 遗传算法生成的模型如何避免过拟合?
@VoidChen 感觉这是个比较好的解法,值得一试

打个比方,假设这个图像演化算法是用来生成美女的脸型的,第一个训练子集生成出来的是赵薇的脸,第二个训练子集输出的是刘亦菲的脸……

最后把这些明星脸平均一下,就是 “平均美人脸”,这个很可能就是最终需要的模型

(那么为什么不把训练集合在一起训练呢?我也不知道为什么,总之实验效果不好,毕竟这不是简单的加减算术题)
2020-08-22 12:53:13 +08:00
回复了 nealot 创建的主题 程序员 遗传算法生成的模型如何避免过拟合?
@shm7 验证集可以用来搜索最佳的模型生成参数。如果一定要套用到遗传算法上,我们是要让种群数量减小,演化次数减少,以便不进行充分的演化?这感觉和遗传算法的本意是相违背的
2020-08-22 12:15:48 +08:00
回复了 nealot 创建的主题 程序员 遗传算法生成的模型如何避免过拟合?
@Issacx 现在的核心问题,其实和具体业务是无关的。我来具体解释下矛盾在哪里

传统的机器学习任务,比如用决策树做分类,如果我们在 trainset 上建立一颗尽量精细的决策树 (model),然后把这个 model 用于 testset,通常效果是不太好的,因为有过拟合,这是个典型的错误

因为是典型的问题,所以也有典型的解法,对于决策树分类问题,解法是这样的:

我们把 trainset 分为两个子集: trainset_1_of_2, trainset_2_of_2

接下来的重点是,我们不是直接构建一个最佳的 model,而是构建一个最佳的 model 的生成参数 (比如 max_depth)

```C++
int best_depth = -1;
int best_score = -1;

for (int max_depth = 1; max_depth < 10; max_depth++) {
tree1 = construct(trainset_1_of_2, max_depth);
score1 = run(trainset_2_of_2, tree1);
tree2 = construct(trainset_2_of_2, max_depth);
score2 = run(trainset_1_of_2, tree2);
score = (score1 + score2) / 2;

if (score > best_score) {
best_score = score;
best_depth = max_depth;
}
}
```

这样我们就得到了 best_depth,然后在整个 trainset 上用这个参数来构建决策树

```C++
tree = construct(trainset, best_depth);
```

接下来这颗树在 testset 上效果就比较好了

但是如果我们搜索的,不是模型生成参数,而是模型本身 (使用遗传算法),这套方法还成立吗?

PS: 目前使用的是类似图像演化的遗传算法,得到是一个类似 BMP 的图像
2020-08-22 11:56:39 +08:00
回复了 nealot 创建的主题 程序员 遗传算法生成的模型如何避免过拟合?
@VoidChen 是类似图像演化的算法,可以参考这篇文章 https://chriscummins.cc/s/genetics/
2019-12-24 22:51:43 +08:00
回复了 cuixiao603 创建的主题 奇思妙想 一直有个想法,在没有暖气的地方用矿机当电暖。。。
@Semidio 4500 欧的售价已经把 99% 的人吓跑了

这个场景的最佳矿机是那些次新一代的主流矿机,能效不是最高的不要紧,关键是价格要低
2019-12-24 18:34:22 +08:00
回复了 cuixiao603 创建的主题 奇思妙想 一直有个想法,在没有暖气的地方用矿机当电暖。。。
@dlsflh 卧室或书房里攒着一桶矿物油感觉也不太好诶

临时实验一下拍个演示视频还能接受
2019-12-24 17:50:44 +08:00
回复了 cuixiao603 创建的主题 奇思妙想 一直有个想法,在没有暖气的地方用矿机当电暖。。。
这个我已经实践了一段时间了,制热效果还是不错的,1500W 足够一个 10 平方米的小房间冬季取暖了

1. 1500W 的空调可以有 4500W 的制热能力,每 4.5 单位热量,支出 1.5 份电费

2. 3 台 1500W 的矿机也有 4500W 的制热能力,每 4.5 单位热量,反赚 0.6 份电费 (根据电价和矿机型号具体数值可能不同)

3. 出风口噪音 75 dB 左右,放身旁完全受不了

4. 真的不敢改造风扇;现在风扇工作很稳定,改了万一温度反馈调节机制有问题,或者采购的风扇运行不稳定,起火就不好了

5. 现在正在开发第二版消音器,争取降噪 15dB ;第一版主要用的是消音棉,第二版用的是三层夹胶玻璃,轻微改造至少比换风扇踏实点

6. 网络上关于降噪的资料相当少,目前还在瞎摸索阶段,这个问题其实才是大坑

7. 一个更好的思路是矿机放屋外空调外机上,用管道把暖风通到市内;这个效果一定非常好,因为冬天的室外气温是非常低的,进的冷风几乎可以让风扇只工作在最低转速,本身噪音就降低了,经过一般商品房配的双层玻璃又降了一个数量级,但是要特别注意防雨,而且如果装修时没有预留打孔操作会比较麻烦

8. 还有一个思路是买官方版的水冷矿机,比较省心,就是太贵,而且这类产品一般性价比不高;此外要特别关注这类产品的保修和售后服务
2018-08-10 21:51:33 +08:00
回复了 nealot 创建的主题 程序员 优化问题解空间定义问题求助
@sw0rd3n 遗传算法是挺好的,但是主要问题是上面提到的,约束条件下存在演化方向不平衡问题
2018-08-10 21:40:03 +08:00
回复了 nealot 创建的主题 程序员 优化问题解空间定义问题求助
@dbw9580 不知道,比如可能是 KNN 生成的一个交叉验证有效率
2018-08-10 21:35:46 +08:00
回复了 nealot 创建的主题 程序员 优化问题解空间定义问题求助
@dbw9580 对于解空间中的一个解,有个代价函数 cost_function(v),这个函数可能是较耗时的,而且结果也较难预测,但是基本上是连续的,因此暴力搜索效率不高,但是梯度下降和遗传算法效果会较好
1  2  3  4  5  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2872 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 16ms · UTC 12:09 · PVG 20:09 · LAX 04:09 · JFK 07:09
Developed with CodeLauncher
♥ Do have faith in what you're doing.