Avafly 最近的时间轴更新
Avafly

Avafly

V2EX 第 616174 号会员,加入于 2023-02-27 10:18:22 +08:00
今日活跃度排名 4255
根据 Avafly 的设置,主题列表被隐藏
二手交易 相关的信息,包括已关闭的交易,不会被隐藏
Avafly 最近回复了
@cleverstronger #35 好好, 已注册🥰
YXZhZmx5QHRydXN0eWxpbi5jb20=
一直在用 Simple Translate, 很简陋, 一直想换了.
15 天前
回复了 mereith 创建的主题 开源软件 写开源项目被骂了
我这几天也遇到个这样的老外. 讲了半天道理, 发现最好的办法是不回复. 不回了之后他还急得去其他回复里跟别人说我怎么样😂.
几天后去看下, 发现他已经被点踩点到负了.
可以参观下: https://www.reddit.com/r/computervision/comments/1h35tpi/comment/lztupov/
15 天前
回复了 mereith 创建的主题 开源软件 写开源项目被骂了
@CEBBCAT 访问不了啊. 是被 D 了吗?
试了下 demo, 用户名随便就写了个 114514, 结果进去发现里面的人全是野兽先辈数字笑死
28 天前
回复了 Avafly 创建的主题 算法 C++如何优化矩阵乘法 gemm
@dingyaguang117
你是说它们不是传统的 C=AB, 而是用了 Strassen/Winograd 之类的方法减少了复杂度吗?
28 天前
回复了 Avafly 创建的主题 算法 C++如何优化矩阵乘法 gemm
@foool #19
非常感谢你的回复.
1. 最大 GFLOPS 这个我没算, 是以 openblas 的为目标优化的 (试过别的库, 有比 openblas 更快的).
2. 3. 很好的建议, 我回头再优化测试看看.
4. 我是脚本跑 100 次取最优值的.
5. 使用 schedule(static)是因为 for 循环中每次计算量近似才用的, 不过我试过去掉这个, 其实性能基本没区别.
28 天前
回复了 Avafly 创建的主题 算法 C++如何优化矩阵乘法 gemm
@tankeco
是的, 这点我也觉得要花时间想下怎么减少 index.
其实已经优化过一次 index 了, 现在保留的都是为了分块和区分多线程访问空间的, 后面个人感觉这不是影响速度的最大的因素就没继续花心思了.
28 天前
回复了 Avafly 创建的主题 算法 C++如何优化矩阵乘法 gemm
@toma62299781
感谢分享
28 天前
回复了 Avafly 创建的主题 算法 C++如何优化矩阵乘法 gemm
@WonderfulRush
刚看完这篇文章然后看到你的评论...
那个文章挺好的, 但是技术部分讲得有点简略, 而且其实很多提到的技术我已经用了, 比如 blocking, simd 等等.
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2749 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 9ms · UTC 14:20 · PVG 22:20 · LAX 06:20 · JFK 09:20
Developed with CodeLauncher
♥ Do have faith in what you're doing.