V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
爱意满满的作品展示区。
guchengxi1994
V2EX  ›  分享创造

我最近在 github 上起了一个机器学习工具项目(标注,数据增广等)

  •  
  •   guchengxi1994 · 2022-08-16 18:57:52 +08:00 · 1502 次点击
    这是一个创建于 590 天前的主题,其中的信息可能已经有所发展或是发生改变。

    But,想做的东西很多,时间却是有限的,所以想找一些有志之士一起完成这个项目

    项目地址

    现在项目进度

    机器学习数据这块完成了基本框架和一些基础的增广(包括标注)
    UI 这块完成了数据标注(图像那个暂时只支持单文件标注下载、生成,nlp 标注。。。因为我自己也没接触过,就做的随意了一点) 最近我在考虑写一个 windows 上 flutter 调用 opencv 的插件,但是遇到一些问题,主要集中在指针;原因是这是我第一次写 c++。。。

    技术栈

    • 前端 flutter (目标全平台,尽管手机端做标注有点费劲🤣)
    • 数据相关工具 python
    • 后端 python

    功能预览

    UI 预览 https://guchengxi1994.github.io/simple-tools-for-machine-learning/#/

    ps. 因为我不知道怎么传图,所以具体内容还是去 github 看 readme 吧 🤫https://github.com/guchengxi1994/simple-tools-for-machine-learning

    7 条回复    2022-08-18 19:20:27 +08:00
    huntzhan
        1
    huntzhan  
       2022-08-17 01:50:06 +08:00
    有识之士看到这项目估计也得晕
    rekulas
        2
    rekulas  
       2022-08-17 10:31:19 +08:00
    我就是有志之士,我的志向就是只薅不做 🤣
    guchengxi1994
        3
    guchengxi1994  
    OP
       2022-08-17 19:07:43 +08:00
    @huntzhan 🤫提点 issue ,找点 bug 也是可以哒
    guchengxi1994
        4
    guchengxi1994  
    OP
       2022-08-17 19:07:52 +08:00
    @rekulas 哈哈哈
    guchengxi1994
        5
    guchengxi1994  
    OP
       2022-08-17 19:10:47 +08:00
    我自己最近在写的 opencv windows 插件,每次 build release 的时候都把 opencv 全家桶打包进去了,不知道怎么改 cmakelist.txt 文件才好,有没有大佬帮我解答一下?
    另外我实在 vscode 里写的代码,vs 虽然装了但是不会编译 flutter 的插件,很囧啊
    huntzhan
        6
    huntzhan  
       2022-08-18 10:39:09 +08:00
    @guchengxi1994 根据之前做开源项目的宣传经验,你的项目得找到一个“立得住”的点,才会有人关注。目前你的项目目前还处在初级阶段,不太可能有人会进来。比如标注的 UI ,有更成熟的开源项目(比如 label studio ),你的项目打的差异化在哪里?
    guchengxi1994
        7
    guchengxi1994  
    OP
       2022-08-18 19:20:27 +08:00
    @huntzhan 最初的时候,我只是想重写自己以前写过的一个数据增广的库,后来写完之后觉得,既然数据增广有了,要不把标注也写一下;标注写的差不多了,我觉得要不写点别的功能进去,比如以前项目里用到的关于 cv 的工具,做个样例,也许以后做类似项目可以把这些可视化工具拉出来直接验证一下效果。
    然后我看到了有人做神经网络可视化,这个功能不算很新,但是我查了一下没有可视化手动搭建神经网络的逆向工程,就想着也许我拖拉拽神经网络的层,能生成代码也说不定,所以也在尝试。
    诚然,有很多标注同质化的工具,像是[diffgram]( https://github.com/diffgram/diffgram),他们的标注也是很牛逼的,有些功能我也想“借鉴”一下。不过这些工具更多的是在于团队协作,而我想做的是一个服务于个人的机器学习工具,比方说数据增广,比方说人脸分割等等,把这些常用的小玩意集成到一起是我做这个工具的目的。
    当然了,实现功能的成就感也是驱动之一,加上最近公司业务比较少,才有很多时间写自己的小玩意。我今天在用 pyside 写一个文件管理工具(可能会变成文档管理工具)
    感谢你的建议 😁
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   我们的愿景   ·   实用小工具   ·   5514 人在线   最高记录 6543   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 29ms · UTC 06:39 · PVG 14:39 · LAX 23:39 · JFK 02:39
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.