V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
zwgf
V2EX  ›  GitHub Copilot

为什么 GitHub Copilot 收费,却不给训练用的代码作者费用?

  •  
  •   zwgf · 2022-06-23 18:45:59 +08:00 · 9169 次点击
    这是一个创建于 918 天前的主题,其中的信息可能已经有所发展或是发生改变。

    GitHub Copilot 收费是应该的,训练用的机器设备,项目的开发管理人员。这些都是成本。大家都要吃饭,所以支持 GitHub Copilot 收费!

    我也仔细看了一下 Copilot 的协议,Copilot 不对建议的代码负责,其实这个也是能理解的,谁能保证代码没个 BUG ,也就是说除了 BUG 或者建议不准确以外。如果 Copilot 给的建议代码是受到知识产权保护的代码,你的项目使用受到任何问题也是和 Copilot 无关的。关系撇的很干净。这就像你在视觉中国买了一张图片,然后发现视觉中国对这张图片没有任何权利。

    Copilot 的建议代码是通过官网标注的数十亿行代码训练而来的。协议中也说明了来自 Github 和使用 Copilot 的用户。然后 Copilot 就可以免费白嫖这些代码,不需要给代码作者费用。这就像你写了一本小说,然后被人拿去改拍电影,不需要给你费用一样。

    Copilot 之前免费的时候我一直在用,怎么说呢,体验还算可以。因为当时是免费的,所以我觉得用了我的 github 的代码我也是可以接受的。

    举个例子,你家有个果园,落的有很多树叶(这里就当对果园主没啥用)。有个人给你说想拿一些树叶回家烧火做饭用,同时他也给他邻居一些烧火做饭用。作为果园主大多数人都不会拒绝。有一天这个人有个想法,从你果园拿出来的叶子他装到麻袋里面包装一下,就坐在你家果园门口 10 刀一袋卖,买回去的人发现这些树叶上有白蚁还把家里的柴房给蛀了。这个时候买树叶的人回来还不能找这个卖树叶的评理。这个时候你这个果园主是什么想法呢?

    第 1 条附言  ·  2022-06-23 22:04:35 +08:00
    首先上面的例子我补充一下,如果他拿走你的树叶回去做饭,然后出来卖饭。这个时候和他出来直接卖包装好的树叶又是不同的概念了。

    底下一些人的抱着抬杠抖机灵的方式回复,我就不回复了,浪费彼此时间。

    这里面还需要定义 AI 训练用的代码是属于数据的范畴还是 AI 项目的本体。我是认为属于数据的范畴。如果从数据的范畴来说是不是这些数据和代码之前的定义不一样了,这些代码被作为 AI 的数据的时候,这些数据本身就是价值,是需要给与原数据作者费用的。而且 AI 替代人类的步伐会越来越快,将来会有更多这样的事例,需要思考辩论一下这方面的问题。抬杠就算了,浪费彼此时间。

    还有那种说为了免费的,我自己就是干程序员的,如果我只是为了追求免费,那我的工作不就一分钱也赚不到了,自己给自己挖坑?动动脑子好吧,我是想让使用数据的公司给我钱,让我的工作赚 2 份工资。连我的目的都没有搞清楚,就开始喷,真的是醉了。
    74 条回复    2022-06-27 17:18:26 +08:00
    icyalala
        1
    icyalala  
       2022-06-23 18:48:15 +08:00
    非要打比喻的话。。你只有果树,果园是从 Github 租的
    Trim21
        2
    Trim21  
       2022-06-23 18:49:45 +08:00 via Android
    用 GitHub 上的开源代码无可厚非,但是拿用户的代码训练可能有问题吧…
    zwgf
        3
    zwgf  
    OP
       2022-06-23 18:49:58 +08:00
    @icyalala 那开了 github 付费计划的是不是相当于也交了果园的租金?
    idblife
        4
    idblife  
       2022-06-23 18:50:03 +08:00
    毕竟你也免费使用 github 了啊,又没找你收仓库钱
    zwgf
        5
    zwgf  
    OP
       2022-06-23 18:52:32 +08:00
    @idblife 如果按照这个道理的话,百度网盘限速也说的通,百度网盘也没强制拉着你用,也是你自己上传上来的文件,也没收你文件存储费。但是这不合理呀!
    icyalala
        6
    icyalala  
       2022-06-23 18:54:55 +08:00
    @zwgf 你付费是为了用更多 CI 机器、用更多存储、各种组织管理的功能。
    你用到的代码托管、Page 服务等等都还是免费的。
    acehowxx
        7
    acehowxx  
       2022-06-23 18:55:57 +08:00 via Android
    一般是默认放到互联网公开的东西都能用吧。你也可以基于网上的东西,自己弄个项目封装下卖钱。开源的代码很多不都是这么用的吗,不觉得有什么问题。
    而且觉的贵,你也可以不买 copliot 就完事了。
    zwgf
        8
    zwgf  
    OP
       2022-06-23 18:56:26 +08:00   ❤️ 6
    @idblife 甚至连微信卖你的个人资料也说的通,微信让你免费试用了,也没收你微信使用费。
    idblife
        9
    idblife  
       2022-06-23 18:57:50 +08:00
    @zwgf
    个人隐私数据和代码还是差挺多吧
    zwgf
        10
    zwgf  
    OP
       2022-06-23 18:59:05 +08:00
    @icyalala 我不赞成你这种观点,Copilot 收费是没问题的,做项目不赚钱那是啥子,我的意思是需要给他训练使用的代码的作者费用。这才符合逻辑。
    triangle111
        11
    triangle111  
       2022-06-23 19:00:42 +08:00
    开源代码只要遵守协议就能直接用,但是人家卖的是服务,又不是卖代码。
    zwgf
        12
    zwgf  
    OP
       2022-06-23 19:01:06 +08:00
    @acehowxx
    那还要看他训练的代码的开源协议。我觉得 copliot 的费用和他的能力相比一点都不贵,700rmb 一年,是个正经的程序员,差不多也就是 1 天的工资而已。
    ayase252
        13
    ayase252  
       2022-06-23 19:02:47 +08:00 via iPhone
    具体到哪一点违反协议了呢?如果只是不合理的话是没强制力的。
    zwgf
        14
    zwgf  
    OP
       2022-06-23 19:03:17 +08:00
    @idblife
    确实有区别,但是本质都是一样的呀。你看看微信的协议,你在微信上的记录也是属于微信的资产。但这却是不合理。应该给与训练所使用的的代码的作者一些报酬。
    zwgf
        15
    zwgf  
    OP
       2022-06-23 19:06:58 +08:00
    @ayase252
    目前来说 copliot ,github 没有违反协议呀。除非 copliot 训练使用了闭源仓库或者某些开源协议的仓库,但是这个目前没人能考证。就是觉得不合理。是的没有强制力,但是也要争取呀。因为不合理所以需要有人争取呀。

    就像百度网盘限速、微信卖个人信息给广告商,按照百度网盘的协议和微信的协议也都不违反。但是需要有人去争取,让这种不合理的现象不再发生呀。
    zwgf
        16
    zwgf  
    OP
       2022-06-23 19:09:00 +08:00
    @triangle111
    但是他服务提供的是代码呀,难道海底捞就可以不用给菜品供应商结款了吗。海底捞可以价格收贵一些,但菜品供应商的钱还是要结一下的呀。
    Pichai
        17
    Pichai  
       2022-06-23 19:31:37 +08:00
    以后抄袭别人代码的时候可以堂而皇之的说是 GitHub Copilot 推荐的。哈哈哈
    otakustay
        18
    otakustay  
       2022-06-23 19:44:38 +08:00
    @zwgf #5 百度网盘限速本来就说得通啊,有什么不合理的
    JQSM
        19
    JQSM  
       2022-06-23 19:47:20 +08:00   ❤️ 2
    任何人都可以使用 Github 上的开源代码,Copilot 也可以。
    你可以选择是否允许 Copilot 使用你的代码,Copilot 不会未经授权使用。
    你可以选择 Copliot 推荐的代码是否能包含别人的代码片段,如果有版权问题,那也是自己的选择。

    微软也是个大厂了,这种法律问题还是搞得很清楚的。
    RealJacob
        20
    RealJacob  
       2022-06-23 19:50:22 +08:00
    @zwgf 好奇百度网盘限速哪里不合理了? google drive 限容量就合理了?为服务付费不是应该的吗,免费版本的体验就有所限制
    BeautifulSoap
        21
    BeautifulSoap  
       2022-06-23 19:54:33 +08:00 via Android   ❤️ 2
    lz 你这问题太特定于某个问题了,这个问题可以扩展为,扒了网上的公开数据炼丹,然后做成了产品盈利,那么应不应该为这些公开数据的作者付费?
    yoa1q7y
        22
    yoa1q7y  
       2022-06-23 19:56:51 +08:00
    我觉得这个问题很难界定,如果真要给钱,怎么给,给谁好,给多少。

    以我的使用经验,Copliot 给我的代码 99% 是结合我的代码上下文给出的业务代码,也就是说这些建议代码是不通用的,放到别的地方也没有价值。

    换言之,Copliot 没有原封不动的照搬某个人的代码。或许一些通用算法之类的代码是照搬,但是又怎么界定这段代码是属于谁的呢
    icyalala
        23
    icyalala  
       2022-06-23 19:59:06 +08:00
    @icyalala Github 训练的代码,也是流行度高的项目、质量高的项目权重更高吧?
    那些项目的维护者是可以免费使用 Copliot 服务的。
    chocolatesir
        24
    chocolatesir  
       2022-06-23 20:00:13 +08:00 via Android
    是怪怪的,如果加个开关能让用户选择是否提供数据可能会好些。但是你前面举的两个类比的例子不合适,百度云一开始宣传免费大容量不限速让你把文件放上去,干死竞争对手后开始收费,不给钱限速,github 有不给钱不让你正常速度下载自己的代码吗?微信利用用户数据也不能和这个类比吧,你放 github 的开源的代码本来就是公开的,可是微信的个人隐私数据并不是公开的啊。
    Jooooooooo
        25
    Jooooooooo  
       2022-06-23 20:07:12 +08:00
    你给 google 喂数据 google 也不给你钱
    zwgf
        26
    zwgf  
    OP
       2022-06-23 20:21:37 +08:00
    @otakustay 网盘容量限制合理,网速限制不合理。这种营销方式就是让你大量存储,然后想要下载就需要购买 VIP 付费。

    @JQSM
    我没有说他违法,我说的是这样非常不合理。

    @RealJacob
    我的说了服务付费是合理的,问题是你是如何让这变成一个服务或者这个服务是基于什么而来的。如果你存储容量收费我觉得合理。

    @BeautifulSoap
    是的你这个总结的好,我的想法就是这样的。只是刚好看到 Copliot 收费了而感。
    RealJacob
        27
    RealJacob  
       2022-06-23 20:26:09 +08:00
    @zwgf 存储收费和流量速度收费有什么本质的不同呢?为什么你认为存储收费就是合理的,流量速度收费就不合理呢?单纯探讨下
    JQSM
        28
    JQSM  
       2022-06-23 20:27:12 +08:00
    @zwgf 现在大量的收费服务都基于开源代码,不过这属于“不合理”且应该被批评的话,那等于是放弃发展固步自封,也违背了开源的初衷。
    JQSM
        29
    JQSM  
       2022-06-23 20:27:50 +08:00
    不过->如果
    @JQSM
    zwgf
        30
    zwgf  
    OP
       2022-06-23 20:29:21 +08:00
    @yoa1q7y
    不是说照搬的问题,而是作为 AI 公司,训练的数据最终做出的服务是付费的服务,那么这些训练数据是不是也需要给数据的作者一定的报酬,相当于稿费。

    @icyalala
    他训练的绝对有流行度不高的开源仓库,因为我几个月的使用过程中给我推荐了很多小众的代码。那么这些小众代码的作者是不是应该收到一定的费用。

    @chocolatesir
    这本身就是探讨,这些都是不合理的。Github 可以收费,我的意思不是说不让收费,而是如果是一个盈利的项目,应该给予这个项目的贡献者相应的报酬,这应该是正常的事情,难道需要大家去争取才能得到,就不正常了。

    @Jooooooooo
    但是最起码谷歌不向我收费呀
    rabbbit
        31
    rabbbit  
       2022-06-23 20:35:13 +08:00
    想到个问题,假设 Github Copilot 使用了 GPL 协议的代码进行了训练,那么是否有义务向用户提供 Github Copilot 的源码?
    yoa1q7y
        32
    yoa1q7y  
       2022-06-23 20:38:07 +08:00
    我觉得你可以这么理解,把 Copliot 当成一个人,比如小张,小张天天在 GitHub 上看开源代码,日积月累掌握了很多的编程经验和技巧,成为了大神,然后他去开课指导其他人,每人每月 10 美元,那你觉得小张应该把自己的收入分出一部分给他之前看过的代码的作者吗?
    rabbbit
        33
    rabbbit  
       2022-06-23 20:38:07 +08:00
    另外,假如 Github Copilot 的用户使用了来自 GPL 协议的代码片段,那么该项目是否会被 GPL 传染?
    darklights
        34
    darklights  
       2022-06-23 20:38:09 +08:00
    Copliot 只会使用有明确开源协议的项目的代码。大人们只讲法律,如果在法律上没问题,那就没问题。“我觉得”这三个字连 5 毛钱都不值。当然选择是双向的,如果不能接受,不用就是了。

    这几天的类似帖子让我想起一件事:开源中*以前有还有动弹的时候,里边的人言必称开源、自由,时刻为了人类的计算自由摇旗呐喊,彷如 IT 从业人员最后的希望。然后某天 Jetbrains 系 IDE 好像是换了激活方式还是啥的导致白嫖失败,里边的人像是听到珍珠港被炸一样惊慌失措。

    也不是不能理解。毕竟面包吃饱了,才有力气讲理想、喊口号。想免费用,大大方方说出来就是了,何必搞那么多的大道理欺骗自己。
    zwgf
        35
    zwgf  
    OP
       2022-06-23 20:38:38 +08:00
    @RealJacob
    存储容量收费,流量收费我认同。限速不认同。
    你买了个房子,按照房子面积算房子的费用合理吧(存储容量)、按照房子的使用年限算房子的费用也是合理的吧(流量)。那如果按照每天你家大门只能有 2 次进出次数算房子的价格是不是就很别扭?

    @JQSM
    这是代码的使用方式的问题吧,如果我的开源代码是被用做其他的开源项目,没问题呀。如果是用于商业项目也没问题,只要符合我的开源协议。而 Copliot 是把你的代码作为训练的资料数据,而不是他软件本身。而且他是一个商业付费项目,所以我觉得最起码要给一个开关或者给与代码提供者一些报酬。

    @rabbbit
    这里按照我的理解是不需要的,因为 Copilot 本体并不包含 GPL 开源的代码,而是作为训练数据存在的。所以我是认为需要给代码原作者一定的报酬。当然 Copilot 这样做不违法。
    zwgf
        36
    zwgf  
    OP
       2022-06-23 20:45:22 +08:00
    @yoa1q7y
    确实本质是是这样的,确实可以不给作者分。但小张一个人同时最多带 100 个学生,而 Copilot 可以同时带更多的人。那么他的收入更多,从道理上来讲是应该给与原作者一些补偿的。我比较认可罗永浩,最起码他做锤子的时候是给了开源社区回馈的。而国内其他头部互联网公司,很少有真正回馈开源社区的。

    @darklights
    如果你觉得我只是不想让收费的话,那么你私信我,我让你看一下我开的 Jetbrains 订阅和 Copliot 订阅。这点钱还没我炒币亏得多。不至于为了这点钱浪费我的时间。
    2218675712
        37
    2218675712  
       2022-06-23 20:54:19 +08:00
    ![图片]( https://imgur.com/a/Lmro7YY)

    目前可以设置使用哪些代码
    yoa1q7y
        38
    yoa1q7y  
       2022-06-23 21:00:12 +08:00 via iPhone
    @zwgf 不,小张并不是只能带 100 个人,有很多种方式可以扩大输出,比如写收费专栏,出书,开直播,只要小张足够屌,那么他的收入可以非常非常多。
    yoa1q7y
        39
    yoa1q7y  
       2022-06-23 21:02:32 +08:00 via iPhone
    简单说就是,小张卖的是自己的天分和努力; github 卖的是自己的 AI 技术
    SuperMild
        40
    SuperMild  
       2022-06-23 21:05:14 +08:00
    @zwgf

    > 如果按照每天你家大门只能有 2 次进出次数算房子的价格是不是就很别扭?

    只要是事先声明,没有强买强卖,有什么问题?

    (另外,你可能需要找一个有很多人买单的收费规则来举例才比较贴切,你这个举例太脱离现实,参考意义就不大了)
    adoal
        41
    adoal  
       2022-06-23 21:06:14 +08:00 via iPhone
    只有等翟天临博士动嘴才能治得住这种无良商家😄
    icyalala
        42
    icyalala  
       2022-06-23 21:30:33 +08:00
    @zwgf 如果你说要付费的话,所有人都有代码在上面。你只有几个 star 的项目和人家十几万 star 项目比,你觉得应该怎么分?按情分的话你是不是反而应该给人家高质量的项目付些费用呢?你使用 Github 私有仓库,按情分你是不是也该给 Github 付些小费呢?
    zwgf
        43
    zwgf  
    OP
       2022-06-23 21:56:59 +08:00
    @SuperMild
    是的他不违法,只是我觉得不合理

    那就比如去吃饭,吃大碗或者小碗来算费用(存储容量),或者按照碗数量(流量)都看着比较正常。但是如果是按照你吃饭速度来算费用,我是觉得很别扭。当然这不违法只要你情我愿,只要之前说清楚,一点毛病都没有。

    @2218675712
    感谢,我去设置一下

    @yoa1q7y
    嗯小张干不过 AI 是没有争议的,但小张确实可以做的非常大。这里面我觉得问题的点在,对于 Copliot 来说,这些代码算是他的主体部分,还是他的一种数据形式。我是更偏向于属于他的数据形式,所以认为需要付费。就像小张出生下来只给他看 github 他一定不可能开班授课,因为小张在可以吸收 github 上知识之前已经在数据上付费了(上学交学费,买书交书费等等)

    @icyalala
    这确实是一个问题,但是我觉得不影响讨论这件事。因为我觉得将来 AI 替代人类的地方会越来越多,这种事例也会越来越多,那么如何定义机器学习用到的数据是否需要给原数据人报酬。
    ltkun
        44
    ltkun  
       2022-06-23 21:57:05 +08:00 via Android
    谷歌 photo 和苹果 icloud 拿来深度学习给用户免费了吗
    Vegetable
        45
    Vegetable  
       2022-06-23 22:11:49 +08:00
    我和同事探讨了一下这个问题。做了一个类比,觉得还挺贴切。

    假如我开了一个劳务派遣公司,雇了若干个勤奋的应届生。给他们 3 年时间不干别的,就是天天背 Github 上的开源项目代码。
    三年之后让他们组成一个团队,专门和别人结对编程,每个月收费 100 块钱。请问我这 100 块钱,应该拿出一部分反哺开源项目吗?

    我觉得可以,但没必要。
    pengtdyd
        46
    pengtdyd  
       2022-06-23 22:14:51 +08:00
    说的好像你的 QQ 号就属于你似的。
    whileFalse
        47
    whileFalse  
       2022-06-23 22:15:58 +08:00
    @zwgf 你觉得不合理你可以不用。用户用脚投票,导致百度网盘没有用户,导致百度网盘反思自己的策略,然后更改策略这才合理。

    任何一个产品都不能满足所有用户的需求。他只要满足特定用户的需求就行了,比如一个喜欢上传但通常不下载的用户。说白了我觉得合理,开发者也觉得合理,你觉得不合理 你算哪根葱啊。
    SuperMild
        48
    SuperMild  
       2022-06-23 22:20:12 +08:00
    @zwgf

    > 如果是按照你吃饭速度来算费用,我是觉得很别扭。

    我很不理解,这为什么会别扭,我认为这种计算方法对消费者有益,对商家反而不利,消费者不仅不会觉得别扭,应该非常开心才对。

    比如一家饭店写明:吃饭速度 1 级(快)收费 10 元,2 级(慢)收费 20 元。(具体份量不重要,我不细写了)

    那么,吃得慢的人不去吃,毫无损失,而吃得快的人纷纷去吃,便宜量大。有何不好?

    现实中就有餐厅试过搞大胃王活动,规定时间内吃完一定份量就可以免单,并未引起社会不满。
    SunsetShimmer
        49
    SunsetShimmer  
       2022-06-23 22:43:46 +08:00
    我认为 Copilot 不能和人类类比。它是个基于人工智能的商业产品,这意味着它不能被等效成人类的劳动。Copilot 间接上出售的是算力,它通过*我没弄懂的某种算法*根据用户输入和参考信息(即被“学习”的开源代码)经过计算输出补全代码。

    这个问题可以抽象成:非商业开源协议授权的代码是否允许被用于基于人工智能的间接商业化使用?这是个全新的领域,业界也尚未有定论或是标准(例如假设 Repo 里放个 robots.txt 禁止任何形式的 AI“学习”)。记得比较相似的是虚幻引擎源码不允许直接引用但可以学习技术并重新实现一遍。
    vocaloid
        50
    vocaloid  
       2022-06-23 23:28:49 +08:00
    我也觉得,这些开源代码应该都有不一样的开源协议,如果有的开源协议禁止了 github 进行分析代码但是它依旧分析了不知道会如何
    Death
        51
    Death  
       2022-06-24 00:07:39 +08:00
    RealJacob
        52
    RealJacob  
       2022-06-24 00:27:47 +08:00 via iPhone
    @zwgf 拿服务去类比房子可真有你的。这不就是你自己的一厢情愿么,其实对于 saas 产品来说,无论是百度网盘这种还是 google 网盘这种,都只是对普通用户的限制,并没有哪个更好哪个更差,只是产品的选择罢了。因为这都不是你必须要用的东西,没人逼着你用啊,免费用户甚至什么都不用付出。
    你觉得限制容量更好,有网速不敏感的人觉得限制网速比限制容量更好。归根结底都是限制的免费用户的体验,告诉你交钱可以提升体验。
    视频网站限制非会员看高清不是一个道理么,你有足够的网速看高清蓝光,不代表人家就要给你提供最好的服务啊
    jhdxr
        53
    jhdxr  
       2022-06-24 02:17:05 +08:00
    『不是说照搬的问题,而是作为 AI 公司,训练的数据最终做出的服务是付费的服务,那么这些训练数据是不是也需要给数据的作者一定的报酬,相当于稿费。』

    => 直接回答,不是。先把 copilot 放一边。一般很多 AI task 都有公开的数据集,但从没听说过啥收费之类的限制。( kaggle 上一些比赛可能会限制数据集的使用,但这在我这就不算公开数据集了)。有些数据集是作者原创的(比如自己拍的视频),那版权界定应该没有争议。那如果是收集现有资料呢?我第一个想到的是 NLP 里各种爬维基去生成的数据集。至少到目前为止,实践上也并没有听说过相关的侵权纠纷。

    回归到 copilot ,目前明确是基于开源的代码去进行的训练,主流的开源协议据我所知没有一个禁止了自己成为数据集的一部分(倒不如说,如果真这么限定,那就违背了开源时自由的本意)。基于这个去训练模型乃至商业化我不认为有任何问题。潜在的风险是如果模型(在你不知情的情况下)给了一些比如 GPL 的代码,是否会传染到你自己的整个代码库,这个我认为是有争议的。( copilot 目前是把这个责任全部推给了用户——我能理解但持保留态度)


    『这就像你在视觉中国买了一张图片,然后发现视觉中国对这张图片没有任何权利。』
    『然后 Copilot 就可以免费白嫖这些代码,不需要给代码作者费用。这就像你写了一本小说,然后被人拿去改拍电影,不需要给你费用一样。』
    再具体反驳一下这些例子。1. 当你写完代码的时候,的确如小说那样,你是有版权的。但当你选择开源协议进行了授权,你就放弃了部分权益。至少,别人去使用你的代码不需要给你钱这一点,无论是否提供商业化服务,主流的开源协议都是如此规定的。2. 如果视觉中国在卖你这个照片的时候已经明确告诉你了,这张照片来自于共有领域,但你从我这买依然是要付钱的,那我不认为这个行为有任何问题。

    『这些代码被作为 AI 的数据的时候,这些数据本身就是价值,是需要给与原数据作者费用的。』
    最后再强调一次,当你选择了开源协议的时候,你就放弃了部分权利!!! V2EX 上已经不是第一次出现开源者看到别人拿自己的代码去做商业化就出来发帖开喷了。如果不想这种情况发生,请不要开源。
    jhdxr
        54
    jhdxr  
       2022-06-24 02:20:40 +08:00
    @vocaloid 目前 github 有答复,它并没有考虑具体的 license 。

    但如果真的限制这一方面的使用,我会质疑这是否依然符合开源软件的定义。
    Open source licenses are licenses that comply with the Open Source Definition — in brief, they allow software to be freely used, modified, and shared.
    ref: https://opensource.org/licenses

    限制特定用途,我认为明显不符合『 freely used 』
    1423
        55
    1423  
       2022-06-24 02:36:42 +08:00   ❤️ 2
    拿用户数据训练模型是很早就有的商业模式底层了。最早一般都是生成个性化广告
    这些典型场景都是以用户隐私数据为 input ,output 为厂家内部数据,比如标签集合,整体是个黑盒
    也有“熊猫吃短信”这种,output 是过滤与否的逻辑

    github 这次最主要的争议是模型的 input 和 output 是同构的内容,也就是从代码到代码
    GitHub Copilot 这么做,个人觉得影响深远,相信以后会有更加高层次的讨论
    WuSiYu
        56
    WuSiYu  
       2022-06-24 04:34:53 +08:00
    Copilot 这玩意本来一开始就有争议,比如它学了 GPL 的代码,然后被用来写一些别的协议的软件或者商业软件,这样看上去并不道德。同样的,对于一些版权敏感的需要 clean room 的项目,应该也是不能用 Copilot 的
    sardina
        57
    sardina  
       2022-06-24 07:04:24 +08:00 via iPhone
    大型开源项目是免费的
    www5070504
        58
    www5070504  
       2022-06-24 09:35:54 +08:00
    2202 年了怎么还有这么多人认为免费=无责?
    neptuno
        59
    neptuno  
       2022-06-24 09:53:07 +08:00
    你读了别人免费的小说,然后自己文笔好了很多,自己写小说卖钱了,你会给那本免费小说作者钱吗?
    pkoukk
        60
    pkoukk  
       2022-06-24 10:06:37 +08:00
    1 、被他采用了代码的项目作者可以免费试用,而且本来就是开源代码,多少家公司的代码里有开源库,也没见他们给过钱。
    2 、前两天提示收费的时候,让你去 github 设置自己的使用 preference 才能继续用了啊,上面可以取消勾选,不允许它学习你的代码
    zwgf
        61
    zwgf  
    OP
       2022-06-24 10:45:48 +08:00
    @Vegetable
    @SuperMild
    我觉得 copilot 目前来说很难找到一个合适的比喻,因为这是一种新的事物。可能对也可能错。网络上数据是有价值的,至于数据是不是需要付费,让子弹再飞一会吧。

    @whileFalse
    用户用脚投票是有延迟的,在用脚投票前,我觉得还是可以先探讨一下的

    @SunsetShimmer
    @vocaloid
    按照你们两个的思路目前确实问题又回到了开源协议上来。

    @RealJacob
    我是一个付费主义者,我认为免费是最贵的,不只是 CtoB 付费,BtoC 也应该按照对应的价值付费。这才是良性的商业环境。我用京东,京东购买后优质的评价是可以得到京豆的,这就是 BtoC 付费的一种现象。

    @jhdxr
    感谢,我还有一个问题,代码被作为数据集,和开源协议诞生,这两件事情如果代码被作为数据集先诞生的话,那么我这里就没有疑问了。如果是先有了开源协议,再有了拿代码作为数据集,那么我觉得还是值得探讨的。
    shunia
        62
    shunia  
       2022-06-24 12:36:52 +08:00
    我甚至以为第一句就要说知网
    learningman
        63
    learningman  
       2022-06-24 12:49:49 +08:00
    你开源的时候 LICENSE 已经把这个权利给出去了,而且你在 GitHub 上公开本身就有一个 GitHub 的附加 LICENSE
    MrYELiex
        64
    MrYELiex  
       2022-06-24 13:25:50 +08:00
    > If you are a student, or a maintainer of a popular open source project on GitHub, you may be eligible for a free GitHub Copilot subscription. If you are not eligible for a free subscription, a paid subscription is available.

    不给你免费订阅大概是因为你的代码不够有价值
    micean
        65
    micean  
       2022-06-24 14:09:19 +08:00
    至少 github 是免费的,我付钱玩 wow ,数据也不属于我。
    12101111
        66
    12101111  
       2022-06-24 14:53:47 +08:00   ❤️ 2
    GitHub Copilot 会吐出专有代码.
    https://twitter.com/ChrisGr93091552/status/1539731632931803137

    我觉得这个推文说的很好, 如果人类看了一篇文章, 然后洗稿后发表, 属于对原文章版权的侵害, 那么人工智能做同样的事情也属于侵害版权.
    https://twitter.com/marcan42/status/1539825034860335105

    需要注意的是, 即使是非专有代码、GPL 代码, 大多数开源协议也需要署名, 而 GitHub Copilot 并不知道如何署名.
    luvsic
        67
    luvsic  
       2022-06-24 16:31:14 +08:00
    因为这些代码的开源协议没有限制商业使用,copilot 给个 credit 就不错了。从法律角度完全不需要付费给开源代码的作者
    如果你是 Copilot 的用户,你签了协议,Copilot 才会使用你的代码训练。
    est
        68
    est  
       2022-06-24 16:39:27 +08:00
    别的不知道,有些开源许可证是鼓励贩卖开源软件的。比如 GNU

    https://www.gnu.org/philosophy/selling.en.html

    只要你卖的时候不影响开放源代码,那么这是被许可的。比如 Redhat 就是贩卖 GNU 代码的一个厂商。
    cheng6563
        69
    cheng6563  
       2022-06-24 17:00:03 +08:00
    假如 Copilot 不是 github 开发的,你还会有这问题吗?
    dbskcnc
        70
    dbskcnc  
       2022-06-24 17:23:12 +08:00
    训练数据可以卖钱,这是没错的,可是有公开,免费的数据,你也可以不用付钱,这就是目前 ai 的现状。
    从法律上看,只有针对这种情况附加条款,毕竟开源协议就没针对钱这个事,关注点不一样。
    xiaogezz
        71
    xiaogezz  
       2022-06-24 20:32:22 +08:00 via iPhone
    谷歌还用验证码让你帮他训练 ai 呢
    xux9311
        72
    xux9311  
       2022-06-24 21:23:27 +08:00
    特斯拉直呼内行
    zachlhb
        73
    zachlhb  
       2022-06-25 14:13:16 +08:00 via iPhone
    copilot 只用开源仓库代码吧,我记得看过不使用私有仓库的
    uyoungco
        74
    uyoungco  
       2022-06-27 17:18:26 +08:00
    企查查 天眼查?
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2700 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 28ms · UTC 12:42 · PVG 20:42 · LAX 04:42 · JFK 07:42
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.