V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
Hoshinokozo
V2EX  ›  Apple

关于 M1,这篇文章做了比较详尽的解释

  •  5
     
  •   Hoshinokozo · 2020-11-19 14:40:13 +08:00 · 14805 次点击
    这是一个创建于 1442 天前的主题,其中的信息可能已经有所发展或是发生改变。

    https://www.zhihu.com/question/429725810/answer/1570340259

    以我有限的知识,整篇文章读下来,一句话总结:M1 是牺牲了 CPU 的灵活性(通用性能)换取了一部分领域的高性能,具体表现为以下几点:

    • 超宽执行架构,加上短流水线,IPC 远强于窄架构的 X86,单核性能爆炸
    • 片上内存( UMA ),内存带宽和延迟相较于板载双通道均有相当优势
    • 多种相对独立的专用处理单元:如图像处理、视频编解码、音频处理、加密解密等,相比 CPU 软解就是降维打击

    相对地,M1 缺点如下:
  • 超宽执行架构是的 M1 的每个核心晶体管消耗量远大于 X86,加上各种专用单元,8 核的 M1 就已经堆了 16B 的晶体管,即使是 5nm 也快到极限了,所以 M1 架构堆核的成本远高于 X86,在遇到吃多核性能,且 M1 的各种加速单元都不顶用的通用计算场景时,会被多核 X86 暴打( AMD YES )

  • 片上内存( UMA )带来了大内存带宽和低延迟,但是无法单独扩展,只能整个 SOC 一起换,目前 M1 最大只支持 16G 内存,这对于一些对大内存有刚性需求的用户来说基本等于告别了

  • 大量加速单元使用了固化硬件电路,若未来业界对某项功能处理使用了新算法的话,要么重新设计新架构,要么就只能靠 CPU 来算了
  • 107 条回复    2020-11-20 16:46:19 +08:00
    1  2  
    casioyan
        101
    casioyan  
       2020-11-20 00:00:31 +08:00 via iPad
    @Hoshinokozo Intel 上大小核即便提升了很多 IPC,只怕也不能 instant on 。我见过在 ThinkPad X1 Carbon 上,是有个设置选项的,是否在晚上闲置时关闭 instant on 功能以省电。现在 14nm 待机功耗太糟糕了。。。
    sujin190
        102
    sujin190  
       2020-11-20 00:02:13 +08:00
    @denvi #99 对头,对消费品领域来说这个设计不要太棒,这事估计也只有 apple 能首先做出来了,但是一旦 apple 做处理了,就会大大降低其他人的门槛,因为这事大家都知道很靠谱,一旦有第一个做出来了其他人跟进就大大降低难度了,毕竟这只是个方案革新,所使用的底层技术无论 amd 还是 intl 都干的出来,所以威胁 intl 和 amd 地位一说我觉得有点不靠谱,更不靠谱的是基于此认定 ARM 会全面侵占 x86 市场在各领域都取得良好效果,毕竟说来说去消费品领域只是看着牛逼其实场景很窄,更别说还是个人笔记本电脑这种窄到不行的场景了,出货量大和场景广毕竟不是一回事
    xy90321
        103
    xy90321  
       2020-11-20 00:17:42 +08:00
    一本正经胡说八道?还通用计算专用单元芸芸...
    按照这个说法牙膏厂处理器里集成的 AVX 是不是也可以理解为 AVX 指令的专用运算单元?
    以前所谓的通用专用,是针对小芯片,例如 encoder 或者 decoder 这类执行特定任务的单一功能芯片来说的
    要真的是追求通用的话,x86 们还搞毛线 MMX/SSE/AVX 指令集加速?
    就与非门一路算到底就是了啊,不是要通用吗?
    gaayyy
        104
    gaayyy  
       2020-11-20 00:57:23 +08:00
    @Hoshinokozo #84 你从哪里了解到台积电的工艺很难优化的?或者从哪些地方推导出的结论?


    <br>

    以 7nm 的 FinFET 为例,从最早使用 DUV 曝光的 N7 工艺,到首次引入 EUV 的 N7+工艺,然后继续在 DUV 基础上改进的 N7P 工艺,再到尺寸进一步缩小的 N6 工艺。光这一个节点就至少进行了四次大的优化。每种优化对应不同的场景,有的是针对高频 Performance,有的是进一步减小漏电流,降低能耗。

    拉高主频不仅仅是与工艺相关,Intel 在 NetBurst 架构上就做过这种愚蠢的尝试,为了提高主频,大幅增加流水线级数,就为了高主频这一个数字好看,结果实际使用中,碰到分支预测失败,清空流水线,效率一塌糊涂。第一代 Pentium 4 是技术上的失败,营销上的胜利。因此不能单靠是否能够拉高主频来判断半导体工艺的优劣。

    Intel 的 IDM 模式已经证明失败了,自己现在都在考虑外包或者将所有 fab 打包,整个制造和工艺相关业务 spin-off 出去。
    denvi
        105
    denvi  
       2020-11-20 08:01:15 +08:00 via iPhone
    @gaayyy 求 intel 卖厂的信息源
    kaneyuki
        106
    kaneyuki  
       2020-11-20 12:23:04 +08:00
    可以理解为软硬件闭环的威力
    winglight2016
        107
    winglight2016  
       2020-11-20 16:46:19 +08:00
    @denvi 你在说 intel 没上市的下一代芯片性能已经超过 AMD ?你是 intel 内部工程师,还是拿到了工程芯片测试过了?如果上市产品的差距在百分之一二十还有可能反超一把,现实是 AMD 在各种产品线都超过 intel 百分之三四十的性能,你还期待落后了一代的 10nm 芯片能够反超 AMD 的 7nm 芯片?

    最后说一句,芯片正式上市的意思就是大规模出货,反之就是没上市,没上市的产品有什么好比的,比较 PPT 吗?
    1  2  
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2004 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 32ms · UTC 00:01 · PVG 08:01 · LAX 17:01 · JFK 20:01
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.