只需与 ProgPow 和 Ethash 算法有关,商场上就会呈现各种对矿机硬件规划和开发本钱的估测,一般后边还会跟上一个威望声明:请信任宣布猜测的作者,由于他/她在相关职业范畴里具有丰厚经历。这些估测有时会与加密钱银 ASIC 芯片出产有关,还有些时分则是关于集成电路规划。
关于那些更了解代码、却不太了解扇出(fan-out)和上升时刻(rise-times)的读者来说,本文或许会对他们深化了解 ProgPow 算法有所协助。
(星球君 o-daily 注:Ethash 是现在以太坊根据作业量证明的挖矿一致算法,ProgPow 是一个企图削弱 ASIC 矿机优势的挖矿算法。扇出是一个界说单个逻辑门可以驱动的数字信号输入最许多的专业术语。大多数的 TTL 逻辑门可以为 10 个其他数字门或驱动器供给信号,因而一个典型的 TTL 逻辑门有 10 个扇出信号;上升时刻是脉冲技能里的一个专业名词,电压上升两个时刻的时刻距离便是网络变压器的上升时刻。)
程序员总是会给人一种无所不能的感觉,从编写脚本到开发 iPhone APP,从嵌入式体系到 Windows 操作体系。可是,会写代码开发运用程序不代表你能成为 APP Store 运用商铺后端(或改进体系功率)的威望人士,可以开发实时多任务操作体系(RTOS)也不代表你能成为扩展 Windows 操作体系本钱权衡范畴里的达人。
当然,作为 ProgPow 算法中心开发团队,IfDefElse 在此并不是说 Windows 规划师不是“优异的程序员”,但有必要要阐明的是,由于不同人的技能布景不同,很简略形成对不同范畴的了解和假定误差,特别是在评论规划经济论题的时分。
相同地,一名硬件规划师或许也会涉猎不同的范畴,比方为一款电动牙刷规划芯片,或是为网络设备构建一个芯片架构(silicon architect)。出产 10 万个电动家牙刷芯片的工程师或许不会了解出产 100 万个芯片的网络工程师所考虑的可用规划经济,相同一个加密钱银 ASIC 芯片规划师或许对 GPU-ASIC 芯片规划知之甚少——这些职业彼此之间的联络并不是许多,有的乃至是国与国之间的距离。
在概述中咱们还要提的最终一点,便是编程和工程其实都是一种技巧,除非你每天都在编程写代码,不然很快就会落后、无法成为威望,由于这方面的常识更新迭代很快。或许这也是为什么新的加密钱银 ASIC 制作商很难进入根据 SHA-256 算法的挖矿商场,究竟一个新手程序员想要赶超现已研讨 SHA-256 算法六年的工程师是不太或许的。
另一方面,加密钱银生态体系里其实并没有太多文章介绍硬件常识。当然,加密钱银自身便是一个以软件为主导的职业,并且绝大多数硬件工程都是在一些私家公司内部“闭门”研讨的。
有些“硬件砖家”正在尽心竭力向软件工程师确保他们可以打败加密钱银生态体系——咱们现已在门罗币(Monero)、比特币(Bitcoin)、以及 ZCash 等加密钱银上看到了这种状况现已呈现。但实践是,这种应战至今仍没有发生,想想看,假如比特大陆或 Innosilicon 企图制作 CPU,你认为他们可以打败英特尔和 AMD 吗?
规划经济总是普遍存在的——不管是从本钱视点,仍是经历视点。关于 ASIC 芯片规划本钱, 芯片规划师们好像总是存在很大争辩,下面就让星球君(微信:o-daily)带咱们一同看看解析一下遭到业界重视的九个问题:
现阶段,ETHash 挖矿更有利可图,针对该算法的内存需求明显添加,关于高带宽存储器的需求不断添加也促进下一代高速存储器技能被开发了出来,比方 GDDR6(带宽速度到达 768 GB/s) 和 HMB2(带宽速度到达 256 GB/s)。
关于高带宽内存的需求并非悉数来自“Ethash”,整个高带宽内存商场规划高达 150 亿美元,其间只需很少一部分来自采矿职业。高带宽内存的中心商场需求首要包含:GPU、现场可编程门阵列(FPGA)、人工智能(AI)、高功能核算(HPC)、以及游戏。比较于 1.2 万亿美元的人工智能商场、300 亿美元的 PC 游戏商场、350 亿美元的手持游戏机商场、以及 290 亿美元的高功能核算商场,挖矿职业的高带宽内存需求真的是“微乎其微”。
现实上,ProgPow 和 ETHash 之间仅有的相似之处便是在大局内存(global memory)中运用了无环图(DAG)。从核算的视点来看,ETHash 只需求一个固定的“keccak_f1600”内核和一个模数函数(modulo function)。另一方面,ProgPow 需求的则是可以履行 16 通道宽的随机数学序列,一起还要可以拜访高带宽一级缓存(L1 cache)。规划一个可以履行 ProgPow 数学序列的核算内核,比规划一个可以完结相似“keccak”这样的固定函数哈希要难得多。
别的需求留意的是,ETHash 的哈希值只取决于内存带宽,而 ProgPow 算规律一起取决于内存带宽和随机数学序列的中心核算——了解这一点十分重要。
作业量证明(PoW)的实质其实是通过消耗硬件和动力本钱进行数学核算证明,作为一种算法,ETHash 在数学证明中并不会消耗大部分硬件费用(核算引擎)。相反,ETHash 只捕获内存接口,这便是为什么你可以运用一个用于加密钱银挖矿的 ASIC 芯片来把数学核算中没有被捕获到的部分给消减掉。
ProgPoW 期望可以捕获悉数硬件本钱(尽或许地做到),由于该算法更新的部分可以捕获运转不同核算场景的核算硬件——直到架构褶皱(architectural wrinkles)——因而关于 ASIC 芯片规划来说,或许需求消耗不止 3-4 个月的时刻。
由于时刻跨度较长,随之会引宣布另一个问题:为什么浮点运算(floating point operation)被省掉掉了?这个问题的答案其实也十分简略:浮点运算不能跨芯片移植,不同芯片往往会以不同方法来处理与特别值(比方下确界、非数字数值、以及相关变体等)相关的鸿沟事例(corner case)。边角事例也被成为病态事例(pathological case),是指其操作参数在正常规划以外的问题或是景象,并且多半是几个环境变数或是条件都在极点值的景象,即使这些极点值都还在参数规范规划内(或是鸿沟)。其间最大的不合在于非数字数值(NaN)的处理,这会在运用随机输入时自然发生,引证页面的解说:
假如有多个非数字数值(NaN)输入,其有用负载成果应该来自其间一个非数字数值输入,但规范却没有详细阐明。
这意味着,假如要运用浮点运算的话,基本上每个浮点都需求进行“if(is_special(val))val = 0.0”查看配对,这种查看一般可以在硬件中完结,因而也会让用于加密钱银挖矿的 ASIC 芯片从中获益。
哈希率是衡量动力本钱的目标,只需每个人都以相同的方法进行衡量,每单位的动力消耗就不那么重要——矿工也会持续投入尽或许多的动力挖矿。不过即使你把丈量单位从 1 ETHash (较小单位,比方焦耳)切换成 1 ProgPow-hash(较大单位,比方卡路里),运营本钱的经济性其实也不会发生改变。大局哈希率(Global Hashrate)会评价每个人对保护网络共享的总经济权重,只需每个人的奉献都被公平地衡量且运用相同的单位,关于一般矿工来说,切换到 ProgPow 算法不会带来什么改变。
当然,有人会说假如以太坊施行了 ProgPow 算法或许会有助于把矿工会集在具有高端 GPU 的大矿场里,一起也会影响矿场把 GPU 升级到最新类型。可是ProgPow 算法开发团队 IfDefElse 需求再次重申的是:规划经济永久都会存在,并且也是实践国际里无法防止的现实。
首要,具有两倍的带宽优势就需求两倍的核算,这其实是一种线性扩容(linear scaling),并不能看做是一种优势。
其次,咱们现在应该还没有为 GDDR6 预备好出产 4GB 内存芯片的预备。全球第三大内存芯片厂商 Micron(美国美光)只出产 8GB 芯片,三星则出产 8 GB和 16 GB芯片。关于内存芯片而言,GDDR6 IO 接口区域是十分贵重的,并且与存储器单元比较,每一代接口都占用了更多的实践存储器管芯,由于端口物理层(PHY)不能像存储器单元那样通过工艺手法缩小。
不行否认,真实推进内存商场的是一些“长周期买家”,比方游戏机、GPU 等,他们也倾向于支撑容量更大的内存。现实上,现在的内存供货商没有动力去大批量出产一个 4GB 的内存,究竟商场对这种内存容量的需求并不大。
RTX2080 不是评论这个问题的好参照物,由于一些新功用,英伟达(Nvidia)的 RTX 系列芯片中有些模块占有了大部分芯片模片区面积,比方光线追寻中心等。ProgPow 规划则是与英伟达和 AMD 生态体系中的存量芯片产品调配运用的,因而无法运用英伟达和 AMD 新款芯片产品中的新功用。
假如想有一个更好类比的话,或许 AMD RX 5xx 系列或是英伟达 GTX 1xxx 系列是个不错的参照。正如咱们之前所述,GPU 中也有部分功用没有被 ProgPow 使用,比方:浮点逻辑、二级(L2)缓存、以及纹路缓存和 ROP 等。分片单元是向量数学被履行的当地,这肯定是 ProgPow 所要求的。用于加密钱银发掘的 ASIC 芯片还期望添加可以完结“keccak”功用的区域。作为ProgPow 算法的开发团队,咱们估量 ProgPow ASIC 芯片的模片区面积会比平等 GPU 小 30%——可是,即使是在最好的状况下,其功耗最多也只会下降 20%。比较之下,尽管 GPU 上有些逻辑模块没有被充沛运用而形成部分芯片模片区面积糟蹋,但功耗却是最小的。
怎么说好呢,这听上去像是在遍及芯片制作常识,或许咱们需求写一篇《芯片制作 101》的训练文档。此外,关于收益核算公式可以参阅一篇 2006 年宣布的文章《Compare Logic-Array To ASIC-Chip Cost per Good Die》,其间你会发现,早在 13 年之前芯片收益和流程操控就现已有很大立异了。
关于具有单个功用单元的芯片,模片区面积较小的芯片收益会比模片区面积较大的芯片更高。可是关于现代 GPU 来说,状况并非如此。现在的 GPU 简直可以恣意康复、组合,小型仿制单元的缺点基本上可以疏忽。只需每个可压缩功用单元满足小,那么 GPU 芯片收益简直可以和功用模块更大的芯片相同高(乃至更高)。
1、假定你有一个大芯片“Giant ChipA”,它占有了整个晶片。这个“Giant ChipA”是由 10 万个可拆卸子组件组成,可是其间有必要确保 80% 的子组件是无缺点的,才干确保“Giant ChipA”正常作业,而在嵌入过程中,坏的子组件会被绕过。
2、别的,假定你还有一个小芯片“Tiny ChipB”,它只需一个功用模块(不行嵌入)组成,可是这个小芯片却小到足以在同一个晶片上安装 10 万个子组件。在这种状况下,只需一个子组件坏了,意味着整个“Tiny ChipB”芯片便是坏的。
3、假如每个晶片上均匀散布了 2 万个有缺点的子组件,那么“Giant ChipA”的收益可以为 100%,由于他们可以将 20% 有缺点的子组件拆掉,而“Tiny ChipB”的收益或许仅为 80%,由于他们无法拆掉有缺点的子组件。
假如你看看 AMD 的 Polaris 20 系列产品和英伟达的 GP 104 产品,会在模仿镜头下发现这些 GPU 中布置了许多细小的“可拆卸”子模块组成。
当芯片仅由核算构成,那么低电压规划才干见效,比方一个专门针对 SHA256d 挖矿算法核算的 ASIC 矿机。集成其他原件——比方 SRAM,这也是 ProgPow 数据缓存所必需的——的难度极大,也不或许在低电压下作业。
不能仅考虑能耗问题,LPDDR4x 的带宽比 GDDR6 低许多,前者每个引脚带宽是 4.2Gb / s,后者则是 16Gb / s。LPDDR4x 核算芯片上需求四倍的内存芯片和四倍的内存接口才干到达 GDDR6 相同的功能,这样一算,其本钱其实是明显添加的。
值得留意的是,高带宽核算芯片的接口一般是有限的,这意味着芯片模块面积有必要要满足大,周边简直不允许任何信号从芯片脱落到印制电路板(PCB)上,LPDDR4x 规划需求大约四倍的芯片周长焊盘数才干到达相同的带宽,也便是说,其本钱不只仅在存储芯片上,核算芯片区域的本钱相同也要核算在里面,所以归纳算下来其实总本钱并不低。更糟糕的是,由于任何芯片都是以速度为导向的,当芯片模块面积更大的时分,意味着糟蹋的功率也会更多。
所以,无妨让咱们再想想为什么现在的 GPU 不能再 LPDDR4x 上运转。首要,LPDDR4x 在带宽本钱上的体现并不尽善尽美,关于给定的带宽量级(芯片数量的四倍),LPDDR4x的本钱要高出四倍以上,继而导致本钱明显添加——LPDDR4x 在 9W 功率时 256 GB/s 带宽的本钱约为 150 美元,比较之下 GDDR6 在 11W 功率时相同带宽本钱还不到 40 美元,因而 LPDDR4x 并没有让矿工省到什么钱(留意,这儿说的是带宽本钱,而不是内存容量本钱)。
问题九:像英伟达这样的 GPU 出产商雇佣了大约 8000 人来开发 GPU,这些 GPU 也十分复杂;而像 LinZhi 这样的 ASIC 出产商只雇佣了十几个人,并且只开发用于 ETHash 挖矿算法的 ASIC 矿机。这些公司的劳动力本钱相差 100 被,因而可不可以说 ASIC 芯片在本钱和上市时刻方面比 GPU 芯片更具优势。
在此要说的是,规划经济是一个重要因素。GPU 职业也是在全球各种出售途径中摊销,现在总商场规划大约为 4200 亿美元,其间 AMD 市值约为 116 亿美元,英伟达约为 1545 亿美元,最大的英特尔约为 2548 亿美元。仅就内存商场而言,还需求在这个总规划到达 5000 亿美元的职业里分摊物理端口(PHY)和晶片的本钱,其间具有 320,671 名职工的三星电子市值约为 3259 亿美元,他们也是在美国最活泼的专利申请者;第二名是具有 34,100 名职工的Micron Technology,其市值约为 601 亿美元,可是第一个开宣布 20Gbps 高速 GDDR6 内存的芯片制作商;海力士具有 187,903 名职工,市值约为 568 亿美元,他们开发了全球首款1Ynm 16Gb DDR5 DRAM。比较之下,用于加密钱银挖矿的 ASIC 芯片职业总市值不过 1460 亿美元,其间 730 亿归于比特币。
别的咱们还要看看上市时刻和技能承受模型(TAM),在此无妨以闻名的 S9 矿机继任者开发时刻作为参阅。假如通过充沛研制、并且核算难度不是很高的 SHA256d 算法核算芯片都需求消耗三年时刻才干进行迭代,那么又有什么可以确保像 GPU 相同的、支撑 ProgPow 算法的 ASIC 矿机快速投产上市呢?咱们还可以剖析一下最近发掘以太坊加密钱银的 ASIC 矿机状况,GDDR6 芯片样品试用期现已有一年时刻了,到现在依然没有发布可以被广泛运用的新版本产品。
ProgPow 其实针对是一种挖矿硬件,这种硬件遭到了规划经济的支撑,具有高可见性并获得了较大竞赛优势。
ProgPow 中心开发团队 IfDefElse 规划并不大,并且团队成员也都有全职作业,所以他们无法及时回复一切问题和文章,更没时刻在各种加密钱银和区块链线上论坛里滔滔不绝。尽管 IfDefElse 对硬件规划和开发十分感兴趣,但他们依然主张进入这一范畴的人需求坚持慎重,由于硬件和软件相同,是一个多元化的范畴,即使你是一个对加密钱银挖矿 ASIC 芯片十分了解的大咖,但在 GPU-ASIC 范畴里或许无法成为一个专家。
星球日报 四城将用央行数字钱银发放薪酬;FCoin或于6月重启,考虑申述前期投资者
BTC周报 750亿美元对冲基金获批买卖BTC期货;《富爸爸,穷爸爸》作者力荐比特币(4.13-4.19)
36氪首发 「大白互联」获千万等级Pre-A轮融资,加快可信身份认证(CTID)运用落地
“未来公司将加大力度探究可信身份认证与职业运用需求之间的深度结合点,如交通运输、政务民生、服务认证、金融理财等方面,尽力将可信身份认证的服务价值发挥到最大化”