深度解析链抽象关键要素 (CAKE) 框架
原文作者:
原文编译:深潮 TechFlow
要点总结
-
目前默认的加密用户体验是让用户始终知道他们正在与哪个网络交互。然而,互联网用户无需知道他们正在与哪个云提供商交互。将这种方法引入区块链就是我们所说的链抽象 (Chain Abstraction)。
-
本文介绍了链抽象关键要素 (CAKE) 框架。该框架由应用层、权限层、求解器层和结算层四部分组成,旨在为用户提供无缝的跨链操作体验。
-
实现链抽象需要一套复杂的技术,以确保执行过程的可靠性、成本效益、安全性、速度和隐私。
-
我们将链抽象中的跨链权衡定义为三难困境,并提出了六种设计方案,每种方案都具有其独特的优势。
-
为了成功实现向链式抽象未来的飞跃,作为一个行业,我们必须为 CAKE 各层之间的信息传递定义并采用一个通用标准。一个好的标准是锦上添花的。
简介
2020 年,以太坊网络过渡到以 。四年后,已有超过 50 个 rollup 层(L2)投入使用。虽然 rollup 层提供了所需的横向扩展,。
用户不应关心或了解他们正在与哪个 rollup 进行交互。加密用户知道他们在使用哪个 rollup(Optimism 或 Base),相当于 Web2 用户知道他们在使用哪个云提供商(AWS 或 GCP)。链抽象 (Chain Abstraction) 的愿景是将链信息从用户视野中抽象出来。用户只需将钱包连接到 dApp 并签署预期操作,确保用户在目标链上拥有正确余额并执行预期操作的细节都在幕后进行。
在本文中,我们将探讨链抽象是一个真正的多学科问题,涉及应用层、权限层、求解器(Solver)层和结算层的交互。我们介绍链抽象关键要素 (CAKE) 框架,并深入研究链抽象系统的设计权衡。
介绍 CAKE 框架
在链抽象的世界中,用户访问 dApp 网站,连接钱包,签署操作并等待最终结算。所有复杂的操作在 CAKE 的基础设施层中完成。CAKE 的三个基础设施层包括:
-
权限层:用户将他们的钱包连接到 dApp,并请求用户意图的报价。意图是指用户期望在交易结束时得到的结果,而不是交易路径。例如,将 USDT 转移到 Tron 地址或将 USDC 存入 Arbitrum 上的收益生成策略中。钱包应该能够读取用户资产(即读取状态)并在目标链上执行交易(即更新状态)。
-
求解器层:求解器层基于用户的初始余额和意图估算费用和执行速度。在跨链设置中,这一过程被称为求解,至关重要,因为交易是异步的,子交易在执行过程中可能失败。异步性引入了跨链三难困境,涉及费用、执行速度和执行保证。
-
结算层:用户使用私钥批准交易后,结算层确保其执行。包括两个步骤:将用户资产桥接到目标链,然后执行交易。如果协议使用复杂的求解器进行某些操作,它们可以提供自己的流动性并代表用户执行操作,而无需桥接。
实现链抽象意味着将上述三个基础设施层合并为一个统一的产品。合并这些层的一个关键洞见是信息传递和价值传递的区别。链间的信息传递应该是无损的,因此需要依赖最安全的路径。例如,用户从一条链上向另一条链上的治理投票中投票“赞成”,他们不希望他们的投票变成“可能”。另一方面,根据用户偏好,价值传递可能有所损失。可以利用一个成熟的第三方为用户提供更快、更便宜或有保证的价值传递。需要注意的是,以支付给验证者的费用衡量,以太坊区块空间的 95% 用于价值传递。
关键设计决策
上述三个层次引入了 CAF 需要做出的关键设计决策。这些决策涉及谁控制执行意图的权力、向求解器披露什么信息以及有哪些结算路径可供求解器使用。以下是每个层次的详细分析。
权限层
权限层持有用户的私钥,并代表用户签署消息,然后这些消息在链上执行为交易。CAF 需要支持所有目标链的签名方案和交易负载。例如,支持 ECDSA 签名方案和 EVM 交易标准的钱包将限于以太坊、其L2和侧链(如 Metamask 钱包)。另一方面,支持 EVM 和 SVM(Solana VM)的钱包将能够支持这两个生态系统(如 Phantom 钱包)。需要注意的是,同一个助记词可以用来生成 EVM 和 SVM 链上的钱包。
一个多链交易由多个需要按正确顺序执行的子交易组成。这些子交易必须在多条链上执行,每条链都有其自身的时间变动费用和随机数。如何协调和结算这些子交易是权限层的一个关键设计决策。
-
EOA 钱包是在用户机器上运行并持有其私钥的钱包软件。它们可以是基于浏览器的扩展(如 Metamask 和 Phantom)、移动应用程序(如 Coinbase 钱包)或专用硬件(如 Ledger)。EOA 钱包要求用户对每个子交易进行单独签名,目前需要多次点击。它们还要求用户在目标链上持有费用余额,这在此过程中引入了重大摩擦。但是,通过允许用户通过单击签署多个子交易,可以将多次点击的摩擦从用户身上抽象出来。
-
在账户抽象 (AA) 钱包中,用户仍然可以访问他们的私钥,但他们将交易有效负载的签名者与交易的执行者分开。使复杂的各方能够以原子方式捆绑和执行用户事务(Avocado、Pimlico)。AA 钱包仍然要求用户单独签署每笔子交易(目前通过多次点击),但不要求在每条链上持有费用余额。
-
基于策略的代理在单独的执行环境中保存用户的私钥,并根据用户策略代表用户生成签名消息。Telegram 机器人、近账户聚合器或 SUAVE TEE 是基于策略的钱包,而 Entropy 或 Capsule 是基于策略的钱包扩展。用户只需签署一份批准书,随后的子交易和费用管理的签署就可以由这些代理在操作过程中完成。
求解器层
用户发布意图后,求解器层涉及向用户返回费用和确认时间。这个问题与设计订单流拍卖密切相关,详细内容。CAF 可以利用协议内路径来执行用户意图,或者利用复杂的第三方(即求解器)在某些安全性保证上妥协,为用户提供改进的用户体验。引入求解器到 CAF 框架会产生下一个两个设计决策,并于信息息息相关。
意图由两种类型的可提取值 (EV) 组成:EV_ordering 值和 EV_signal。
-
EV_ordering 是特定于区块链的值,通常由执行用户订单的实体(如区块构建者或验证者)提取。
-
EV_signal 代表了在正式记录在区块链上之前遵守订单的任何实体都可以访问的价值。
不同的用户意图在 EV_ordering 和 EV_signal 之间有不同的分布。例如,在 DEX 上换币的意图通常具有较高的 EV_ordering 值,但 EV_signal 值较低。相反,黑客交易的 EV_signal 分量会更高,因为前置运行会比执行交易获得更多价值。值得注意的是,EV_signal 有时可能是负值,例如在做市商交易的情况下,由于做市商对未来市场状况有更好的了解,执行这些订单的实体可能会遭受损失。
当有人能够提前观察到用户的意图时,他们就会抢跑,从而导致价值泄漏。此外,EV_signal 为负值的可能性会在求解者之间形成竞争环境,导致他们提交更低的出价,从而造成进一步的价值泄漏(又称逆向选择)。最终,泄漏会通过增加费用或提供更优惠的价格来影响用户。请注意,低收费或提高价格是同一枚硬币的两面,在本文其余部分中将交替使用。
信息共享
与求解器共享信息有三种方法:
-
公共内存池:用户意图被公开广播到公共 mempool 或数据可用性层,第一个能满足请求的求解器执行订单并成为赢家。这种系统高度提取用户信息,因为用户公开了他们的 EV_ordering 和 EV_signal。例如,以太坊的公开 mempool 和各种区块链桥。在桥的情况下,用户必须在将资产转移到目标链之前将其放置在托管中,以防止恶意攻击,但这过程无意中公开了他们的意图。
-
部分共享:CAF 可以通过限制披露信息的方式来减少对竞价者透露的价值量。然而,这种方法会直接导致价格最优性的损失,并可能引发竞价垃圾邮件等问题。
-
私有内存池:MPC 和 TEE 的最新发展使得完全私人 mempool 成为可能。在执行环境之外不会泄露任何信息,求解器会编码他们的偏好,并与每个意图匹配。虽然私人 mempool 捕获了 EV_ordering,但无法完全捕获 EV_signal。例如,如果黑客交易被发送到 mempool,第一个看到该订单的人可以抢先进行交易并捕获 EV_signal。在私人 mempool 中,信息只有在区块确认后才会被释放,因此任何看到交易的人都可以捕获 EV_signal。可以想象求解器会建立认证节点来从 TEE 新铸造的区块中捕获 EV_signal,将 EV_signal 捕获变成延迟竞争。
求解器列表
CAF 还需要决定允许多少以及哪些竞价者参与拍卖。主要选项如下:
-
开放访问:参与能力的进入门槛尽可能低。这类似于公开 mempool,泄露了 EV_signal 和 EV_ordering。
-
限制访问:通过白名单、声誉系统、费用或席位拍卖进行订单执行能力的门控。门控机制需要确保系统中的求解器不会捕获 EV_signal。例如1inch Auction、Cowswap Auctions 和 Uniswap X 拍卖。订单获胜的竞争为用户捕获 EV_ordering,而门控机制则可以为订单生成者(钱包、dApps)捕获 EV_signal。
-
专属访问:专属访问是一种特殊的拍卖形式,每个时间段只选择一个求解器。由于不会向其他求解器泄露信息,因此没有不利选择和抢先折扣。订单流发起者捕获 EV_signal 和 EV_ordering 的预期值,因为没有竞争,用户只能获得执行而无法获得价格改进。这类拍卖的例子有 Robinhood 和 DFlow 拍卖。
结算层
一旦钱包签署了一组交易,它们需要在区块链上执行。跨链交易将结算过程从原子操作转变为异步操作。在初始交易执行和确认期间,目标链上的状态可能会发生变化,可能导致交易失败。本小节将探讨安全成本、确认时间和执行保证之间的权衡。
需要注意的是,在目标链上执行预期交易取决于目标链的交易包含机制,包括能够审查交易和目标链的费用机制等因素。我们认为目标链的选择是 dApp 的决策,超出了本文的范围。
跨链预言机
两个具有不同状态和共识机制的区块链需要一个中介,如预言机(Oracle),来促进信息在它们之间的传递。预言机充当链间信息传递的中继,包括验证用户在锁定和铸造桥中的托管账户中锁定资金,或确认用户在原链上的代币余额以参与目标链上的治理投票。
预言机以最慢链的速度传递信息,这是为了管理重组风险,因为预言机需要等待原链的共识。假设用户想将 USDC 从原链桥接到目标链,为此用户将其资金锁定在托管中。然而,如果预言机不等待足够的确认并继续在目标链上为用户铸造代币,可能会出现问题。如果发生重组,用户覆盖其托管交易,预言机会导致双重支出。
预言机有两种类型:
-
协议外预言机:需要与运行共识的第三方验证者分开,以在链间传递信息。额外的验证者增加了运行预言机的成本。LayerZero、Wormhole、ChainLink 和 Axelar 网络是协议外预言机的例子。
-
协议内预言机:深度集成到生态系统的共识算法中,并使用运行共识的验证者集合来传递信息。Cosmos 的 IBC 用于运行 Cosmos SDK 的链,Polygon 生态系统正在开发 AggLayer,而 Optimism 正在开发 Superchain。每个预言机使用专用区块空间在同一生态系统的链之间传递信息。
-
共享排序器是协议外实体,它们在协议内拥有交易排序权,即它们可以跨链捆绑交易。尽管仍在开发中,共享排序器不必等待特定区块确认以减少重组风险。为了真正实现跨链原子性,共享排序器需要能够执行后续交易,条件是早期交易成功,从而将它们变成链链。
桥接代币
在多链世界中,用户的代币和费用余额分散在所有网络中。在每次跨链操作之前,用户需要将资金从原链桥接到目标链。目前有,总 TVL 为 77 亿美元,过去 30 天的桥接量为 86 亿美元。
桥接代币是价值转移的案例。这为利用擅长资本管理并愿意承担重组风险的专业第三方创造了机会,减少了用户交易所需的成本和时间。
跨链桥有两种类型:
-
锁定和铸造桥:锁定和铸造桥验证原链上的代币存款并在目标链上铸造代币。启动此类桥所需的资本较小,但安全转移锁定信息需要大量投资。这些桥的导致了代币持有者数十亿美元的损失。
-
流动性桥:流动性桥利用原链和目标链上的流动性池,并使用算法确定原链和目标代币之间的转换率。虽然这些桥的初始成本较高,但需要较低的安全保证。如果发生安全漏洞,只有流动性池中的资金面临风险。
在这两种跨链桥中,用户都需要支付流动性成本。在锁定和铸造桥中,流动性成本是在目标链上从包装代币交换为所需代币(USDC.e 到 USDC)时发生的,而在流动性桥中,流动性成本是在从原链上的代币交换为目标链上的代币时发生的。
跨链三难问题
上述五个设计决策引发了跨链三难问题。CAF 必须在执行保证、低费用和执行速度之间选择两个属性。
-
协议内路径:是指定的跨链信息传输路径。这些系统考虑到重组风险,牺牲了执行速度,但通过消除额外验证者集合或流动性成本来降低成本。
-
求解器聚合:从多个求解器收集报价,以识别最便宜和最快的执行用户意图的路径。然而,由于不利选择和抢先交易,有时求解器可能无法满足意图,导致执行减少。
-
执行竞争:通过安排求解器竞速执行意图或选择单一求解器来选择获胜求解器。这两种方法都会导致用户费用高昂,因为求解器争夺执行而不是价格改进。
CAKE 的六个组成部分
为撰写本文,我们研究了 20 多种直接和间接致力于链抽象的团队设计。在本节中,我们讨论了六种我们认为具有内在效率和产品市场契合度的独立 CA 实现。如果构建正确,这些设计有潜力相互结合。
一个关键结论是我们需要一个统一的跨链意图表达标准。每个团队都在研究自己的方法和协议来编码用户意图。统一标准将改善用户对其签名消息的理解,使求解器和预言机更容易理解这些意图,并简化与钱包的集成。
代币指定桥
有一种特殊情况的锁定和铸币桥,它不支付流动性成本,也称为销毁和铸币桥(例如 USDC CCTP)。代币团队在每条链上指定一个规范的代币地址,而桥则有权铸造代币,即用户需要的代币。
如果仔细观察,你会发现销毁和铸造桥类似于以足够区块确认速度进行的跨链转账。 是这样一种标准,用于在目标链上指定规范代币及其授权桥。代币指定桥是协议内路径的一个例子,即它在保证执行和低费用的情况下牺牲了速度,例如 CCTP 需要 20 分钟才能完成转账。
生态系统协调桥
生态系统协调桥可以在同一生态系统内的链之间传输任意消息。这类桥属于协议内路径,优先考虑执行保证和低费用,而非速度。示例包括 Cosmos IBC、Polygon AggLayer 和 Optimism Superchain。
三年前,Cosmos 生态系统面临着类似于以太坊今天所面临的挑战。流动性分散在各条链上,每条链都有自己的费用代币,管理多链账户非常繁琐。Cosmos 生态系统通过实施 IBC 协议内消息传递桥解决了这些问题,实现了无缝的多链账户管理和跨链转账。
Cosmos 生态系统由独立链组成,这些链具备主权安全性和快速终结性,使得协议内的跨链消息传递非常快速。而 rollup 生态系统则依赖于挑战期的结束(乐观 Rollups)或 zk 证明的提交(有效性 Rollups)来实现最终性。由于这些终结性限制,跨生态系统的消息传递速度会较慢。
求解器价格竞争
求解器价格竞争涉及与所有求解器共享订单信息。求解器旨在结合订单意图所产生的预期价值(EV)并将其提供给用户。系统中获胜 Solver 的选择基于最大化用户价格改进。然而,这种设计存在不执行的风险,需要额外的机制来确保订单的可靠性。此类机制的例子包括 Uniswap X、Bungee 和 Jumper。
钱包协调消息
钱包协调消息利用 AA 或基于策略的钱包提供的功能,提供兼容任何意图类型的跨链体验。它作为最终的 CA 聚合器,将用户意图在各种 CA 设计之间重新定向,以解决特定意图。例子包括 Avocado 钱包、Near Account Aggregator 和 Metamask Portfolio。
需要注意的是,在过去十年中,加密生态系统已经了解到用户与其钱包之间的关系非常粘性。每当我想到将我的助记词从 Metamask 迁移到另一个钱包时,我都会感到极度恐惧。这也是为什么即使在 Vitalik Buterin 本人支持下,EIP-4337 在 2.5 年后仍然的原因。尽管较新的钱包协议版本可能为用户提供更好的价格(账户抽象)或改进的易用性(基于策略的钱包),但将用户从当前钱包迁移是一个艰巨的任务。
求解器速度竞争
求解器速度竞争允许用户表达对特定跨链转换的意图,以获得高执行保证。它不帮助用户最小化费用,而是提供了一个可靠的渠道来包含复杂交易。第一个基于区块构建者费用或包含速度执行意图的 Solver 将赢得该意图。
该设计旨在通过最大化 Solver 捕获的 EV 来实现高包含率。然而,这需要付出中心化的代价,因为它依赖于以太坊主网的复杂资本管理或L2上的低延迟执行。
独家批量拍卖
独家批量拍卖在一个时间窗口内为执行所有订单流的独家权利举行拍卖。由于其他求解器无法看到订单,他们基于预测的市场波动和平均执行质量来出价。独家批量拍卖依赖于一个后备价格以确保良好的用户价格,因此不能用于价格改进。将所有订单流发送给单个竞标者消除了信息泄漏并提高了执行保证。
结论
链抽象框架(CAF)承诺为用户提供无缝的跨链互动。在本文中,我们研究了几个团队正在生产和开发中的设计,这些团队明确或隐含地试图解决链抽象问题。我们相信今年将是 CAF 的一年,并预计在未来 6-12 个月内,不同设计及其实现之间将发生显著竞争。
跨链价值转移将通过代币授权的桥接来实现低费用,通过求解器速度或价格竞赛来实现快速执行。而信息传输则会通过与生态系统匹配的消息桥接进行路由,旨在最大限度地降低用户成本,并通过钱包控制的平台来最大化速度。最终,这六种不同的设计方案将形成一个集群,因为它们分别满足不同的需求,并利用在权衡矩阵不同区域中的效率。
从这个过程中我们得到的一个重要结论是,我们需要一个通用标准来表达跨链意图。目前,多个团队正在各自研究用于编码用户意图的协议,导致重复工作。统一标准将有助于提高用户对所签名消息的理解,方便求解器和预言机处理意图,并简化与钱包的集成。