本文向您展示了如何理解Solidity的字节码和操作码。内容简洁易懂,一定会让你眼前一亮。希望通过这篇文章的详细介绍,你能有所收获。
可靠性的字节码和操作码
当我们更深入地编写智能合约时,我们会遇到诸如“PUSH1”、“SSTORE”和“CALLVALUE”等术语。它们是什么,我们应该在什么时候使用它们?
要理解这些命令,我们必须对以太网虚拟机(EVM)有更深的理解。本文将试图尽可能简单地解释一些EVM基础知识。希望大家都有所收获。
像许多其他流行的编程语言一样,Solidity是一种高级编程语言。我们可以阅读它,但是机器不能。如果你学过java、C、C等编程语言,应该很容易理解这个道理。
当我们安装Ethereum客户端如geth时,它还附带了Ethereum虚拟机,这是一个专门为运行智能合约而创建的轻量级操作系统。
当我们用solc编译器编译Solidity代码时,它会将代码转换成只有EVM才能理解的字节码。
让我们以一个非常简单的合同为例:
pragmasolidity^0.4.26;
contractOpcodeContract{
uinti=(10 ^ 2)* 2;
}如果我们在remix浏览器中运行这段代码,点击Contract Details,会看到很多信息。
在这种情况下,编译后的代码是:
字节码
{
linkReferences':{},
对象' : ' 6080604052601860005534801560145760080 FD 5b 5060358060226000396000300306060405260008000000000000000000000000000000000165627 a 7a 72305820 db 567e 501 f 168282876 df 36e eee
操作码' : ' push 10 X80 push 10 x40 msorebush 10 x18 push 10 x0sstorcallvaluedup1 iszeropush 10 x14 jumpipush 10 x0 dup1 evertjumpdestpopush 10 x35 dup1 push 10 x22 push 10x0 codecopypush 10 x0 returnstopush 10 X80 push 10 x40 msorebush 10 dup1 evertstolpog1 push 60 x627 a 723058 kecca 2560 xdsarjumpush 310 x501 f 16822
source map ' : ' 25:5433600:-;64:12;55:21;25:54;8:9:-1;5:2;30:1;27;20:12;5:2;25:54:0;'
}其中object是编译后的代码。它们是最终契约的十六进制表示,也称为字节码。
在remix浏览器的“Web3部署”部分,我们看到:
varopcodecontract contract=web 3 . eth . contract([]);
varopcodecontract=opcodecontract . new(
{
from: web3.eth.accounts[0],
data: '0x60806040526018600055348015601457600080fd5b5060358060226000396000f3006080604052600080fd00a165627a7a72305820db1d567e501f1682876df36eea80a02d25a8b2adb186da705e2e98e134b08cc60029',
gas: '4700000'
}, function (e, contract){
console.log(e, contract);
if (typeof contract.address !== 'undefined') {
console.log('Contract mined! address: ' + contract.address + ' transactionHash: ' + contract.transactionHash);
}
})
简单来说,这意味着当我们部署合同时,我们需要将编译后的16进制码当成data传递,并且建议的gas为4700000。
任何以“ 0x”开头的内容都表示该值采用十六进制格式。 十六进制前面的“ 0x”并不是强制的,因为EVM会将任何值都视为十六进制。
我们还看到了操作代码(又称Opcode):
"opcodes": "PUSH1 0x80 PUSH1 0x40 MSTORE PUSH1 0x18 PUSH1 0x0 SSTORE CALLVALUE DUP1 ISZERO PUSH1 0x14 JUMPI PUSH1 0x0 DUP1 REVERT JUMPDEST POP PUSH1 0x35 DUP1 PUSH1 0x22 PUSH1 0x0 CODECOPY PUSH1 0x0 RETURN STOP PUSH1 0x80 PUSH1 0x40 MSTORE PUSH1 0x0 DUP1 REVERT STOP LOG1 PUSH6 0x627A7A723058 KECCAK256 0xdb SAR JUMP PUSH31 0x501F1682876DF36EEA80A02D25A8B2ADB186DA705E2E98E134B08CC6002900 ",
操作码是程序的低级可读指令。 所有操作码都具有对应的十六进制值,例如“ MSTORE”为“ 0x52”,SSTORE”为“ 0x55”……等等。
具体的操作码对应的数值可以参考以太坊相关资料。
EVM虚拟机是一中堆栈虚拟机,所谓堆栈就是后进先出结构,用计算机科学术语来说,我们称为LIFO。
举个例子,上面的智能合约,如果在普通算术中,我们这样写方程式:
// Answer is 14. we do multiplication before addition. 10 + 2 * 2
在EVM堆栈虚拟机中,它按照LIFO原理工作,所以我们需要这样写:
2 2 * 10 +
这意味着,首先将“ 2”放入堆栈,然后再放入另一个“ 2”,然后再进行乘法运算。 结果是“ 4”放在在堆栈顶部。 现在在“ 4”的顶部加上数字“ 10”,最后将两个数字加在一起。 堆栈的最终值为14。
这种算术类型称为后缀表示法。
将数据放入堆栈的动作称为“ PUSH”指令,将数据从堆栈中删除的动作称为“ POP”指令。 很明显,我们在上面的示例中看到的最常见的操作码是“ PUSH1”,这意味着将1个字节的数据放入堆栈中。
因此,此指令:
PUSH1 0x80
表示将1字节值“ 0x80”放入堆栈中。 “ PUSH1”的十六进制值恰是“ 0x60”。 删除非强制性的“ 0x”,我们可以将此逻辑以字节码形式写为“ 6080”。
让我们更进一步。
PUSH1 0x80 PUSH1 0x40 MSTORE
再次查看以太坊的操作码图表,我们看到MSTORE(0x52)接受2个输入,但不产生任何输出。 上面的操作码表示:
PUSH1(0x60):将0x80放入堆栈。
PUSH1(0x40):将0x40放入堆栈。
MSTORE(0x52):分配0x80的内存空间并移至0x40的位置。
结果字节码为:
6080604052
实际上,在任何固定字节码的开头,我们总会看到这个魔术数字“ 6080604052”,因为它是智能合约引导的方式。
请注意,这里不能将0x40或0x60解释为实数40或60。由于它们是十六进制,所以40实际上等于十进制的64(16 x 4),而80等于十进制的128(16 x 8)。
简而言之,“ PUSH1 0x80 PUSH1 0x40 MSTORE”正在做的是分配128个字节的内存并将指针移到第64个字节的开头。现在,我们有64个字节用于暂存空间,而64个字节用于临时内存存储。
在EVM中,有3个地方可以存储数据。首先,在堆栈中,按照上面的示例,我们刚刚使用了“ PUSH”操作码在此处存储数据。其次,在使用“ MSTORE”操作码的内存(RAM)中,最后在使用“ SSTORE”存储数据的磁盘存储中。将数据存储到磁盘存储所需的gas最昂贵,而将数据存储到堆栈中的gas则最便宜。
我们在Solidity中的智能合约中,有时候也会用到Assembly Language,这个Assembly Language就是使用这样的汇编Opcode来操作EVM字节码。他理解起来比较难,但是通过使用它可以节省燃料和做一些无法通过Solidity完成的事情。
上述内容就是如何理解Solidity的Bytecode和Opcode,你们学到知识或技能了吗?如果还想学到更多技能或者丰富自己的知识储备,欢迎关注行业资讯频道。
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/112496.html