graalvm学习(十一) 字节码如何转换为机器码

发布时间:2024年01月20日

Graal在拿到字节码之后,会先根据字节码生成一个graph,再通过graph生成对应的机器指令,将机器指令生成一个.o文件,然后通过gcc生成可执行文件。

Graal会提供.o文件,和一些link。然后交给gcc生成一个可执行文件。
参考:src/com/oracle/svm/hosted/image/NativeImageViaCC.java

什么是机器指令

机器指令是CPU能直接识别并执行的指令,它的表现形式是二进制编码。
机器指令通常由操作码和地址码两部分组成,操作码指出该指令所要完成的操作,即指令的功能,地址码指出参与运算的对象,以及运算结果所存放的位置等。
机器指令的长度和格式可以根据不同的计算机系统而有所差异,一般可以分为零地址指令、一地址指令、二地址指令、三地址指令和四地址指令。
机器指令是计算机的最小功能单位,是计算机硬件和软件的交界面,也是机器语言的基本组成部分。

什么是机器码

#include <stdio.h>
int main() {
    printf("Hello world\n");
    return 0;
}
//.o文件是C语言编译后生成的目标文件,它包含了机器指令和符号信息。
$ gcc -c source.c -o target.o

$ objdump -d target.o

什么是字节码

�1、通过jvmci获取:
26, 27, 96, -84
2、通过javap -v 获取
image.png

通过jvmci获取到的怎么和javap获取到的不一样?其实通过graal可以知道答案。
参考:graal/compiler/src/jdk.graal.compiler/src/jdk/graal/compiler/bytecode/Bytecodes.java
从参考文件中可以看到对应关系。

如何遍历字节码,并获取对应关系

在通过jvmci获取到字节码的byte之后,可以通过BytecodeStream处理一下,可以参考graal中的实现。以下为具体细节:

ConstantPool cp = method.getConstantPool(); //获取常量池
byte[] code = method.getCode();
BytecodeStream stream = new BytecodeStream(code);

//遍历字节码,然后根本不同的含义去处理和分析
while (stream.endBCI() != stream.nextBCI()) {
    int opcode = stream.currentBC();
    if (opcode == Bytecodes.INVOKESTATIC) {
        int cpi = stream.readCPI();
        // 这里可以获取到INVOKESTATIC对应的函数
        JavaMethod javaMethod = cp.lookupMethod(cpi, opcode);
    } else if (opcode == Bytecodes.BIPUSH){
        // 获取真实内容
        System.out.println(stream.readByte());
    } else if (opcode == Bytecodes.SIPUSH) {
        // 获取真实内容
        System.out.println(stream.readByte());
    }
    stream.next();
}

通过clang生成可执行文件的命令

graal生成可执行文件最终会使用下面的类 src/com/oracle/svm/hosted/image/NativeImageViaCC.java -> runLinkerCommand方法
截屏2024-01-03 10.37.15.png
这个命令是使用cc编译器来链接多个目标文件和静态链接库文件,生成一个可执行文件。命令的参数如下:

  • /usr/bin/cc:指定使用cc编译器,cc是C语言编译器的通用名称,可能是gcc或clang的别名。
  • -Wl,-U,___darwin_check_fd_set_overflow:向链接器(ld)传递一个选项,表示在链接时定义一个符号(symbol),即___darwin_check_fd_set_overflow。这个符号是用于检查文件描述符集合(fd_set)是否溢出的函数,是macOS系统的特有功能。
  • -Wl,-no_compact_unwind:向链接器(ld)传递一个选项,表示在链接时禁用紧凑的异常处理信息(compact unwind info)。这个选项可以减少可执行文件的大小,但是可能导致调试和异常处理的困难。
  • -Wl,-exported_symbols_list -Wl,/var/folders/n_/klffvb9j0tg8td2yw8x2_3rr0000gn/T/SVM-14145774611905607457/exported_symbols.list:向链接器(ld)传递一个选项,表示在链接时只导出指定的符号(symbol),而不是所有的符号。这个选项可以提高链接的速度和安全性。指定的符号列表文件是/var/folders/n_/klffvb9j0tg8td2yw8x2_3rr0000gn/T/SVM-14145774611905607457/exported_symbols.list
  • -Wl,-x:向链接器(ld)传递一个选项,表示在链接时删除所有的局部符号(local symbol)。这个选项可以减少可执行文件的大小,但是可能导致调试的困难。
  • -arch arm64:指定目标架构为arm64,即64位的ARM架构,是一种常见的移动设备和嵌入式系统的处理器架构。
  • -o /Users/xxx/soft/graal/substratevm/helloworld:指定输出的可执行文件的名称和路径为/Users/xxx/soft/graal/substratevm/helloworld
  • helloworld.o:指定一个输入的目标文件,是源代码helloworld.c经过编译后生成的二进制文件。
  • /Users/xxx/soft/graal/sdk/mxbuild/darwin-aarch64/GRAALVM_C79FC66E29_JAVA22/graalvm-c79fc66e29-java22-24.0.0-dev/Contents/Home/lib/svm/clibraries/darwin-aarch64/liblibchelper.a:指定一个输入的静态链接库文件,是GraalVM的一个辅助库,提供了一些基本的功能,如内存管理、异常处理、信号处理等。
  • /Users/xxx/soft/graal/sdk/mxbuild/darwin-aarch64/GRAALVM_C79FC66E29_JAVA22/graalvm-c79fc66e29-java22-24.0.0-dev/Contents/Home/lib/static/darwin-aarch64/libnet.a:指定一个输入的静态链接库文件,是Java的一个网络库,提供了一些网络相关的功能,如套接字、DNS、代理等。
  • /Users/xxx/soft/graal/sdk/mxbuild/darwin-aarch64/GRAALVM_C79FC66E29_JAVA22/graalvm-c79fc66e29-java22-24.0.0-dev/Contents/Home/lib/svm/clibraries/darwin-aarch64/libdarwin.a:指定一个输入的静态链接库文件,是GraalVM的一个平台相关的库,提供了一些macOS系统的特有功能,如系统调用、动态库加载、线程本地存储等。
  • /Users/xxx/soft/graal/sdk/mxbuild/darwin-aarch64/GRAALVM_C79FC66E29_JAVA22/graalvm-c79fc66e29-java22-24.0.0-dev/Contents/Home/lib/static/darwin-aarch64/libnio.a:指定一个输入的静态链接库文件,是Java的一个非阻塞输入输出(NIO)库,提供了一些高性能的输入输出相关的功能,如缓冲区、通道、选择器等。
  • /Users/xxx/soft/graal/sdk/mxbuild/darwin-aarch64/GRAALVM_C79FC66E29_JAVA22/graalvm-c79fc66e29-java22-24.0.0-dev/Contents/Home/lib/static/darwin-aarch64/libjava.a:指定一个输入的静态链接库文件,是Java的一个基础库,提供了一些核心的功能,如字符串、数组、对象、类、反射、异常、安全等。
  • /Users/xxx/soft/graal/sdk/mxbuild/darwin-aarch64/GRAALVM_C79FC66E29_JAVA22/graalvm-c79fc66e29-java22-24.0.0-dev/Contents/Home/lib/static/darwin-aarch64/libzip.a:指定一个输入的静态链接库文件,是Java的一个压缩库,提供了一些压缩和解压缩相关的功能,如ZIP、JAR、GZIP等。
  • /Users/xxx/soft/graal/sdk/mxbuild/darwin-aarch64/GRAALVM_C79FC66E29_JAVA22/graalvm-c79fc66e29-java22-24.0.0-dev/Contents/Home/lib/svm/clibraries/darwin-aarch64/libjvm.a:指定一个输入的静态链接库文件,是GraalVM的一个虚拟机库,提供了一些虚拟机相关的功能,如垃圾回收、即时编译、本地调用、本地内存访问等。
  • -v:指定一个编译器的选项,表示在编译和链接时显示详细的信息,如使用的命令、选项、路径等。
  • -L/var/folders/n_/klffvb9j0tg8td2yw8x2_3rr0000gn/T/SVM-14145774611905607457:指定一个链接器的选项,表示在链接时搜索静态链接库文件的目录,这里是/var/folders/n_/klffvb9j0tg8td2yw8x2_3rr0000gn/T/SVM-14145774611905607457
  • -L/Users/xxx/soft/graal/sdk/mxbuild/darwin-aarch64/GRAALVM_C79FC66E29_JAVA22/graalvm-c79fc66e29-java22-24.0.0-dev/Contents/Home/lib/static/darwin-aarch64:指定一个链接器的选项,表示在链接时搜索静态链接库文件的目录,这里是/Users/xxx/soft/graal/sdk/mxbuild/darwin-aarch64/GRAALVM_C79FC66E29_JAVA22/graalvm-c79fc66e29-java22-24.0.0-dev/Contents/Home/lib/static/darwin-aarch64
  • -L/Users/xxx/soft/graal/sdk/mxbuild/darwin-aarch64/GRAALVM_C79FC66E29_JAVA22/graalvm-c79fc66e29-java22-24.0.0-dev/Contents/Home/lib/svm/clibraries/darwin-aarch64:指定一个链接器的选项,表示在链接时搜索静态链接库文件的目录,这里是/Users/xxx/soft/graal/sdk/mxbuild/darwin-aarch64/GRAALVM_C79FC66E29_JAVA22/graalvm-c79fc66e29-java22-24.0.0-dev/Contents/Home/lib/svm/clibraries/darwin-aarch64
  • -ldl:指定一个链接器的选项,表示在链接时使用动态链接库(dynamic link library)的功能,如加载和卸载动态链接库文件等。
  • -lpthread:指定一个链接器的选项,表示在链接时使用线程(thread)的功能,如创建和销毁线程、同步和

ps: 其中graph可能还会转换为HIR、LIR等结构。生成机器指令的前一种数据结构可能并不是graph。

参考:
https://www.cnblogs.com/lizm166/p/10694061.html 机器码
https://docs.oracle.com/javase/specs/
https://chrisseaton.com/truffleruby/jokerconf17/

非常感谢您花时间阅读我的博客文章。我非常清楚,我还有很多需要学习和改进的地方,但我希望这篇文章能够为您提供一些有用的信息和启发。如果您有任何问题或建议,请随时联系我,我将非常愿意听取您的意见。再次感谢您的阅读和支持!

文章来源:https://blog.csdn.net/D_I_D/article/details/135713881
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。