汇编语言编程

本章介绍 RISC-V 汇编语言编程，包括汇编程序结构、伪指令、常用编程模式等内容。

汇编程序结构

基本结构

一个完整的 RISC-V 汇编程序通常包含以下部分：

# 数据段
.section .data
    message:    .asciz "Hello, World!\n"
    buffer:     .space 100

# 代码段
.section .text
.globl _start

_start:
    # 程序入口
    la a0, message      # 加载字符串地址
    li a7, 64           # write 系统调用号
    li a1, 14           # 字符串长度
    li a2, 1            # 文件描述符（stdout）
    ecall               # 系统调用

    li a7, 93           # exit 系统调用号
    li a0, 0            # 退出码
    ecall               # 系统调用

段定义

RISC-V 汇编程序使用段（section）来组织代码和数据：

段名	用途
.text	代码段，存放可执行指令
.data	数据段，存放已初始化的全局变量
.rodata	只读数据段，存放常量
.bss	未初始化数据段，存放未初始化的全局变量
.stack	栈段

段声明伪指令

.section .text    # 声明代码段
.section .data    # 声明数据段
.section .rodata  # 声明只读数据段
.section .bss     # 声明未初始化数据段

数据定义伪指令

基本数据定义

# 字节
.byte   0x12          # 定义一个字节
.byte   1, 2, 3, 4    # 定义多个字节

# 半字（16 位）
.half   0x1234        # 定义一个半字
.half   100, 200      # 定义多个半字

# 字（32 位）
.word   0x12345678    # 定义一个字
.word   100, 200, 300 # 定义多个字

# 双字（64 位）
.dword  0x123456789ABCDEF0  # 定义一个双字

字符串定义

.asciz  "Hello, World!\n"   # 以 null 结尾的字符串
.ascii  "Hello"             # 不以 null 结尾的字符串
.string "Hello"             # 等同于 .asciz

空间分配

.space  100      # 分配 100 字节空间，不初始化
.skip   50       # 跳过 50 字节，等同于 .space
.zero   20       # 分配 20 字节并初始化为 0

对齐

.align  2        # 4 字节对齐（2^2 = 4）
.align  4        # 16 字节对齐（2^4 = 16）
.balign 4        # 4 字节对齐
.p2align 3       # 8 字节对齐（2^3 = 8）

符号定义

# 定义全局符号
.globl  main
.globl  _start

# 定义局部符号
.local  helper_func

# 定义等价符号
.equ    BUFFER_SIZE, 100
.set    MAX_VALUE, 255

# 使用等价符号
buffer: .space BUFFER_SIZE

常用伪指令

加载伪指令

li - 加载立即数

li  a0, 100          # 加载立即数
li  a0, 0x12345678   # 加载 32 位立即数

展开为：

# 小立即数
addi a0, x0, 100

# 大立即数
lui   a0, 0x12345
addi  a0, a0, 0x678

la - 加载地址

la  a0, message      # 加载符号地址
la  a1, buffer       # 加载缓冲区地址

展开为：

auipc a0, %pcrel_hi(message)
addi  a0, a0, %pcrel_lo(message)

移动伪指令

mv  a0, a1           # 寄存器移动，展开为 addi a0, a1, 0

比较伪指令

seqz  a0, a1         # a0 = (a1 == 0) ? 1 : 0
snez  a0, a1         # a0 = (a1 != 0) ? 1 : 0
sltz  a0, a1         # a0 = (a1 < 0) ? 1 : 0
sgtz  a0, a1         # a0 = (a1 > 0) ? 1 : 0

取反伪指令

not  a0, a1          # 按位取反，展开为 xori a0, a1, -1
neg  a0, a1          # 取负，展开为 sub a0, x0, a1

跳转伪指令

j    label           # 无条件跳转，展开为 jal x0, label
jr   ra              # 跳转到寄存器地址，展开为 jalr x0, 0(ra)
ret                  # 返回，展开为 jalr x0, 0(ra)
call function        # 调用函数，展开为 auipc + jalr
tail function        # 尾调用，展开为 auipc + jalr x0

函数调用

函数定义

# 函数定义
function_name:
    # 函数序言：保存寄存器，分配栈空间
    addi sp, sp, -16
    sw   ra, 12(sp)
    sw   s0, 8(sp)
    
    # 函数体
    # ...
    
    # 函数尾声：恢复寄存器，释放栈空间
    lw   ra, 12(sp)
    lw   s0, 8(sp)
    addi sp, sp, 16
    ret

函数调用示例

# 调用函数：int add(int a, int b)
li   a0, 10          # 第一个参数
li   a1, 20          # 第二个参数
call add             # 调用函数
# 返回值在 a0 中

# 函数定义
add:
    add  a0, a0, a1  # a0 = a0 + a1
    ret              # 返回

栈帧管理

# 复杂函数的栈帧
complex_func:
    addi sp, sp, -32     # 分配栈空间
    sw   ra, 28(sp)      # 保存返回地址
    sw   s0, 24(sp)      # 保存帧指针
    addi s0, sp, 32      # 设置帧指针
    
    # 保存被调用者保存寄存器
    sw   s1, 20(sp)
    sw   s2, 16(sp)
    
    # 函数体
    # ...
    
    # 恢复被调用者保存寄存器
    lw   s2, 16(sp)
    lw   s1, 20(sp)
    
    # 恢复帧指针和返回地址
    lw   s0, 24(sp)
    lw   ra, 28(sp)
    addi sp, sp, 32      # 释放栈空间
    ret

控制结构

条件分支

if-else 结构

// C 代码
if (a > b) {
    max = a;
} else {
    max = b;
}

# RISC-V 汇编
    ble  a0, a1, else    # 如果 a <= b，跳转到 else
    mv   a2, a0          # max = a
    j    end
else:
    mv   a2, a1          # max = b
end:

if-else if-else 结构

// C 代码
if (a == 0) {
    result = 0;
} else if (a == 1) {
    result = 1;
} else {
    result = -1;
}

# RISC-V 汇编
    bnez a0, check_1     # 如果 a != 0，检查下一个条件
    li   a1, 0           # result = 0
    j    end
check_1:
    li   t0, 1
    bne  a0, t0, else    # 如果 a != 1，跳转到 else
    li   a1, 1           # result = 1
    j    end
else:
    li   a1, -1          # result = -1
end:

循环结构

while 循环

// C 代码
int sum = 0;
int i = 0;
while (i < 10) {
    sum += i;
    i++;
}

# RISC-V 汇编
    li   a0, 0           # sum = 0
    li   a1, 0           # i = 0
    li   t0, 10          # 循环上限
loop:
    bge  a1, t0, end     # 如果 i >= 10，退出循环
    add  a0, a0, a1      # sum += i
    addi a1, a1, 1       # i++
    j    loop
end:

for 循环

// C 代码
int sum = 0;
for (int i = 0; i < 10; i++) {
    sum += i;
}

# RISC-V 汇编
    li   a0, 0           # sum = 0
    li   a1, 0           # i = 0
    li   t0, 10          # 循环上限
for_loop:
    bge  a1, t0, for_end # 条件判断
    add  a0, a0, a1      # 循环体
    addi a1, a1, 1       # 迭代
    j    for_loop
for_end:

do-while 循环

// C 代码
int i = 0;
do {
    i++;
} while (i < 10);

# RISC-V 汇编
    li   a0, 0           # i = 0
    li   t0, 10          # 循环上限
do_loop:
    addi a0, a0, 1       # i++
    blt  a0, t0, do_loop # 如果 i < 10，继续循环

数组操作

数组访问

// C 代码
int arr[10];
arr[i] = value;

# RISC-V 汇编
    la   t0, arr         # 加载数组基地址
    slli t1, a0, 2       # 计算偏移：i * 4
    add  t0, t0, t1      # 计算元素地址
    sw   a1, 0(t0)       # 存储值

数组遍历

// C 代码
int sum = 0;
for (int i = 0; i < 10; i++) {
    sum += arr[i];
}

# RISC-V 汇编
    la   t0, arr         # 数组基地址
    li   a0, 0           # sum = 0
    li   a1, 0           # i = 0
    li   t1, 10          # 循环上限
array_loop:
    bge  a1, t1, array_end
    slli t2, a1, 2       # 偏移
    add  t2, t0, t2      # 元素地址
    lw   t3, 0(t2)       # 加载元素
    add  a0, a0, t3      # sum += arr[i]
    addi a1, a1, 1       # i++
    j    array_loop
array_end:

结构体操作

结构体定义

// C 代码
struct Point {
    int x;
    int y;
};

# RISC-V 汇编
# 偏移量定义
.equ POINT_X, 0
.equ POINT_Y, 4
.equ POINT_SIZE, 8

# 访问成员
    la   t0, point       # 加载结构体地址
    lw   a0, POINT_X(t0) # 读取 x
    lw   a1, POINT_Y(t0) # 读取 y

结构体数组

// C 代码
struct Point points[10];
points[i].x = 10;

# RISC-V 汇编
    la   t0, points      # 数组基地址
    li   t1, POINT_SIZE  # 结构体大小
    mul  t2, a0, t1      # 计算偏移
    add  t0, t0, t2      # 结构体地址
    li   t3, 10
    sw   t3, POINT_X(t0) # 设置 x 成员

内存操作

内存复制

# 复制 n 字节从 src 到 dst
# a0: dst, a1: src, a2: n
memcpy:
    beqz a2, memcpy_end  # 如果 n == 0，结束
memcpy_loop:
    lb   t0, 0(a1)       # 读取字节
    sb   t0, 0(a0)       # 写入字节
    addi a0, a0, 1       # dst++
    addi a1, a1, 1       # src++
    addi a2, a2, -1      # n--
    bnez a2, memcpy_loop
memcpy_end:
    ret

内存清零

# 将 n 字节内存清零
# a0: addr, a1: n
memset_zero:
    beqz a1, memset_end
memset_loop:
    sb   x0, 0(a0)       # 写入 0
    addi a0, a0, 1
    addi a1, a1, -1
    bnez a1, memset_loop
memset_end:
    ret

系统调用

Linux 系统调用

RISC-V Linux 使用 ecall 指令进行系统调用：

# 系统调用号在 a7，参数在 a0-a5，返回值在 a0
li   a7, syscall_number
ecall

常用系统调用

系统调用号	名称	参数	描述
57	close	a0=fd	关闭文件
62	lseek	a0=fd, a1=offset, a2=whence	文件定位
63	read	a0=fd, a1=buf, a2=count	读取文件
64	write	a0=fd, a1=buf, a2=count	写入文件
93	exit	a0=status	退出程序
214	brk	a0=addr	调整堆

系统调用示例

输出字符串

la   a0, message      # 字符串地址
li   a1, 14           # 字符串长度
li   a2, 1            # stdout
li   a7, 64           # write
ecall

读取输入

la   a0, buffer       # 缓冲区地址
li   a1, 100          # 缓冲区大小
li   a2, 0            # stdin
li   a7, 63           # read
ecall

退出程序

li   a0, 0            # 退出码
li   a7, 93           # exit
ecall

完整示例

Hello World

.section .data
message:
    .asciz "Hello, World!\n"

.section .text
.globl _start

_start:
    la   a0, message
    li   a1, 14
    li   a2, 1
    li   a7, 64
    ecall

    li   a0, 0
    li   a7, 93
    ecall

阶乘计算

# 计算 n 的阶乘
# 输入：a0 = n
# 输出：a0 = n!
factorial:
    li   t0, 1           # result = 1
fact_loop:
    beqz a0, fact_end    # 如果 n == 0，结束
    mul  t0, t0, a0      # result *= n
    addi a0, a0, -1      # n--
    j    fact_loop
fact_end:
    mv   a0, t0          # 返回结果
    ret

斐波那契数列

# 计算第 n 个斐波那契数
# 输入：a0 = n
# 输出：a0 = fib(n)
fibonacci:
    li   t0, 0           # fib(0) = 0
    li   t1, 1           # fib(1) = 1
    beqz a0, fib_ret_0   # 如果 n == 0
    li   t2, 1
    beq  a0, t2, fib_ret_1  # 如果 n == 1
    
fib_loop:
    add  t2, t0, t1      # fib(n) = fib(n-1) + fib(n-2)
    mv   t0, t1          # 移动
    mv   t1, t2
    addi a0, a0, -1
    li   t3, 1
    bgt  a0, t3, fib_loop
    
    mv   a0, t2
    ret

fib_ret_0:
    mv   a0, t0
    ret

fib_ret_1:
    mv   a0, t1
    ret

小结

本章介绍了 RISC-V 汇编语言编程：

汇编程序结构和段定义
数据定义伪指令
常用伪指令
函数调用和栈帧管理
控制结构实现
数组和结构体操作
系统调用

掌握汇编语言编程对于理解底层系统工作原理和优化关键代码非常重要。下一章将介绍调用约定。

汇编程序结构​

基本结构​

段定义​

段声明伪指令​

数据定义伪指令​

基本数据定义​

字符串定义​

空间分配​

对齐​

符号定义​

常用伪指令​

加载伪指令​

移动伪指令​

比较伪指令​

取反伪指令​

跳转伪指令​

函数调用​

函数定义​

函数调用示例​

栈帧管理​

控制结构​

条件分支​

循环结构​

数组操作​

数组访问​

数组遍历​

结构体操作​

结构体定义​

结构体数组​

内存操作​

内存复制​

内存清零​

系统调用​

Linux 系统调用​

常用系统调用​

系统调用示例​

完整示例​

Hello World​

阶乘计算​

斐波那契数列​

小结​