/ARM-Cortex-M3_from-assembly-to-c

ARM-Cortex-M3从汇编到C_从Boot到应用教程 (转载自gitee仓库:才鲸嵌入式 / ARM-Cortex-M3从汇编到C_从Boot到应用教程,如有侵权,请联系我删除)

Primary LanguageC

ARM Cortex-M3从汇编到C,从Boot到应用的教程

作者 将狼才鲸
创建日期 2022-11-05

Gitee工程和源码地址:才鲸嵌入式 / ARM-Cortex-M3从汇编到C_从Boot到应用教程
CSDN文章阅读地址:ARM Cortex-M3从汇编到C,从Boot到应用的教程
Bilibili视频讲解地址(待完成):才鲸嵌入式


工程名称 作用
01_Hello_world 使用Keil的模拟器在虚拟终端输出Hello world
02_Keil_boot_comments Keil自带汇编boot的注释
03_Self_assembler_boot 自行实现汇编boot
04_Uart_loopback 串口收发回环,使用Keil的虚拟终端窗口
05_Assembler_func 汇编函数的编写
06_Hardware_arch_code 将硬件相关的代码与系统逻辑代码分离
07_OS_kernel 移植操作系统线程管理模块
08_OS_memory 移植操作系统内存管理模块,实现malloc、free
09_OS_filesystem 移植操作系统文件系统模块
... ...

一、前言

1)本仓库的目的

  • 本仓库计划实现的内容:

    • 描述Cortex-M3的指令集和通用寄存器。
    • 针对M3内核,使用汇编从复位开始写boot引导C语言main()函数。
    • 不使用任何芯片厂商提供的开发包,自己写Boot,自行移植C语言库函数,自己写所有驱动和应用。
    • 移植一款RTOS操作系统。
  • 本仓库面向的目标读者:

    • 使用M3的某一款芯片写过驱动或应用,但是对M3的boot过程和底层代码不熟悉的。
    • 没接触过ARM,对32位芯片的工作流程感兴趣的。
    • 对整个嵌入式裸机软件结构感兴趣的。
  • 不适用本仓库的读者:

    • 想尽快用ARM芯片写出一个项目的(这时应该直接使用STM32,调用它丰富且使用简洁的库)。
    • 不想使用模拟器,而是想直接使用一款硬件运行程序的。

2)M3介绍

  • M3由ARM公司于2004年推出,至今仍是很多单片机芯片使用的内核,如STM32F10x系列。

  • ST公司于2007年首次使用ARM公司的内核,产品是F1,随后凭借其简洁易用的软件开发包逐渐发展出著名的STM32系列,累计出货量近百亿颗。

  • M3属于ARMv7架构,ARMv7是ARM11之后的版本。

  • M3属于Cortex系列,该系列有三类:A、R和M,比如熟悉的Cortex-A9。

  • M3内核仅33000门。

  • M3不能使用ARM指令集,而是使用Thumb或Thumb-2指令集。

    • M3使用Cortex微控制器软件接口标准 (CMSIS)作为硬件抽象层。
    • M3最大支持512M代码,512M SRAM,1G外部RAM,详见芯片文档的“3.4 Processor memory model”,芯片文档下载地址见本文档下面第三章。
    • M3的R0~R15通用寄存器介绍详见芯片文档的“3.8 Processor core register summary”。
    • M3的系统控制寄存器介绍详见芯片文档的“4.1 System control registers”,共有36个,如定时器、中断控制、系统状态、内存模式、指令集设置。
  • 参考资料:

MCU缺货涨价后的国产化浪潮(三):全球 MCU 市场高度集中,多因素共振加速国产替代 文章里也列出了全球和国内的MCU厂商和所有嵌入式的行业。
ARM CORTEX-M3简介
ARM Cortex-M3 ARM发布适于高性能、低成本应用的Cortex-M3处理器

3)开发环境

二、ARM-MDK IDE集成开发环境下载

  • MDK-arm软件社区版官方介绍(无代码大小限制,不能用于商用,需要先获取社区版许可证,也就是在官网注册账号后再下载):MDK-社区版概述
  • 获取社区版许可证:Log in with your Arm or Mbed account
  • 下载地址主界面:MDK Community Edition
  • 下载地址举例:https://www.keil.com/fid/comahow53j1j1wriguw1y56me9lv1dgw3o3fd1/files/eval/mdk536.exe
  • MKD-arm评估版软件官方下载地址(也就是不注册账号就下载,有32K代码限制):mdk536.exe
  • 安装的时候会自动下载各种芯片包。
  • MKD里面有硬件模拟器,可以直接运行和调试程序,你也可以编译完生成可执行程序后在QEMU软件里面仿真运行。
  • Keil创建M3工程的流程可以网上自行搜索,创建时可以添加ARM官方提供的各个模块的代码,可以节省开发时间。

三、M3指令集和寄存器介绍

1)M3文档在线阅读及下载

2)其它ARM核指令集介绍

四、Keil汇编伪指令介绍

五、软件工程及源码

1)01_Hello_world

  • 创建一个M3工程,使用Keil模拟器运行,在Keil软件的调试终端输出Hello world。
  • 创建工程的过程参考以下网址:
  • 进行printf输出重映射,将输出映射到Keil的Debug(printf) Viewer窗口
  • 工程和源码在本文档同级目录\src\01_Hello_world\下
  • 第一打开工程时,需要自己点击软件上面窗口中带小串口的图标,打开Debug(printf) Viewer窗口
  • 注意!文件使用了UTF-8编码,需要在Keil中进行设置才能正常显示中文,否则会显示乱码:Edit-->Configuation-->Encoding-->Encoding in UTF-8 without signature;因为GB2312在Git中会显示乱码,并且在Linux中使用GB2312会很不方便,从Linux和Windows中来回转时一不留神会用错误的编码报错导致中文丢失。

2)02_Keil_boot_comments

  • 给Keil自带的boot加上注释
  • 工程和源码在本文档同级目录\src\02_Keil_boot_comments\下
    • Keil自带的boot代码的汇编底层在Keil自带的工具包中,看不到,只注释能看到的C代码部分
    • Keil自带的boot代码的类汇编文件是.svt
    • Keil自带的头文件也在自己的工具包中,不能更改
    • 这个工程看不到boot的完整流程,下个工程会演示从第一行汇编代码引导到main.c的过程
    • 注意:ARMCM3_ac6.sct文件的注释使用了GB2312编码,已经配置了UTF-8的Keil中直接打开会显示乱码,其它的文件都是UTF-8格式

3)03_Self_assembler_boot

; 使用Keil自动生成时,也可用纯C写Boot相关的配置

                INCLUDE YOUR_CONFIG.INC ; #include "YOUR_NAME.INC" 包含头文件
; 用户自定义宏定义
YOUR_CONFIG1    EQU 0x01    ; 类似于#define宏定义,用不同的配置选项配置程序
YOUR_CONFIG2    EQU 0x01

                PRESERVE8   ; 指定当前文件要求堆栈八字节对齐
                THUMB       ; 使用THUMB指令集,不使用ARM指令集

; 定义堆,堆是malloc主动分配内存的位置
Heap_Size       EQU 0       ; Heap_Size是MDK指定的堆空间长度名称;不用malloc分配的堆没什么用,所以长度设置为0
                IF Heap_Size != 0       ; IF ELSE ENDIF和同名宏定义的含义类似
                AREA     HEAP, NOINIT, READWRITE, ALIGN=3 ; 申明开辟名为HEAP的内存,不写入值初始化,可读可写,2^3 8字节对齐
                EXPORT   __heap_base    ; MDK指定的名称,堆起始地址位置
                EXPORT   __heap_limit   ; MDK指定的名称,堆结束地址位置
__heap_base
Heap_Mem        SPACE    Heap_Size      ; 开始分配指定长度的内存
__heap_limit
                ENDIF

; 定义栈,栈是为全局变量自动分配空间的位置
Stack_Size      EQU      (4096)         ; Stack_Size是MDK指定的栈空间长度名称

                AREA     STACK, NOINIT, READWRITE, ALIGN=3 ; 申明开辟名为STACK的内存,不写入值初始化,可读可写,2^3 8字节对齐
                EXPORT   __stack_limit  ; MDK指定的名称,栈起始地址位置
                EXPORT   __initial_sp   ; MDK指定的名称,栈结束地址位置

__stack_limit
Stack_Mem       SPACE    Stack_Size     ; 开始分配指定长度的一片连续的内存
__initial_sp

                AREA     RESET, DATA, READONLY      ; 定义数据段,名字为RESET;上电后首先运行的函数地址
                EXPORT   __Vectors                  ; 输出ARM CMSIS中需要用到的一些标号,__Vectors函数在后续定义
                EXPORT   __Vectors_End
                EXPORT   __Vectors_Size
                EXPORT   Default_Interrupt_Handler  ; 中断入口
                IMPORT   __initial_sp

; 申明异常和中断入口
__Vectors       DCD      __initial_sp               ;     Top of Stack
                DCD      Reset_Handler              ;     Reset Handler
                DCD      NMI_Handler                ; -14 NMI Handler
                DCD      HardFault_Handler          ; -13 Hard Fault Handler
                DCD      MemManage_Handler          ; -12 MPU Fault Handler
                DCD      BusFault_Handler           ; -11 Bus Fault Handler
                DCD      UsageFault_Handler         ; -10 Usage Fault Handler
                DCD      0                          ;     Reserved
                DCD      0                          ;     Reserved
                DCD      0                          ;     Reserved
                DCD      0                          ;     Reserved
                DCD      SVC_Handler                ;  -5 SVCall Handler
                DCD      DebugMon_Handler           ;  -4 Debug Monitor Handler
                DCD      0                          ;     Reserved
                DCD      PendSV_Handler             ;  -2 PendSV Handler
                DCD      SysTick_Handler            ;  -1 SysTick Handler

                ; Interrupts
                DCD      Interrupt_Handler_0
                ; …… 省略其它中断 ……
                DCD      Interrupt_Handler_45       ; BCD:分配存储单元
__Vectors_End
__Vectors_Size  EQU      __Vectors_End - __Vectors

                ; 类似于宏定义函数
                MACRO                               ; 宏定义函数的开始 
                Set_Default_Handler $Handler_Name   ; 前一个时宏定义函数的名字,后面是要操作的对象
$Handler_Name   PROC                                ; 定义子程序
                EXPORT   $Handler_Name [WEAK]       ; 输出函数名;[WEAK]虚函数,可定义可不定义
                B        .                          ; 死循环
                ENDP                                ; 子程序定义结束
                MEND                                ; 宏定义函数结束

                AREA     |.text|, CODE, READONLY    ; 定义.text代码段,只读

                ; 申明默认的异常和中断处理函数
                Set_Default_Handler  Reset_Handler
                Set_Default_Handler  NMI_Handler
                Set_Default_Handler  HardFault_Handler
                Set_Default_Handler  MemManage_Handler
                Set_Default_Handler  BusFault_Handler
                Set_Default_Handler  UsageFault_Handler
                Set_Default_Handler  SVC_Handler
                Set_Default_Handler  DebugMon_Handler
                Set_Default_Handler  PendSV_Handler
                Set_Default_Handler  SysTick_Handler
                Set_Default_Handler  Default_Interrupt_Handler
                Set_Default_Handler  Interrupt_Handler_0
                ; …… 省略其它中断 ……
                Set_Default_Handler  Interrupt_Handler_45
 
               ; 各种程序
                ; Reset_Handler是板子上电后首先执行的位置,它由异常中断的跳转来实现
Reset_Handler   PROC                    ; 程序名 PROC 程序内容 ENDP 程序结束
                EXPORT   Reset_Handler
                IMPORT	 __hardwareInit ; 自己编写的C程序,在里面初始化各种硬件配置
                IMPORT   __main         ; main()函数入口
                BL       __hardwareInit ; 调用初始化硬件的汇编函数
                BL       __main         ; 跳转到main()函数
                BL       cpuStall       ; 程序退出后一直死循环
                ALIGN
                ENDP

cpuStall        PROC
                EXPORT   cpuStall
                B        .              ; 死循环
                ENDP
                END                     ; 通知编译器已经到了该源文件的结尾了

__hardwareInit  PROC
                EXPORT   __hwInitialize
                PUSH     {R0,R1,R2,R3,LR} ; 压栈
                ; 配置GPIO输出
                ; 配置PLL系统主频,将主频从晶振原有的频率提高到实际的工作频率
                ; 初始化串口
                ; 初始化其它外设
                POP      {R0,R1,R2,R3,LR} ; 弹栈
                BX       LR               ; 跳转到LR寄存器里的地址执行,也就是跳转回被调用的地方
                ALIGN
                ENDP

                ; 其它的.inc汇编头文件中要做的事
                ; 定义各个硬件模块的地址
                ; 定义所有中断号

4)04_Uart_loopback

  • 使用Keil模拟器和Debug (printf) Viewer窗口实现scanf输入,并进行串口收发回环。
    • 工程和源码在本文档同级目录\src\04_Uart_loopback\下
    • Keil配置的Debug栏要选择Use Simulator,不能选择默认的ULINK2/ME Cortex Debugger
    • 创建工程方法:在Keil上新建一个工程,勾选CMSIS中的CORE,勾选Device中的Startup,一定要勾选Compiler--IO下的STDEER、STDIN、STDOUT,并将右侧的Breakpoint都改为ITM;不用重定向fgetc和fputc,直接使用scanf和printf即可。
    • 如果有报错Error: L6218E: Undefined symbol Image$$ARM_LIB_STACK$$ZI$$Limit Not enough information to list image,则按网址中的描述配置一下链接器.sct文件路径。
    • 在国内和国外的网站上都没找到介绍使用fgetc输入重定义,用scanf从Keil Debug (printf) Viewer窗口获取数据的方法,最终从Keil官网找到了。
    • 这是有效的方法:µVision User's Guide - Debug (printf) Viewer
    • 在网上还找到了使用ITM_CheckChar()和ITM_ReceiveChar()来实现fgetc,但需要需要添加core_cm3.h头文件和stm32f1xx.h头文件,而我直接使用的是M3核,并没有stm32的头文件,所以这个方法失败。
    • MDK的Debug (printf) Viewer窗口不像C51的UART #1窗口,UART #1在网上能很容易的找到教程,通过VSD虚拟串口软件,将Keil C51的调试串口和电脑的虚拟串口相绑定,这样就能使用SSCOM或者PUTTY等串口软件收发二进制数据了;Debug (printf) Viewer窗口我还没找到绑定的方法,所以当前scanf不能获取到16进制和int型的数据,只能获取到字符和字符串,但是这对使用模拟器仿真程序来说够用了。

5)05_Assembler_func

  • 如何写汇编函数,汇编宏定义函数
  • 工程和源码在本文档同级目录\src\05_Assembler_func\下

6)06_Hardware_arch_code

  • ==》该工程内容未编写,工程里只有没有的文件…………《==

  • 将硬件arch和系统逻辑代码分离

  • 仿照Linux kernel的文件结构,将系统底层硬件相关的文件独立出来,让后将相关代码放在名为arch的文件夹中

  • 实现通用的操作系统底层硬件相关的接口,如中断控制、时钟基准、大小端转换、系统退出、输入输出重映射、延时函数

  • 工程和源码在本文档同级目录\src\06_Hardware_arch_code\下

  • 本仓库中的源码以Linux kernel中对应的文件为参考

  • Linux kernel源码与相关文件的介绍

      1. 获取kernel源码,下载或clone的地址:Gitee 极速下载 / Linux Kernel,源码总大小5.3G,.git历史数据的大小有3.8G,源码有1.3G左右;
      1. Windows下下载后解压会报错,Git clone后checkout .检出文件也会报错,因为有三个文件名aux.c和aux.h和Windows预留文件名重合,Windows只允许自己使用:'drivers/gpu/drm/nouveau/nvkm/subdev/i2c/aux.c', 'drivers/gpu/drm/nouveau/nvkm/subdev/i2c/aux.h','include/soc/arc/aux.h',类似的文件名还有COM1到COM9,LPT1到LPT9;可以将kernel仓库在Windows上下载或者clone后拷贝到Linux系统如Ubuntu中,然后checkout或者解压,然后切换到发布版本版本,git checkout 然后将上述三个文件重命名或者删除,将.git隐藏文件删除,然后拷贝回Windows系统,便于查看代码。
    • 如果你只是查看kernel代码,则可以删除.git文件夹,arch/下除了arm的其它文件夹,arch/arm/下match-开头的文件夹只保留一个你熟悉的板子型号,如match-stm32,这样创建工程后查看代码跳转时更方便。

7)07_OS_kernel

  • ==》该工程内容未实现,工程编译不过…………《==

    • Atomthreads M3硬件相关的代码原本是适配Linux下的,移植到Keil中比较麻烦,已放弃
  • 嵌入式常见的RTOS有好几个,很多都是线程管理、内存管理、驱动框架、文件系统框架等操作元素合在一起的,移植起来复杂一点,我需要更简单的演示;所以我这里选用Atomthreads,它纯粹就只有一个OS中的进程管理模块,总共也只有6个.c文件,内容简单,便于理解;可以熟悉移植线程管理模块需要修改哪些硬件相关的代码;它也可以移植到8位CPU上面。

  • 工程和源码在本文档同级目录\src\07_OS_kernel\下

  • 更多的移植流程详见子文档[《03_ARM Cortex-M3 Atomthreads操作系统内核移植过程.md》](./doc/03_ARM Cortex-M3 Atomthreads操作系统内核移植过程.md)

  • Keil模拟器的介绍详见子文档《04_Keil模拟器介绍.md》

  • 其它几个操作系统移植时需要的配置操作:

    • uCOS系统比较简单,配置没有图形界面或者字符界面,就是宏定义文件。
    • FreeRTOS配置也没有图形界面或者字符界面,就是宏定义文件。
    • RT-Thread系统配置在Windows下有图形界面,在Linux有Linux内核同款的menuconfig字符配置界面,配完后会生成一个有宏定义的头文件。
    • 自己写操作系统时,也可以用menuconfig模块作为你的配置界面。
    • eCos有自己的图形配置界面。
    • Linux使用menuconfig字符配置界面。

嵌入式操作系统-ucos的移植(上)
RT-Thread 之 PWM 设备驱动详细配置过程(血泪经验)
RTThread Studio开发STM32基本工程配置
rtthread 4.0 shell的裁剪
使用eCos图形化配置工具管理eCos应用程序
uCOSII、eCos、FreeRTOS和djyos操作系统的特点及不足
关于ucosII系统的软件系统裁剪性
FreeRTOS(1)---FreeRTOS 内核配置说明


  • Keil创建STM32F103ZG工程
  • 创建工程时选择CMSIS--CORE,Compiler--I/O--STDERR/STDIN/STDOUT--ITM,Device--Startup
  • 在软件配置的Debug页面,选择模拟器Use Simulator,并且将Cortex-M3的模拟器库改成STM32F1xx的,步骤未:将DCM.DLL和-pCM3改为DARMSTM.DLL和-pSTM32F103ZG
  • 防止仿真时出错:新建一个debug_map.ini文件,里面写上map 0x40000000,0x400FFFFF read write保存;在魔术棒的设置图标Options->Debug->Use_Simulator->Initialization_File,选中刚刚的文件。
  • 工程里新建一个main.c,写上main()函数,里面写printf语句,编译,debug调试,点开Debug(printf) Viewer窗口中能看到你的输出语句。
  • 加入Atomthreads kernel部分的源码,设置窗口--C/C++(A6)--Include Paths中加入该源码的文件夹路径,用于加载头文件。
  • 自己写硬件相关的部分(也就是移植操作系统kernel),给kernel提供atomport.h头文件。
  • 先熟悉整个kernel,看看源码中需要哪些底层支撑,顺便给kernel源码加上注释。
  • 写个atomport.h文件,里面加上一些宏定义;写个atomport.c,里面实现3个空函数;先保证整个工程编译通过,然后再看具体要实现什么东西;具体弄清楚要实现的东西,也就能对内核需要哪些硬件支撑有了解了。
  • 去掉keil自带的一些警告输出。
  • 操作系统移植的工作:
    • 开启一个硬件定时器,在定时器的中断函数中调用atomIntEnter、atomIntExit、函数
    • 新建atomport.c/h文件,在里面实现archFirstThreadRestore、archContextSwitch、archThreadContextInit函数,实现读取中断状态寄存器、关中断、恢复中断;用汇编语言,使用CPU的R0~R15状态寄存器和其它寄存器进行任务切换。
    • 底层还能再实现一个task任务模块。

8)08_OS_memory

  • ==》该工程内容未编写…………《==

  • 工程和源码在本文档同级目录\src\08_OS_memory\下

  • 内存操作实际上就是对Heap堆的操作。

  • Keil也自带了堆操作的库,已经实现了malloc和free,直接在工程里勾选微库MicroLI即可,微库内部位置一个堆管理模块。

  • 使用开源的dlmalloc可以实现操作系统中的内存管理模块,只有一个.c和一个.h就可实现。

    • 第一个下载地址是mirrors_android_source / dlmalloc,但是不用这里面的代码
    • 上面下载的版本里面有安卓加的少量修改,但是文件的注释里面有没修改的原始地址,是ftp的方式:ftp://gee.cs.oswego.edu/pub/misc/malloc.c 和ftp://gee.cs.oswego.edu/pub/misc/malloc-2.8.6.h ,如果你不会ftp下载,可以直接网页访问https://gee.cs.oswego.edu/pub/misc/ 复制里面的malloc-2.8.6.c和malloc-2.8.6.h,将其改名为dlmalloc.c和dlmalloc.h。
    • 在.c源码里加入dlmalloc_init和dlmalloc_sbrk函数,传入你给内存分配器分配的总内存。
    • 然后在.h头文件里加入MALLOC_ALIGNMENT、malloc_getpagesize等一系列配置宏定义。
    • 然后在程序中调用dlmalloc_init函数初始化后,你就可以使用malloc和free了
  • 参考网址:

  • dlmalloc(一)

9)09_OS_filesystem

  • ==》该工程内容未编写…………《==

  • 工程和源码在本文档同级目录\src\09_OS_filesystem\下

  • 使用FatFs开源嵌入式文件系统,里面只有7个源文件,支持exFAT和FAT32格式的U盘、SD卡等,支持Unicode中文和ANSI/OEM GB2312中文。

    • 源码中已适配uC/OS-II、FreeRTOS和Keil CMSIS-RTOS操作系统。
    • 官方下载地址FatFs,下载地址比较慢。
    • 添加头文件实现DWORD、QWORD、UINT、BYTE、WORD、WCHAR、TCHAR等数据类型定义。
    • 将ffconf.h中的配置宏定义和你自己系统中的宏定义结合统一起来。
    • 实现diskio.c中要调用的底层USB、SD卡等驱动的文件读写接口。
  • 参考网址:

  • Fatfs(文件系统的移植)

  • FatFs(通用FAT文件系统模块)下载与介绍