别再写"超级循环"了！裸机系统跑得快的秘密，全在架构上

作者：一枚嵌入式码农

690 次浏览

13 次

2026-4-1

编辑推荐:

文章主要介绍了裸机（无操作系统）嵌入式系统的软件架构设计方法,希望对你的学习有帮助。
本文来自于一枚嵌入式码农，由火龙果软件Alice编辑、推荐。

裸机开发这件事，门槛低，天花板高。

随便写个 while(1) 主循环，里面堆上一堆 if 判断，程序确实能跑起来。但跑起来和跑得好，完全是两码事。很多工程师写了三五年裸机代码，项目越来越大，代码越来越乱，最后系统响应迟钝、功耗居高不下、新功能加不动——问题出在哪？不是裸机不行，是架构没跟上。

做嵌入式开发的这些年，最深的一个体会是：裸机系统的效率瓶颈，90%不在CPU算力上，而在软件架构上。同样一颗Cortex-M0，架构好的方案能把CPU利用率控制在15%以内，架构差的方案80%都打不住。差距就是这么大。

这篇文章把我们来聊聊在裸机项目中用过的、验证过的架构方法。不扯教科书理论，只谈工程实战。

先搞清楚：你的主循环是哪种架构？

你可能见过太多项目，主循环写成这样：

int main(void)
{
    system_init();

    while (1) {
        read_sensor();
        process_data();
        update_display();
        check_button();
        send_uart_data();
        check_timeout();
        // ... 还有二十几个函数
    }
}

这是最原始的顺序执行架构，也叫"超级循环"。它的问题很明显：

每个函数都要等上一个跑完才能执行
某个函数一旦阻塞，整个系统卡死
任务之间没有优先级，按键响应和传感器采集被一视同仁

这种写法在简单项目里没问题，但一旦系统复杂度上来，立刻暴露短板。

主循环架构的演进路线大致是这样的：

下面逐个拆解。

时间片轮询：裸机系统的第一次质变

从超级循环到时间片轮询，是裸机架构最关键的一步。

核心思路很简单：用一个硬件定时器产生固定节拍（比如1ms），然后给每个任务分配不同的执行周期。这样每个任务只在自己的时间窗口里运行，互不干扰。

/* 软件定时器结构体 */
typedef struct {
    uint32_t period;      /* 执行周期（ms） */
    uint32_t counter;     /* 当前计数 */
    uint8_t  ready;       /* 就绪标志 */
    void (*task)(void);   /* 任务函数 */
} soft_timer_t;

/* 任务表 */
static soft_timer_t task_table[] = {
    { .period = 10,   .task = key_scan      },  /* 按键：10ms扫描 */
    { .period = 20,   .task = sensor_read   },  /* 传感器：20ms采集 */
    { .period = 100,  .task = display_update },  /* 屏幕：100ms刷新 */
    { .period = 1000, .task = watchdog_feed  },  /* 看门狗：1s喂一次 */
};

/* SysTick中断里只做计数和置标志，不执行任务 */
void SysTick_Handler(void)
{
    for (int i = 0; i < TASK_COUNT; i++) {
        if (++task_table[i].counter >= task_table[i].period) {
            task_table[i].counter = 0;
            task_table[i].ready = 1;  /* 只置标志！ */
        }
    }
}

/* 主循环里轮询标志位，执行就绪的任务 */
int main(void)
{
    system_init();

    while (1) {
        for (int i = 0; i < TASK_COUNT; i++) {
            if (task_table[i].ready) {
                task_table[i].ready = 0;
                task_table[i].task();
            }
        }
    }
}

这套方案有几个关键的设计要点：

1. 中断里只置标志，不执行任务。这是铁律。在中断里执行复杂逻辑是裸机系统最常见的翻车原因之一。中断应该像"传令兵"，告诉主循环该干活了，但自己不动手。

2. 任务周期要合理分配。不是所有事情都需要1ms执行一次。按键扫描10ms足够了（加上消抖正好），屏幕刷新100ms人眼根本看不出区别。周期分配得当，CPU就有大量空闲时间可以进低功耗模式。

3. 任务函数必须是非阻塞的。每个任务函数执行完要快速返回，绝不能在里面写 delay_ms() 或者死等某个标志位。这一点后面还会展开。

时间片轮询的执行流程：

这套架构在实际项目中应用还是非常广泛的，从温控器到工业网关，覆盖面非常广。它的优势在于简单、可靠、可预测——你能精确知道每个任务多久执行一次，系统行为完全确定。

事件驱动：让CPU"按需工作"

时间片轮询解决了任务调度问题，但它有一个本质缺陷：不管有没有事情发生，任务都在周期性执行。

传感器没有新数据？照样读。按键没人按？照样扫。这些无效执行浪费了CPU时间，更关键的是——在电池供电的产品上，浪费了功耗。

事件驱动的思路正好相反：没有事件，CPU就休眠；有事件，才唤醒处理。

/* 事件类型定义 */
typedef enum {
    EVT_NONE = 0,
    EVT_KEY_PRESS,
    EVT_SENSOR_READY,
    EVT_UART_RX,
    EVT_TIMER_TIMEOUT,
    EVT_ADC_DONE,
} event_type_t;

/* 简易事件队列 */
#define EVT_QUEUE_SIZE  16

typedefstruct {
    event_type_t buf[EVT_QUEUE_SIZE];
    uint8_t head;
    uint8_t tail;
} event_queue_t;

static event_queue_t evt_queue;

/* 中断中投递事件 */
void EXTI_IRQHandler(void)
{
    event_post(EVT_KEY_PRESS);
}

void DMA_UART_IRQHandler(void)
{
    event_post(EVT_UART_RX);
}

/* 主循环：取事件 → 分发处理 → 无事件则休眠 */
int main(void)
{
    system_init();

    while (1) {
        event_type_t evt = event_get();

        if (evt != EVT_NONE) {
            event_dispatch(evt);   /* 根据事件类型调用对应处理函数 */
        } else {
            __WFI();  /* 没有事件，进入低功耗等待 */
        }
    }
}

事件驱动和时间片轮询的对比：

在一个电池供电的无线传感器节点项目中，我把原来的时间片轮询改成事件驱动后，待机功耗从1.2mA降到了18μA。差距接近70倍。

不过事件驱动也不是银弹。它的复杂度比时间片轮询高不少，事件队列的溢出处理、事件优先级、事件丢失检测这些都需要额外设计。我的建议是：对响应速度和功耗有要求的模块用事件驱动，对实时性要求不高的后台任务仍用时间片轮询，两者混合使用。

中断管理：裸机系统的命脉

裸机系统没有操作系统帮你管理中断，所有中断逻辑都得自己把控。中断写得好，系统又快又稳；写得差，各种玄学问题层出不穷。

我总结了三条中断铁律，违反任何一条迟早要出事：

铁律一：中断处理函数越短越好

中断里只做三件事：清标志、存数据、发通知。其他一概不做。

/* 反面教材：在中断里处理业务逻辑 */
void UART_IRQHandler(void)
{
    uint8_t data = UART->DR;

    // 以下操作全都不应该出现在中断里
    if (data == FRAME_HEAD) {
        parse_frame();        // 协议解析？不行
        crc_check();          // CRC校验？不行
        execute_command();    // 执行命令？更不行
        update_display();     // 刷屏？离谱
    }
}

/* 正确做法：中断里只收数据，主循环里处理 */
void UART_IRQHandler(void)
{
    uint8_t data = UART->DR;
    ring_buf_put(&uart_rb, data);   /* 扔进环形缓冲区 */
    event_post(EVT_UART_RX);        /* 通知主循环 */
}

铁律二：搞清楚中断优先级分组

Cortex-M的NVIC支持中断优先级和抢占，但很多人从来没认真配过，全用默认值。结果就是：一个低优先级的串口中断把高优先级的电机控制中断给堵了，电机啪地一下失控。

铁律三：保护共享数据

中断和主循环之间共享的变量，必须做保护。最基本的方式是开关中断：

/* 共享变量 */
volatile uint32_t g_adc_value;

/* 中断中写入 */
void ADC_IRQHandler(void)
{
    g_adc_value = ADC->DR;
}

/* 主循环中读取——必须保护 */
uint32_t read_adc_safe(void)
{
    uint32_t val;
    __disable_irq();    /* 关中断 */
    val = g_adc_value;
    __enable_irq();     /* 开中断 */
    return val;
}

对于32位变量在32位MCU上的读写，单次访问本身是原子的，可以不加保护。但如果涉及64位数据、结构体、或者"读-改-写"操作，保护不可省略。另外别忘了 volatile 关键字——少了它，编译器优化可能让你的共享变量永远读到旧值。

状态机：把复杂逻辑拍平的利器

裸机编程最难处理的是什么？不是算法，不是驱动，是复杂的业务流程。

一个充电桩的充电流程就涉及：待机→插枪检测→鉴权→预充→恒流充电→恒压充电→充满→结算，中间还有各种异常处理。用 if-else 硬写，代码很快就会变成一团乱麻。

状态机是解决这类问题的标准手段。它的核心思想是：把系统行为拆分成有限个状态，明确每个状态下该做什么、在什么条件下跳转到哪个状态。

/* 充电状态定义 */
typedef enum {
    ST_IDLE,          /* 待机 */
    ST_PLUG_DETECT,   /* 插枪检测 */
    ST_AUTH,          /* 鉴权 */
    ST_PRE_CHARGE,    /* 预充 */
    ST_CC_CHARGE,     /* 恒流充电 */
    ST_CV_CHARGE,     /* 恒压充电 */
    ST_FULL,          /* 充满 */
    ST_FAULT,         /* 故障 */
} charge_state_t;

/* 状态处理函数表 */
typedefstruct {
    charge_state_t state;
    charge_state_t (*handler)(void);  /* 返回下一个状态 */
} state_entry_t;

static state_entry_t state_table[] = {
    { ST_IDLE,        handle_idle        },
    { ST_PLUG_DETECT, handle_plug_detect },
    { ST_AUTH,        handle_auth        },
    { ST_PRE_CHARGE,  handle_pre_charge  },
    { ST_CC_CHARGE,   handle_cc_charge   },
    { ST_CV_CHARGE,   handle_cv_charge   },
    { ST_FULL,        handle_full        },
    { ST_FAULT,       handle_fault       },
};

/* 状态机主调度 */
void charge_fsm_run(void)
{
    static charge_state_t current = ST_IDLE;

    for (int i = 0; i < STATE_COUNT; i++) {
        if (state_table[i].state == current) {
            charge_state_t next = state_table[i].handler();
            if (next != current) {
                LOG("State: %s -> %s", state_name(current), state_name(next));
                current = next;
            }
            break;
        }
    }
}

状态机的状态跳转关系：

状态机的好处，用过的人都知道：

1. 逻辑清晰 ——每个状态的行为独立，出了问题直接定位到具体状态的handler函数
2. 天然非阻塞 ——每次调用 fsm_run() 只执行当前状态的逻辑，不需要等待，完美配合时间片轮询
3. 易于扩展 ——加一个新状态，只需要增加一个枚举值和对应的handler，不影响其他状态
4. 方便调试 ——状态跳转加个日志，整个流程一目了然

消灭delay——裸机效率的头号杀手

如果让我只给一条建议来提升裸机系统效率，那就是：干掉所有的阻塞延时。

delay_ms(100) 这行代码看起来人畜无害，但它的本质是让CPU空转100ms，什么都不干。在一个10ms轮询周期的系统里，一个100ms的delay意味着其他所有任务被阻塞了10个周期。

非阻塞延时的实现非常简单，用系统节拍做时间戳比较就行：

/* 非阻塞延时：基于时间戳比较 */

static uint32_t sys_tick_ms;  /* SysTick中断里递增 */

/* 判断是否超时 */
bool is_timeout(uint32_t start, uint32_t duration)
{
    return (sys_tick_ms - start) >= duration;
}

/* 典型用法：LED闪烁（非阻塞） */
void led_blink_task(void)
{
    static uint32_t last_toggle = 0;
    static bool led_on = false;

    if (is_timeout(last_toggle, 500)) {  /* 500ms翻转一次 */
        last_toggle = sys_tick_ms;
        led_on = !led_on;
        LED_Write(led_on);
    }
}

再看一个更实际的例子。串口发送AT指令等待模组回复，阻塞写法和非阻塞写法的对比：

/* 阻塞写法——整个系统卡死等回复 */
bool send_at_command_blocking(const char *cmd, uint32_t timeout_ms)
{
    uart_send_string(cmd);
    uint32_t start = get_tick();

    while (!uart_has_response()) {
        if (get_tick() - start > timeout_ms)
            return false;       /* 超时 */
        /* CPU在这里空转！其他任务全部停摆！ */
    }
    return true;
}

/* 非阻塞写法——用状态机分步处理 */
typedefenum { AT_IDLE, AT_WAIT_RSP, AT_DONE, AT_TIMEOUT } at_state_t;

static at_state_t at_state = AT_IDLE;
static uint32_t   at_start_tick;

void at_send_nonblock(const char *cmd)
{
    uart_send_string(cmd);
    at_start_tick = get_tick();
    at_state = AT_WAIT_RSP;
}

/* 在主循环中周期调用 */
at_state_t at_process(void)
{
    switch (at_state) {
    case AT_WAIT_RSP:
        if (uart_has_response()) {
            at_state = AT_DONE;
        } else if (is_timeout(at_start_tick, 3000)) {
            at_state = AT_TIMEOUT;
        }
        break;
    default:
        break;
    }
    return at_state;
}

两种写法功能完全一样，但非阻塞版本执行完立刻返回，其他任务完全不受影响。本质上，这就是把"等待"这个动作从"CPU空转"变成了"状态记录"。

这个思维转换是从"初级裸机开发"到"高级裸机开发"的分水岭。一旦养成这个习惯，你写的裸机系统在响应速度上不会比RTOS差多少。

分层设计：让裸机代码也能"工程化"

前面讲的都是运行效率，但还有一种效率同样重要—— 开发效率。

裸机项目最常见的困境是：代码跑得还行，但没人敢改。驱动和业务逻辑搅在一起，换个芯片要改几十个文件，加个新功能牵一发动全身。这种项目我接手过不少，重构的代价往往比重写还大。

解决办法是做分层：

举个例子，温度采集这个功能：

/* 驱动层：只管ADC怎么读 */
uint16_t drv_adc_read(uint8_t channel);

/* 服务层：把ADC原始值转成温度 */
float svc_get_temperature(void)
{
    uint16_t raw = drv_adc_read(ADC_CH_NTC);
    return ntc_raw_to_celsius(raw);  /* 查表或公式转换 */
}

/* 应用层：根据温度做业务判断 */
void app_temp_monitor(void)
{
    float temp = svc_get_temperature();

    if (temp > TEMP_ALARM_THRESHOLD) {
        alarm_trigger(ALARM_OVER_TEMP);
    }
}

每一层职责清晰。换了芯片，改 drv_adc_read 就够了，上面两层一行代码不用动。换了NTC型号，改 ntc_raw_to_celsius 的转换表，应用层也不受影响。

这种隔离带来的开发效率提升，在项目后期会越来越明显。

写在最后

回头看这篇文章讲的这些方法——时间片轮询、事件驱动、中断分层、状态机、非阻塞设计、分层架构——你会发现一个共同点：它们解决的都不是"怎么让代码跑通"的问题，而是"怎么把代码组织好"的问题。

这背后其实有一个更大的命题：软件设计。

做了这么多年嵌入式开发，我最大的感悟是，写代码的能力到了一定阶段就会见顶，真正拉开差距的是设计能力。同样是实现一个通信协议，有人写出来200行搞定、清晰可维护，有人写了2000行还到处是坑。差距不在编码速度，在设计思维。

而设计思维不是凭空产生的，它来自对设计模式的学习和实践。

本文中用到的状态机，本质上就是"状态模式"的朴素实现。事件驱动的消息分发，和"观察者模式"如出一辙。函数指针构建的handler表，就是"策略模式"的雏形。分层架构里驱动层对上层暴露统一接口，这是"适配器模式"和"外观模式"的应用。

这些设计模式不是Java和C++的专利。在C语言的嵌入式世界里，它们同样强大，甚至更有价值——因为资源受限的环境下，好的设计能省下真金白银的硬件成本。

690 次浏览

13 次

企业架构、TOGAF与ArchiMate概览

架构师之路-如何做好业务建模？

大型网站电商网站架构案例和技术架构的示例

完整的Archimate视点指南（包括示例）