事件概述
2026 年 2 月 11 日,千叶大学与福岛 F-REI 研究机构的 研究人员在期刊 Drones(第 10 卷第 2 期)发表论 文,详细介绍了一套面向自主无人机电力基础设施巡检的完整边缘部署方案。该系统由 Zhengran Zhou、Wei Wang、Hao Wu、Tong Wang 及 Satoshi Suzuki 共同署名,完全运行于 基于 RK3588 的定制机载计算机上,推理速度达 111.3 FPS,端到端延迟仅 23ms,无需任何云端或地面站算力支 持。
RK3588 SoC 的 NPU 算力仅为 6 TOPS。 为在该硬件上达到可用的帧率,研究团队将三项模型改进与一套 名为 DVSPS(Digital Video Stream Processing System)的自定义异步视频处理系统相结合。
为何重要
电网巡检是自主无人机最明确 的近期落地场景之一:任务高度重复、环境结构清 晰、漏检缺陷的代价极高。当前主流部署模式——按 预设航线飞行、事后离线分析录像——引入了数小时乃至数 天的处理延迟。实时机载检测将这一延迟压缩至 23ms。
这篇论文在操作层面的重要意义在于实现了完 整闭环。该系统无需外部航点即 可完成铁塔杆自主定位与导线 跟踪,意味着检测、导航与决策均在同一块 6 TOPS 计算板 上运行。这消除了对上行链路的依赖——正是 这种依赖使实时边缘 AI 在 LTE 覆盖不 稳定的野外环境中极为脆弱。
硬件平台的选择同 样关键。RK3588 是一款商用低功耗嵌入式 SoC。 在量产边缘芯片上可复现的 111 .3 FPS 结果,其部署价值远超数据中心 GPU 上 的基准测试。作者在涵盖城市与山地 环境的 11,451 张高分辨率图像定制数据集上完成了验证, 而非经过精心筛选的实验室数据集。
技术细节
模型压缩:三阶段流程
研究团队在三个层面 对 YOLOv8 进行了改进:
- VanillaBlock 重参 数化(Backbone):替换 C2F 模块。训练 阶段,堆叠的 ReLU 激活函数保留非线性表达能力;推理阶段, Batch Normalization 参数被折叠进卷积权重,激活函数退化为线性映射, 相邻线性卷积层合并为单一操作。
- Slim-Neck(Neck):用 GSConv + VoV -GSCSP 替换 Neck 中的 C2F。GSConv 将标 准卷积与深度可分离卷积结合,通过通道混洗 维持特征交互,同时降低参数量。
- 结构化剪枝:对 BN 层缩放因子(γ)施加 L1 正则化,移 除低 γ 值通道后进行微调。在剪枝率 0.8 的条件下,最终模型的计算量为 3.7 GFLOPs,参 数量为 1.92M。
消融实验结果(COCO val2017,RTX 4080)
最优 Backbone/Head 组合——VanillaBlock + VoV-GSCSP——与 C2F(BN) + C2F(BN) 基线对比:
- mAP50:87.9% vs. 83 .0%(+4.9 个百分点)
- FLOPs:5.7G vs. 8.2G(-30.5%)
- 延迟:4.8ms vs. 5.0ms(-4.0%)
经 INT8 量化并 转换为 RKNN 格式部署至 RK3588 后,该模型在电 力巡检数据集上的 mAP50 达 84.2%。
DVSPS: 系统级吞吐优化
模型推理速度本身并不等于系统吞吐量。DVSPS 通过三 个组件对完整处理流程进行优化:
- RKNN Pool:在 RK3588 的全部三个 NPU 核心间动态调度,实现并行推理, 而非单核串行利用。
- Thread Pool:将视频解码、模型推理 与结果传输异步解耦,各阶段并发执行,从而 隐藏单阶段延迟。
- MPP Hardware Codec:调用 RK3588 内置的 Media Process Platform 实 现 H.265 硬件加速编解码,将 CPU 从编解 码负载中释放出来。
训练在 RTX 4080 + i9-14900K 上
进行,共 300 个 epoch,批大小为 16,输入分辨率 640×640
,使用 AdamW 优化器,初始学习率为 1e-3。数据集划
分为:训练集 9,160 张 / 验证集 1,145 张 / 测试集
1,146 张,涵盖五类目标:塔头组件、混凝土
杆身、绝缘子、混凝土杆顶段、混凝土杆
嵌入段。
后续关注点
- 代码与 数据集开源:论文未确认 11,451 张图 像数据集或 DVSPS 源代码的公开计划。建议在未来 30 天内持 续关注千叶大学及 F-REI 福岛的代码 仓库,留意潜在的开源跟进动态。
- RK3588 的竞争压力:Rockchip 下一代 NPU 路线图与 竞争边缘 SoC(Hailo-8、Qualcomm QCS)正在向相同的每瓦 推理性能目标汇聚,本文基 准测试为横向比较树立了具体 参照。
- 监管环境:日本《航空法 》Level 4 自主无人机审批进展(与 F-REI 福 岛的参与密切相关)或将加速或制 约此类系统在 2026 年第一季度内 的实际落地部署。
- 泛化能力验 证:现有数据集仅覆盖城市与山地环境,本文尚未验证模型在 沿海或工业走廊输电线路——具 有不同铁塔几何形态——场景下 的性能表现。