PyTorch-OpCounter终极指南：如何快速准确统计深度学习模型计算量

张开发

• 2026/4/16 16:36:08 • 15 分钟阅读

分享文章

PyTorch-OpCounter终极指南如何快速准确统计深度学习模型计算量【免费下载链接】pytorch-OpCounterCount the MACs / FLOPs of your PyTorch model.项目地址: https://gitcode.com/gh_mirrors/py/pytorch-OpCounterPyTorch-OpCounter也称为THOP是一款专为PyTorch模型设计的计算量统计工具能够帮助开发者轻松获取模型的MACs乘加运算次数和参数量Params。无论是优化模型性能、控制计算资源消耗还是论文实验中的模型复杂度对比这款工具都能提供精准的数据支持。为什么需要统计模型计算量在深度学习项目中模型的计算效率直接影响部署可行性和运行速度。例如资源受限场景如移动端、嵌入式设备需要控制模型大小和计算量论文实验中需对比不同模型的效率指标模型优化时需定位计算瓶颈层PyTorch-OpCounter通过自动化统计避免了手动计算的繁琐和误差让开发者专注于模型设计本身。快速开始3步安装与基础使用1️⃣ 安装方式推荐使用pip快速安装pip install thop如需获取最新版本可从源码安装pip install --upgrade githttps://gitcode.com/gh_mirrors/py/pytorch-OpCounter2️⃣ 基础使用示例以ResNet50模型为例仅需4行代码即可完成统计from torchvision.models import resnet50 from thop import profile model resnet50() input torch.randn(1, 3, 224, 224) # 模拟输入数据 macs, params profile(model, inputs(input, ))3️⃣ 优化输出格式使用clever_format函数可将结果转换为更易读的格式from thop import clever_format macs, params clever_format([macs, params], %.3f) print(f模型计算量: {macs}, 参数数量: {params})高级功能自定义模块统计规则对于自定义网络层可通过custom_ops参数添加统计规则class YourCustomModule(nn.Module): # 自定义模块实现 def count_custom_module(m, x, y): # 定义计算规则MACs 输出特征图大小 × 权重参数数量 macs y.numel() * m.weight.numel() return macs, 0 # (macs, params) # 使用自定义规则 macs, params profile(model, inputs(input, ), custom_ops{YourCustomModule: count_custom_module})常见模型计算量参考以下是基于benchmark/evaluate_famous_models.py的统计结果部分模型参数数量(M)计算量(G)ResNet5025.564.14MobileNetV23.500.33VGG16138.3615.61SqueezeNet1_11.240.35注计算量基于输入尺寸(1, 3, 224, 224)统计工具核心实现解析PyTorch-OpCounter的核心逻辑位于thop/profile.py通过以下步骤实现统计注册钩子为每个网络层注册前向传播钩子计算规则内置常见层Conv2d, Linear, LSTM等的计算规则递归统计深度优先遍历模型结构累加各层计算量关键代码片段# 部分内置计算规则来自thop/profile.py register_hooks { nn.Conv2d: count_convNd, # 卷积层计算规则 nn.Linear: count_linear, # 全连接层计算规则 nn.BatchNorm2d: count_normalization, # 归一化层计算规则 nn.LSTM: count_lstm, # LSTM层计算规则 # ...更多层类型 }注意事项与最佳实践输入尺寸影响计算量与输入特征图大小直接相关需使用实际部署时的输入尺寸动态计算图对于动态控制流如条件分支需确保所有路径都被统计自定义层支持复杂自定义层建议单独测试统计规则准确性版本兼容性支持PyTorch 1.0低版本可能存在兼容性问题总结PyTorch-OpCounter凭借其简洁的API设计和准确的统计能力已成为PyTorch生态中不可或缺的工具。无论是学术研究还是工业部署它都能帮助开发者做出更明智的模型设计决策。通过本文介绍的基础用法和高级技巧你可以轻松掌握模型计算量统计的核心方法为模型优化和部署提供有力支持。【免费下载链接】pytorch-OpCounterCount the MACs / FLOPs of your PyTorch model.项目地址: https://gitcode.com/gh_mirrors/py/pytorch-OpCounter创作声明：本文部分内容由AI辅助生成（AIGC），仅供参考

更多文章

前端开发 2026/4/16 16:36:02

3ds Max顶点AO烘焙与多通道绘制实战：从烘焙到UE4效果验证

1. 3ds Max顶点AO烘焙基础顶点AO烘焙是游戏资产优化中常用的技术手段，它能够将环境光遮蔽信息直接存储在模型顶点色通道中。相比传统贴图烘焙方式，顶点AO具有内存占用低、计算效率高的特点，特别适合植被、地形等需要大量重复使用的游戏资产…

一、JSON 是什么？JSON是一种轻量级的文本数据交换格式，它虽然源自 JavaScript，但现在已经是独立于编程语言的通用标准，几乎所有主流编程语言（Python/Java/Go/PHP 等）都支持 JSON 的解析和生成。可以把 JSON…

张开发

前端开发 2026/4/16 16:10:20

为什么Python的默认递归深度限制是1000？

为什么Python的默认递归深度限制是1000？ 在编写递归函数时，许多Python开发者都曾遇到过“RecursionError: maximum recursion depth exceeded”的错误提示。Python默认将递归深度限制在1000层，这一设计背后隐藏着多重考量。本文将深入探讨这…

张开发

PyTorch-OpCounter终极指南：如何快速准确统计深度学习模型计算量

最新文章

实际的物理过程会出现速度直接跳跃吗？

深入UEFI/BIOS：揭秘电脑开机时DDR内存的“自我修炼”（ZQCS与Training全流程）

ESP32低功耗实战：5种唤醒方式对比（含代码避坑指南）

Ghidra逆向分析实战：5分钟搞定CrackMe密码破解（附样本下载）

深度学习数据增强：从基础到高级

从MathType 6.9升级到7.0中文版：Word公式编辑效率提升全攻略

推荐文章

FastAPI单元测试实战：别等上线被喷才后悔，TestClient用对了真香！盐

实战解析：Bidirectional LSTM在NLP任务中的高效应用

PID控制算法实战：如何用积分分离解决系统超调问题（附MATLAB代码）

Python asyncio 并发文件处理方案

Matlab+Ncorr：从零搭建数字图像相关分析环境

三菱FX5S PLC程序与MCGS昆仑通态触摸屏集成：伺服压力机实时监控与历史数据管理

相关文章

ESP32智能语音助手开发瓶颈突破：基于MCP协议的全栈硬件AI解决方案重构

turboacc：开源工具性能优化的创新方法 - OpenWrt用户指南

LibreCAD：为什么这款免费开源的2D CAD软件能替代昂贵的商业工具？

解锁AI编程新范式：7个颠覆认知的Continue插件实战场景

LA-PEG-SCM，硫辛酸PEG琥珀酰亚胺乙酸酯，一种新型异双功能PEG衍生物

从‘能用’到‘好用’：设计运放电路时，90%的人会忽略的输入/输出阻抗问题（以TI OPA2188为例）

分享文章

更多文章

3ds Max顶点AO烘焙与多通道绘制实战：从烘焙到UE4效果验证

分子动力学分析利器：MDAnalysis从入门到实战完全指南

Realistic Vision V5.1 风格迁移实战：模仿大师摄影作品的光影与色调

Win11Debloat：Windows系统性能优化的终极解决方案

论文党必看！高效降重神器，省时又省力

Vivado2019.2安装避坑指南：Windows环境配置与出口合规实战

Redisson集群连接池优化：从‘Unable to write command’错误看主从读写配置陷阱

如何快速提升游戏性能：DLSS Swapper终极使用指南

阿里：验证驱动高效深度研究代理

LVGL项目瘦身秘籍：如何用Font Converter生成超小体积的专用中文字库

C++-集群聊天室(1)：Json

为什么Python的默认递归深度限制是1000？