MediaPipe Pose从安装到使用：33个关键点检测，新手完整教程

张开发

• 2026/4/16 1:56:59 • 15 分钟阅读

分享文章

MediaPipe Pose从安装到使用33个关键点检测新手完整教程1. 引言为什么选择MediaPipe Pose人体姿态估计是计算机视觉领域的重要应用而Google的MediaPipe Pose模型以其轻量级和高精度脱颖而出。这个模型能在普通CPU上实时检测人体33个关键点包括面部五官、四肢关节等为健身分析、动作捕捉等场景提供强大支持。本教程将带你从零开始一步步完成MediaPipe Pose的安装、配置到实际使用。不同于其他复杂教程我们特别关注以下几点极简安装无需复杂环境配置避坑指南解决常见报错问题实用案例提供可直接运行的代码示例效果优化教你如何获得最佳检测结果2. 环境安装与配置2.1 基础环境准备MediaPipe Pose对Python环境有一定要求以下是推荐配置Python 3.8-3.1064位版本pip版本20.3以上操作系统Windows/Linux/macOS均可建议使用虚拟环境隔离依赖python -m venv mp_pose_env source mp_pose_env/bin/activate # Linux/macOS mp_pose_env\Scripts\activate # Windows2.2 安装核心依赖安装MediaPipe和OpenCVpip install mediapipe opencv-python如果遇到安装问题可以尝试指定版本pip install mediapipe0.10.9 opencv-python4.8.1.782.3 验证安装创建一个简单的Python脚本验证安装是否成功import mediapipe as mp import cv2 print(MediaPipe版本:, mp.__version__) print(OpenCV版本:, cv2.__version__)运行后应该能看到版本号输出没有报错即表示安装成功。3. 基础使用单张图片检测3.1 加载模型与处理图片让我们从最简单的单张图片检测开始import cv2 import mediapipe as mp # 初始化MediaPipe Pose mp_pose mp.solutions.pose pose mp_pose.Pose(static_image_modeTrue) # 读取图片并转换颜色空间 image cv2.imread(test.jpg) image_rgb cv2.cvtColor(image, cv2.COLOR_BGR2RGB) # 进行关键点检测 results pose.process(image_rgb)3.2 可视化检测结果检测到关键点后我们可以将其可视化# 绘制关键点和连接线 mp_drawing mp.solutions.drawing_utils mp_drawing.draw_landmarks( image, results.pose_landmarks, mp_pose.POSE_CONNECTIONS, landmark_drawing_specmp_drawing.DrawingSpec(color(255,0,0), thickness2, circle_radius2), connection_drawing_specmp_drawing.DrawingSpec(color(0,255,0), thickness2) ) # 显示结果 cv2.imshow(Pose Detection, image) cv2.waitKey(0) cv2.destroyAllWindows()3.3 关键点数据结构解析MediaPipe Pose返回的results.pose_landmarks包含33个关键点每个关键点有以下属性for landmark in results.pose_landmarks.landmark: print(fx: {landmark.x}) # 归一化x坐标(0-1) print(fy: {landmark.y}) # 归一化y坐标(0-1) print(fz: {landmark.z}) # 相对深度 print(fvisibility: {landmark.visibility}) # 可见性置信度4. 进阶应用实时视频流处理4.1 初始化视频捕捉让我们扩展应用到实时视频流cap cv2.VideoCapture(0) # 0表示默认摄像头 # 视频流需要使用不同的模式 pose mp_pose.Pose( static_image_modeFalse, min_detection_confidence0.5, min_tracking_confidence0.7 )4.2 实时处理循环while cap.isOpened(): success, image cap.read() if not success: continue # 转换颜色空间并处理 image_rgb cv2.cvtColor(image, cv2.COLOR_BGR2RGB) results pose.process(image_rgb) # 绘制关键点 if results.pose_landmarks: mp_drawing.draw_landmarks( image, results.pose_landmarks, mp_pose.POSE_CONNECTIONS) # 显示结果 cv2.imshow(MediaPipe Pose, image) if cv2.waitKey(5) 0xFF 27: # ESC退出 break cap.release() cv2.destroyAllWindows()4.3 性能优化技巧为了提高实时性能可以尝试以下优化降低输入分辨率image cv2.resize(image, (640, 480))调整模型复杂度pose mp_pose.Pose(model_complexity1) # 0-2数字越大越精确但越慢关闭非必要功能pose mp_pose.Pose(enable_segmentationFalse)5. 常见问题与解决方案5.1 关键点检测不准确可能原因及解决方案图像质量差确保光照充足人物清晰分辨率过低建议输入图像宽度至少640像素姿势遮挡尽量避免严重遮挡情况5.2 模型运行速度慢优化建议使用model_complexity0或1降低输入分辨率关闭smooth_landmarks选项5.3 特定关键点缺失处理缺失关键点的方法if results.pose_landmarks: left_shoulder results.pose_landmarks.landmark[mp_pose.PoseLandmark.LEFT_SHOULDER] if left_shoulder.visibility 0.5: # 可见性阈值 print(左肩关键点不可靠)6. 实际应用案例6.1 健身动作分析通过比较关键点位置关系可以分析健身动作是否标准def check_squat_depth(results): # 获取髋关节和膝关节位置 left_hip results.pose_landmarks.landmark[mp_pose.PoseLandmark.LEFT_HIP] left_knee results.pose_landmarks.landmark[mp_pose.PoseLandmark.LEFT_KNEE] # 计算垂直距离 depth left_knee.y - left_hip.y return depth 0.15 # 经验阈值6.2 舞蹈动作识别通过记录关键点运动轨迹可以识别特定舞蹈动作def detect_arm_raise(results, prev_results): if not (results.pose_landmarks and prev_results.pose_landmarks): return False # 获取当前和之前的手腕位置 curr_wrist results.pose_landmarks.landmark[mp_pose.PoseLandmark.LEFT_WRIST].y prev_wrist prev_results.pose_landmarks.landmark[mp_pose.PoseLandmark.LEFT_WRIST].y # 判断是否抬手 return curr_wrist prev_wrist - 0.1 # 移动阈值7. 总结与进阶学习建议7.1 关键要点回顾通过本教程你应该已经掌握MediaPipe Pose的安装与基本配置单张图片和实时视频流的关键点检测检测结果的可视化与数据结构解析常见性能优化技巧和问题解决方法几个实际应用场景的代码示例7.2 进阶学习方向想要进一步提升可以探索结合其他MediaPipe解决方案如手部、面部检测开发基于关键点的动作识别系统研究3D姿态估计的进阶方法优化模型在移动端的部署7.3 资源推荐MediaPipe官方文档开源姿态估计项目集合相关学术论文与最新研究进展获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

MediaPipe Pose从安装到使用：33个关键点检测，新手完整教程

最新文章

别再复制粘贴了！手把手教你用STM32CubeMX生成HID键盘描述符（附完整代码）

轮毂电机分布式驱动电动汽车的驱动电机失效稳定性控制——基于Matlab/Simulink的多种...

废旧电信光猫变废为宝：手把手教你将中兴F4503.0改造成家庭交换机（附超级密码获取攻略）

ncmdump技术解析：网易云音乐NCM格式解密原理与实战应用

XUpdate高级用法：自定义解析器、下载器与错误处理机制

Map-Reduce 架构：智能拆分与并发分析

推荐文章

FastAPI单元测试实战：别等上线被喷才后悔，TestClient用对了真香！盐

实战解析：Bidirectional LSTM在NLP任务中的高效应用

PID控制算法实战：如何用积分分离解决系统超调问题（附MATLAB代码）

Python asyncio 并发文件处理方案

Matlab+Ncorr：从零搭建数字图像相关分析环境

三菱FX5S PLC程序与MCGS昆仑通态触摸屏集成：伺服压力机实时监控与历史数据管理

相关文章

ESP32智能语音助手开发瓶颈突破：基于MCP协议的全栈硬件AI解决方案重构

turboacc：开源工具性能优化的创新方法 - OpenWrt用户指南

LibreCAD：为什么这款免费开源的2D CAD软件能替代昂贵的商业工具？

解锁AI编程新范式：7个颠覆认知的Continue插件实战场景

LA-PEG-SCM，硫辛酸PEG琥珀酰亚胺乙酸酯，一种新型异双功能PEG衍生物

从‘能用’到‘好用’：设计运放电路时，90%的人会忽略的输入/输出阻抗问题（以TI OPA2188为例）

分享文章

更多文章

Python 自动化办公：批量提取 Excel 表格中的特定数据

STP树形结构及分析

为什么你的多模态告警总在故障后才触发？深度拆解3类时序错配陷阱（含跨模态延迟补偿算法与滑动窗口动态阈值公式）

从硬盘到Wi-Fi：汉明码在真实数据存储与传输中的实战应用与性能分析

Grafana 插件模块目录穿越漏洞（CVE-2021-43798）深度解析与防御实践

服务器安装 mysql8.0 远程客户端连接失败问题复盘

运维人破局指南｜告别背锅运维，转行网络安全，薪资直接翻番（零弯路路径）

告别本地部署：用Docker一键部署UE5.3像素流服务器，轻松集成Vue3前端

3Blue1Brown线性代数课程笔记：从几何视角彻底搞懂矩阵乘法

从原理到点云：双目结构光三维测量全链路解析

联邦学习后门防御的隐形杀手：模型权重符号翻转攻击的隐蔽性与突破性分析

如何在微控制器上用纯 Python 替代 NumPy 实现颜色渐变计算