手机相册端侧文本搜图方案调研

张开发
2026/4/3 9:40:50 15 分钟阅读
手机相册端侧文本搜图方案调研
手机相册端侧文本搜图方案调研调研日期:2026-04-02(UTC)目标场景:手机相册中存在大量图片,需要支持基于自然语言的本地搜图;希望模型与系统架构可在骁龙平台端侧执行,并具备后续接入 tag/caption 与 rerank 的可扩展性。一、结论摘要已有现成开源例子,最接近目标场景的是基于CLIP / MobileCLIP的离线语义检索方案,已经存在 Android 与 iOS 参考实现。骁龙端侧部署底座明确存在。Qualcomm 官方已经提供OpenAI-CLIP的 AI Hub 模型与导出脚本,可导出到TensorFlow Lite / ONNX Runtime / Qualcomm AI Engine Direct,并面向 Qualcomm 设备做 on-device export。完整“量产级全链路”开源项目较少。目前公开项目通常覆盖以下子集:相册图片离线向量化文本编码搜图Top-K 相似度排序部分移动端模型适配但很少同时覆盖:Android 相册接入 + Snapdragon/NPU 优化 + 自动 tag/caption + rerank + 系统级多信号融合。

更多文章