What is MakeSense?
makesense.ai 是一款免费的在线工具,旨在简化和加速计算机视觉项目的图像标注流程。如果您正在进行深度学习项目并需要准备数据集,makesense.ai 消除了复杂软件安装和繁琐手动标注的麻烦。因为它直接在您的浏览器中运行,无论您使用什么操作系统,都可以立即开始标注。
主要特点:
🚀 立即开始: 直接通过您的 Web 浏览器访问该工具——无需下载或安装。这种跨平台兼容性意味着您可以在 Windows、macOS 或 Linux 上使用它。
🤖 利用 AI 驱动的辅助功能: 通过集成的 AI 模型减少您的标注时间。
YOLOv5 集成: 加载预训练模型或您自己的自定义 YOLOv5 模型(导出为 tfjs 格式),以获得强大的对象检测建议。
SSD (COCO): 受益于 COCO 数据集上预训练的 Single Shot MultiBox Detector 模型,自动生成边界框并建议标签。
PoseNet: 利用 PoseNet 通过识别关键身体关节来估计人体姿势,从而简化带有人的图像的注释。
🧠 由 TensorFlow.js 驱动: makesense.ai 的 AI 功能的核心是 TensorFlow.js,它确保高效处理,更重要的是,确保您的图像隐私。您的数据永远不会离开您的设备。
📁 以多种格式导出: 以各种格式下载您完成的标签,这些格式与流行的机器学习框架兼容,包括 CSV、YOLO、VOC XML、VGG JSON 和 COCO JSON。还提供像素掩码导出支持,但并非适用于所有标签类型。
⌨️ 通过键盘快捷键高效工作: 使用直观的键盘快捷键加速您的工作流程,以进行常见的操作,如多边形完成、图像导航和标签选择。
✅ 导入现有标签: 导入以下格式的标签:矩形: YOLO, VOC XML, VGG JSON, COCO JSON, 多边形: COCO JSON。
技术细节(适用于开发人员和高级用户):
架构: makesense.ai 使用 TypeScript 构建,并利用 React/Redux 框架来实现响应迅速且用户友好的界面。
本地设置: 对于开发人员,可以轻松地从 GitHub 存储库克隆该项目,并使用 npm 在本地运行。(需要 npm 8.x.x 和 Node.js v16.x.x)。
Docker 支持: 提供了一个 Dockerfile 用于容器化部署,从而简化了设置并确保在不同环境中的一致操作。
开源: 该项目是开源的,允许社区贡献和自定义修改。
用例:
自动驾驶汽车的目标检测: 一个开发自动驾驶汽车技术的团队需要标注数千张图像,并在汽车、行人和交通信号周围绘制边界框。makesense.ai 的 YOLOv5 集成提供了智能建议,大大减少了所需的手动工作。然后,该团队可以以与其训练管道兼容的格式导出标签。
健身应用的人体姿势估计: 一位创建健身应用的开发人员,该应用可以跟踪用户在锻炼期间的运动,他们使用 makesense.ai 及其 PoseNet 集成来注释图像和视频中的关键身体关节。此标记数据用于训练一个模型,该模型可以准确识别和分析锻炼形式。
电子商务的图像分类: 一家电子商务公司需要对大量产品图像进行分类。makesense.ai 允许他们快速在商品周围绘制边界框并分配标签。然后,导出的数据用于改进产品搜索和推荐算法。
结论:
makesense.ai 为图像标注提供了一个强大、用户友好且注重隐私的解决方案。无论您是学生、研究人员还是专业开发人员,makesense.ai 都能简化您的工作流程,使您能够专注于构建和训练您的计算机视觉模型。它结合了 AI 驱动的辅助功能、基于浏览器的可访问性和灵活的导出选项,使其成为任何计算机视觉项目的宝贵工具。
