流程走通。（效果不行:数据集和数据标注都比较少）

2026-05-05 03:02:34 +08:00
parent 41e3bb113a
commit 3fa64a95f8
28 changed files with 1179 additions and 404 deletions
@@ -1,3 +1,4 @@
+
 # YOLO 模型测试流程指南

 本文档基于知乎文章整理，帮助你从零开始完成一个 YOLO 目标检测项目的完整流程。
@@ -9,10 +10,9 @@
 1. [环境准备](#1-环境准备)
 2. [数据收集与准备](#2-数据收集与准备)
 3. [数据标注](#3-数据标注)
-4. [数据格式转换](#4-数据格式转换)
-5. [数据集划分](#5-数据集划分)
-6. [模型训练](#6-模型训练)
-7. [模型评估与测试](#7-模型评估与测试)
+4. [配置数据集](#4-配置数据集)
+5. [模型训练](#5-模型训练)
+6. [模型评估与测试](#6-模型评估与测试)

 ***

@@ -20,7 +20,7 @@

 ### 1.1 安装 Python 环境

-确保 Python 版本 >= 3.8
+确保 Python 版本 &gt;= 3.8

 ```bash
 python --version
@@ -30,11 +30,10 @@ python --version

 为了避免影响全局 Python 环境，建议为项目创建独立的虚拟环境。

-**方式一：使用 conda**
+**方式一：使用 conda

 **首先安装 Anaconda 或 Miniconda：**
-
-1. 下载 Miniconda（推荐，更轻量）：<https://docs.conda.io/en/latest/miniconda.html>
+1. 下载 Miniconda（推荐，更轻量）：&lt;https://docs.conda.io/en/latest/miniconda.html&gt;
 2. 运行安装程序，勾选 "Add Miniconda to PATH"（或安装后手动配置）
 3. 验证安装：

@@ -50,7 +49,7 @@ conda tos accept --override-channels --channel https://repo.anaconda.com/pkgs/ma
 conda tos accept --override-channels --channel https://repo.anaconda.com/pkgs/r
 conda tos accept --override-channels --channel https://repo.anaconda.com/pkgs/msys2

-//切换用清华的源
+# 切换用清华的源
 conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/pkgs/main

 # 创建虚拟环境
@@ -69,7 +68,6 @@ conda install -v pytorch torchvision torchaudio pytorch-cuda=12.1 -c pytorch -c
 # pip 来安装 PyTorch 更稳定
 conda activate yolo_demo ; pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121

-
 # 验证安装是否成功
 python -c "import torch; print(f'PyTorch版本: {torch.__version__}'); print(f'CUDA可用: {torch.cuda.is_available()}')"
 ```
@@ -81,15 +79,13 @@ conda env list
 ```

 **常见问题：**
-
 如果遇到 `CondaToSNonInteractiveError` 错误，需要先运行上面的 `conda tos accept` 命令接受服务条款。

 **验证虚拟环境已激活：**
-
 激活后，终端提示符前会显示虚拟环境名称：

 ```bash
-(yolo_demo) D:\Codes\AI\Yolo\YoloDemo>
+(yolo_demo) D:\Codes\AI\Yolo\YoloDemo&gt;
 ```

 **退出虚拟环境：**
@@ -102,7 +98,7 @@ conda deactivate
 ### 1.3 安装 YOLOv8（推荐）

 ```bash
-conda activate yolo_demo ;pip install ultralytics
+conda activate yolo_demo ; pip install ultralytics
 ```

 ### 1.4 验证安装
@@ -114,7 +110,7 @@ python -c "from ultralytics import YOLO; print('YOLOv8 安装成功')"
 ### 1.5 检查 GPU 支持（可选但推荐）

 ```bash
-python -c "import torch; print(f'CUDA 可用: {torch.cuda.is_available()}')"
+python -c "import torch; print(f'CUDA可用: {torch.cuda.is_available()}')"
 ```

 ***
@@ -124,41 +120,28 @@ python -c "import torch; print(f'CUDA 可用: {torch.cuda.is_available()}')"
 ### 2.1 确定检测目标

 首先明确你要检测的类别，例如：
-
 - car（汽车）
 - person（行人）
 - bicycle（自行车）

 ### 2.2 数据量建议

-| 项目类型 | 每类最少图片    | 推荐图片数  |
-| ---- | --------- | ------ |
-| 快速原型 | 100-200 张 | 500 张  |
+| 项目类型 | 每类最少图片 | 推荐图片数 |
+| ---- | ------- | ------ |
+| 快速原型 | 100-200 张 | 500 张 |
 | 生产应用 | 1000 张    | 3000 张 |

 ### 2.3 数据来源

 **方式一：使用公开数据集**
-
- COCO 数据集：<https://cocodataset.org>
- <br />
- Open Images：<https://storage.googleapis.com/openimages>
+- COCO 数据集：&lt;https://cocodataset.org&gt;
+- Open Images：&lt;https://storage.googleapis.com/openimages&gt;

 **方式二：自己拍摄/收集图片**
-
 - 确保图片清晰，目标可见
 - 覆盖不同场景、光照、角度
 - 统一格式为 JPG 或 PNG

-### 2.4 创建数据目录结构
-
-```bash
-mkdir -p dataset/images
-mkdir -p dataset/labels
-```
-
-将收集的图片放入 `dataset/images` 目录。
-
 ***

 ## 3. 数据标注
@@ -167,36 +150,21 @@ mkdir -p dataset/labels

 推荐使用以下工具之一：

- **TjMakeBot**（在线工具，支持 AI 辅助标注）：<https://www.tjmakebot.com>
+- **VisioFirm**（推荐标注工具）⭐
+- **TjMakeBot**（在线工具，支持 AI 辅助标注）：&lt;https://www.tjmakebot.com&gt;
 - **LabelImg**（本地工具）
 - **Roboflow**（在线工具）

-### 3.2 使用 LabelImg 标注（本地方式）
+**快速启动 VisioFirm：**

-**安装 LabelImg：**
-
-```bash
-pip install labelImg
+```powershell
+# 在项目根目录运行
+.\start_visiofirm.ps1
 ```

-**启动 LabelImg：**
+详细的 VisioFirm 使用说明请查看：[VisioFirm 标注工具使用指南](./2.VisioFirm标注工具使用指南.md)

-```bash
-labelImg
-```
-
-**标注步骤：**
-
-1. 打开 LabelImg
-2. 点击 "Open Dir" 选择图片目录
-3. 点击 "Change Save Dir" 设置标注保存目录
-4. **重要**：点击 "PascalVOC" 切换为 "YOLO" 格式
-5. 使用快捷键 `W` 绘制边界框
-6. 选择类别名称
-7. 点击 "Save" 保存标注
-8. 使用 `D` 键切换到下一张图片
-
-### 3.3 YOLO 标注格式说明
+### 3.2 YOLO 标注格式说明

 每张图片对应一个 `.txt` 文件，格式如下：

@@ -212,430 +180,206 @@ class_id center_x center_y width height
 ```

 **说明：**
-
 - `class_id`：类别 ID（从 0 开始）
 - `center_x, center_y`：边界框中心点坐标（归一化 0-1）
 - `width, height`：边界框宽高（归一化 0-1）

 ***

-## 4. 数据格式转换
+## 4. 配置数据集

-### 4.1 验证标注文件
+### 4.1 数据集目录结构

-创建验证脚本 `validate_dataset.py`：
+支持多种数据集组织方式：

-```python
-import os
-from PIL import Image
-
-def validate_yolo_dataset(dataset_dir):
-    images_dir = os.path.join(dataset_dir, 'images')
-    labels_dir = os.path.join(dataset_dir, 'labels')
-    
-    errors = []
-    image_files = [f for f in os.listdir(images_dir) if f.endswith(('.jpg', '.png'))]
-    
-    for img_file in image_files:
-        img_path = os.path.join(images_dir, img_file)
-        label_file = os.path.splitext(img_file)[0] + '.txt'
-        label_path = os.path.join(labels_dir, label_file)
-        
-        if not os.path.exists(label_path):
-            errors.append(f"缺失标注文件: {label_file}")
-            continue
-        
-        try:
-            img = Image.open(img_path)
-            img_width, img_height = img.size
-        except Exception as e:
-            errors.append(f"无法打开图片: {img_file}")
-            continue
-        
-        with open(label_path, 'r') as f:
-            for line_num, line in enumerate(f, 1):
-                line = line.strip()
-                if not line:
-                    continue
-                
-                parts = line.split()
-                if len(parts) != 5:
-                    errors.append(f"{label_file}: 格式错误")
-                    continue
-                
-                try:
-                    class_id = int(parts[0])
-                    center_x = float(parts[1])
-                    center_y = float(parts[2])
-                    width = float(parts[3])
-                    height = float(parts[4])
-                    
-                    if not (0 <= center_x <= 1 and 0 <= center_y <= 1):
-                        errors.append(f"{label_file}: 坐标超出范围")
-                except ValueError:
-                    errors.append(f"{label_file}: 数字解析错误")
-    
-    if errors:
-        print("发现错误：")
-        for error in errors[:10]:
-            print(f"  - {error}")
-    else:
-        print("验证通过！")
-
-if __name__ == '__main__':
-    validate_yolo_dataset('./dataset')
+**方式一：VisioFirm 导出（推荐）**
+```
+dataset/tags/visiofirm/20260505_01/
+├── data.yaml
+├── train/images/
+├── train/labels/
+├── val/images/
+├── val/labels/
+└── test/images/
+    └── test/labels/
 ```

-运行验证：
-
-```bash
-python validate_dataset.py
+**方式二：LabelImg 标注**
+```
+dataset/tags/LabelImg/20260505_01/
+├── data.yaml
+├── train/images/
+├── train/labels/
+├── val/images/
+├── val/labels/
+└── test/images/
+    └── test/labels/
 ```

-### 4.2 创建数据集配置文件
+### 4.2 配置 dataset.yaml

-创建 `dataset.yaml` 文件：
+在项目根目录创建 `dataset.yaml` 文件，配置示例见：[configs/dataset-traditional.yaml](../configs/dataset-traditional.yaml)

+**关键配置项：**
+- `path`: 数据集根目录（支持相对路径）
+- `train`: 训练集图片目录（相对于 path）
+- `val`: 验证集图片目录（相对于 path）
+- `test`: 测试集图片目录（相对于 path）
+- `nc`: 类别数量
+- `names`: 类别名称列表
+
+**示例配置：**
 ```yaml
-path: ./dataset
-train: images/train
-val: images/val
-test: images/test
-
-nc: 3
+path: ./dataset/tags/visiofirm/20260505_01
+train: train/images
+val: val/images
+test: test/images

+nc: 2
 names:
-  0: car
-  1: person
-  2: bicycle
+  - person
+  - bicycle
 ```

-**注意：** 根据你的实际类别修改 `nc` 和 `names`。
+### 4.3 验证数据集

-***
-
-## 5. 数据集划分
-
-### 5.1 创建划分脚本
-
-创建 `split_dataset.py`：
-
-```python
-import os
-import shutil
-import random
-
-def split_dataset(source_dir, train_ratio=0.7, val_ratio=0.15, test_ratio=0.15, seed=42):
-    random.seed(seed)
-    
-    images_dir = os.path.join(source_dir, 'images')
-    labels_dir = os.path.join(source_dir, 'labels')
-    
-    images = [f for f in os.listdir(images_dir) if f.endswith(('.jpg', '.png'))]
-    random.shuffle(images)
-    
-    total = len(images)
-    train_end = int(total * train_ratio)
-    val_end = train_end + int(total * val_ratio)
-    
-    train_images = images[:train_end]
-    val_images = images[train_end:val_end]
-    test_images = images[val_end:]
-    
-    print(f"总图片数: {total}")
-    print(f"训练集: {len(train_images)}")
-    print(f"验证集: {len(val_images)}")
-    print(f"测试集: {len(test_images)}")
-    
-    for split, img_list in [('train', train_images), ('val', val_images), ('test', test_images)]:
-        split_images_dir = os.path.join(source_dir, 'images', split)
-        split_labels_dir = os.path.join(source_dir, 'labels', split)
-        
-        os.makedirs(split_images_dir, exist_ok=True)
-        os.makedirs(split_labels_dir, exist_ok=True)
-        
-        for img in img_list:
-            shutil.copy(os.path.join(images_dir, img), os.path.join(split_images_dir, img))
-            
-            label_name = os.path.splitext(img)[0] + '.txt'
-            src_label = os.path.join(labels_dir, label_name)
-            dst_label = os.path.join(split_labels_dir, label_name)
-            
-            if os.path.exists(src_label):
-                shutil.copy(src_label, dst_label)
-    
-    print("数据集划分完成！")
-
-if __name__ == '__main__':
-    split_dataset('./dataset')
-```
-
-### 5.2 执行划分
+使用 [src/validate_dataset.py](../src/validate_dataset.py) 脚本验证数据集：

 ```bash
-python split_dataset.py
-```
-
-### 5.3 验证划分结果
-
-```bash
-ls dataset/images/train
-ls dataset/images/val
-ls dataset/images/test
+python src/validate_dataset.py
 ```

 ***

-## 6. 模型训练
+## 5. 模型训练

-### 6.1 创建训练脚本
+### 5.1 开始训练

-创建 `train.py`：
-
-```python
-from ultralytics import YOLO
-import torch
-
-device = 'cuda' if torch.cuda.is_available() else 'cpu'
-print(f"使用设备: {device}")
-
-model = YOLO('yolov8n.pt')
-
-results = model.train(
-    data='dataset.yaml',
-    epochs=100,
-    imgsz=640,
-    batch=16,
-    device=device,
-    lr0=0.01,
-    patience=50,
-    save=True,
-    plots=True,
-    project='runs/detect',
-    name='my_model',
-    exist_ok=True,
-)
-
-print("训练完成！")
-print(f"最佳模型保存在: runs/detect/my_model/weights/best.pt")
-```
-
-### 6.2 开始训练
+使用 [src/train.py](../src/train.py) 脚本训练模型：

 ```bash
-python train.py
+python src/train.py
 ```

-### 6.3 训练参数说明
+常用参数：
+- `--config`: dataset.yaml 配置文件路径（默认使用项目根目录）
+- `--model`: 预训练模型（默认: yolov8n.pt）
+- `--epochs`: 训练轮数（默认: 100）
+- `--batch`: 批次大小（默认: 16）
+- `--imgsz`: 输入图片尺寸（默认: 640）
+- `--lr`: 初始学习率（默认: 0.01）
+- `--device`: 设备（cuda/cpu，默认自动检测）

-| 参数       | 说明     | 建议值         |
-| -------- | ------ | ----------- |
-| epochs   | 训练轮数   | 100-300     |
-| imgsz    | 输入图片尺寸 | 640         |
-| batch    | 批次大小   | 根据 GPU 内存调整 |
-| lr0      | 初始学习率  | 0.01        |
-| patience | 早停耐心值  | 50          |
+### 5.2 模型选择建议

-### 6.4 模型选择建议
-
-| 模型      | 参数量   | 速度 | 精度 | 适用场景 |
-| ------- | ----- | -- | -- | ---- |
-| yolov8n | 3.2M  | 最快 | 较低 | 实时检测 |
-| yolov8s | 11.2M | 快  | 中等 | 平衡   |
+| 模型 | 参数量 | 速度 | 精度 | 适用场景 |
+| ---- | ----- | -- | -- | ---- |
+| yolov8n | 3.2M | 最快 | 较低 | 实时检测 |
+| yolov8s | 11.2M | 快 | 中等 | 平衡 |
 | yolov8m | 25.9M | 中等 | 较高 | 生产环境 |
-| yolov8l | 43.7M | 较慢 | 高  | 高精度  |
+| yolov8l | 43.7M | 较慢 | 高 | 高精度 |

 ***

-## 7. 模型评估与测试
+## 6. 模型评估与测试

-### 7.1 评估模型
+### 6.1 评估模型

-创建 `evaluate.py`：
-
-```python
-from ultralytics import YOLO
-
-model = YOLO('runs/detect/my_model/weights/best.pt')
-
-metrics = model.val(data='dataset.yaml', split='val')
-
-print("=" * 50)
-print("模型评估结果")
-print("=" * 50)
-print(f"mAP50: {metrics.box.map50:.4f}")
-print(f"mAP50-95: {metrics.box.map:.4f}")
-print(f"Precision: {metrics.box.mp:.4f}")
-print(f"Recall: {metrics.box.mr:.4f}")
-print("=" * 50)
-```
-
-运行评估：
+使用 [src/evaluate.py](../src/evaluate.py) 脚本评估模型：

 ```bash
-python evaluate.py
+python src/evaluate.py
 ```

-### 7.2 测试单张图片
+**特点：**
+- 自动查找最新训练的模型（无需手动指定路径）
+- 支持从多个可能的位置查找已保存模型

-创建 `predict.py`：
+参数：
+- `--model`: 模型路径（默认：自动查找最新模型）
+- `--config`: dataset.yaml 配置文件路径（默认使用项目根目录）
+- `--split`: 评估集（train/val/test，默认: val）

-```python
-from ultralytics import YOLO
+### 6.2 预测

-model = YOLO('runs/detect/my_model/weights/best.pt')
-
-results = model('dataset/images/test/test_image.jpg', save=True, conf=0.25)
-
-for result in results:
-    boxes = result.boxes
-    for i in range(len(boxes)):
-        class_name = model.names[int(boxes.cls[i])]
-        conf = boxes.conf[i]
-        print(f"检测到: {class_name}, 置信度: {conf:.2f}")
-```
-
-运行测试：
+使用 [src/predict.py](../src/predict.py) 脚本进行预测：

 ```bash
-python predict.py
+python src/predict.py
 ```

-### 7.3 批量测试
+**特点：**
+- 自动查找最新训练的模型（无需手动指定路径）
+- 自动从 dataset.yaml 读取测试集路径

-```python
-from ultralytics import YOLO
+参数：
+- `--model`: 模型路径（默认：自动查找最新模型）
+- `--source`: 预测源（图片/目录，默认：读取 dataset.yaml）
+- `--conf`: 置信度阈值（默认: 0.25）
+- `--nosave`: 不保存结果（默认保存）

-model = YOLO('runs/detect/my_model/weights/best.pt')
+### 6.3 模型导出为 ONNX 格式

-results = model('dataset/images/test', save=True, conf=0.25)
+使用 [src/export_onnx.py](../src/export_onnx.py) 脚本将 PyTorch (.pt) 模型导出为 ONNX 格式：
+
+```bash
+python src/export_onnx.py
 ```

-### 7.4 性能基准
+**特点：**
+- 自动查找最新训练的模型（无需手动指定路径）
+- 支持模型简化，减小文件体积
+- 可自定义输入尺寸和 ONNX opset 版本

-| 应用场景  | mAP50 目标 | mAP50-95 目标 |
-| ----- | -------- | ----------- |
-| 快速原型  | > 0.5    | > 0.3       |
-| 生产环境  | > 0.7    | > 0.5       |
-| 高精度应用 | > 0.9    | > 0.7       |
+参数：
+- `--model`: 模型路径（默认：自动查找最新模型）
+- `--imgsz`: 输入图片尺寸（默认: 640）
+- `--simplify`: 简化模型（默认: True）
+- `--no-simplify`: 不简化模型
+- `--opset`: ONNX opset 版本（默认: 12）

-***
+**使用示例：**
+```bash
+# 导出最新训练的模型（自动查找）
+python src/export_onnx.py

-## 常见问题排查
+# 导出指定模型
+python src/export_onnx.py --model runs/detect/my_model/weights/best.pt

-### 问题 1：Loss 不下降
+# 自定义输入尺寸
+python src/export_onnx.py --imgsz 1280

-**解决方案：**
+# 不简化模型
+python src/export_onnx.py --no-simplify

- 调整学习率（尝试 0.001-0.01）
- 检查数据质量
- 尝试更大的模型
-
-### 问题 2：过拟合
-
-**解决方案：**
-
- 增加数据量
- 使用更小的模型
- 启用更多数据增强
-
-### 问题 3：训练很慢
-
-**解决方案：**
-
- 使用 GPU 训练
- 增大批次大小
- 减小图片尺寸
-
-***
-
-## 目录结构总结
-
-完成后的目录结构：
-
-```
-project/
-├── venv/                    # 虚拟环境目录（不应提交到版本控制）
-├── dataset/
-│   ├── images/
-│   │   ├── train/
-│   │   ├── val/
-│   │   └── test/
-│   └── labels/
-│       ├── train/
-│       ├── val/
-│       └── test/
-├── dataset.yaml
-├── train.py
-├── evaluate.py
-├── predict.py
-├── split_dataset.py
-└── validate_dataset.py
+# 自定义 opset 版本
+python src/export_onnx.py --opset 17
 ```

 ***

 ## 快速开始命令汇总

-```bash
-# 创建并激活虚拟环境
-python -m venv venv
-venv\Scripts\activate
-
-# 安装依赖
-pip install ultralytics
-
-# 后续步骤
-python validate_dataset.py
-python split_dataset.py
-python train.py
-python evaluate.py
-python predict.py
-```
-
-***
-
-## 一键运行环境准备
-
-项目已提供 `run_demo.py` 脚本，可一键完成环境搭建：
+**注意：请在项目根目录（YoloDemo）下运行以下命令**

 ```bash
-python run_demo.py
-```
+# 1. 配置 dataset.yaml（首次使用）
+# 复制 configs/dataset-traditional.yaml 到项目根目录，修改 path 指向你的数据集

-该脚本会自动完成：
+# 2. 验证数据集
+python src/validate_dataset.py

-1. 检查 Python 版本
-2. 创建虚拟环境
-3. 安装 ultralytics 依赖
-4. 验证安装
-5. 检查 GPU 支持
+# 3. 训练模型
+python src/train.py

-## 在 VS Code 中直接运行代码
+# 4. 评估模型（自动查找最新训练好的模型）
+python src/evaluate.py

-### 方法一：使用 Code Runner 插件
+# 5. 预测（自动查找最新模型）
+python src/predict.py

-1. 打开 VS Code，搜索并安装 `Code Runner` 插件
-2. 将光标放在代码块内，点击右上角的 ▶️ 按钮运行
-
-### 方法二：右键运行
-
-在代码块内右键，选择 "Run Code" 或使用快捷键 `Ctrl+Alt+N`
-
-### 方法三：终端运行
-
-```bash
-# 进入项目目录
-cd .
-
-# 激活虚拟环境
-venv\Scripts\activate
-
-# 运行脚本
-python run_demo.py
-python validate_dataset.py
-python split_dataset.py
-python train.py
+# 6. 导出为 ONNX 格式（自动查找最新模型）
+python src/export_onnx.py
 ```

 ***
@@ -0,0 +1,352 @@
+
+# VisioFirm 标注工具使用指南
+
+本指南将帮助你使用 VisioFirm 进行 YOLO 目标检测数据标注。
+
+***
+
+## 目录
+
+1. [VisioFirm 简介](#1-visiofirm-简介)
+2. [安装与启动](#2-安装与启动)
+3. [项目设置](#3-项目设置)
+4. [标注操作](#4-标注操作)
+5. [导出 YOLO 格式](#5-导出-yolo-格式)
+6. [使用导出数据](#6-使用导出数据)
+7. [快捷键](#7-快捷键)
+
+***
+
+## 1. VisioFirm 简介
+
+VisioFirm 是一款开源、跨平台的 AI 辅助图像标注工具，专为计算机视觉任务设计。
+
+**官方链接：**
+
+- GitHub 仓库：<https://github.com/OschAI/VisioFirm>
+- PyPI 项目：<https://pypi.org/project/visiofirm/>
+- 论文地址：<https://arxiv.org/abs/2509.04180>
+
+**主要特性：**
+
+- AI 驱动的预标注（YOLO、SAM2、Grounding DINO），节省高达 80% 人工标注
+- 支持多种标注格式：YOLO、COCO、PascalVOC 等
+- 自动划分训练/验证/测试集
+- 支持视频标注和标签传播
+- 直观的用户界面
+- 批量处理功能
+- 标注验证和预览
+- 支持分类、目标检测、分割任务
+
+***
+
+## 2. 安装与启动
+
+### 2.1 系统要求
+
+- Python 3.10 或更高版本
+- 推荐使用 CUDA 11.8（如需 GPU 加速）
+- 16GB 或更多内存
+
+### 2.2 安装（推荐方式：pip）
+
+**注意：** VisioFirm 直接安装在项目的 `yolo_demo` 环境中，无需创建新环境。
+
+1. 激活项目虚拟环境：
+   ```bash
+   conda activate yolo_demo
+   ```
+2. 设置 UTF-8 环境变量（Windows 中文环境必须）：
+   ```powershell
+   # PowerShell
+   $env:PYTHONUTF8=1
+   ```
+3. 使用 pip 安装 VisioFirm：
+   ```bash
+   pip install visiofirm
+   ```
+
+**或者使用一键启动脚本：**
+
+```powershell
+.\start_visiofirm.ps1
+```
+
+### 2.3 启动 VisioFirm
+
+**方法一：使用一键启动脚本（推荐）**
+
+直接运行项目根目录下的启动脚本：
+
+```powershell
+.\start_visiofirm.ps1
+```
+
+**方法二：手动启动**
+
+1. 激活环境并设置 UTF-8：
+   ```powershell
+   conda activate yolo_demo
+   $env:PYTHONUTF8=1
+   ```
+2. 启动 VisioFirm：
+   ```bash
+   visiofirm
+   ```
+
+启动后，浏览器会自动打开 VisioFirm 界面（通常是 [http://localhost:8000）。>](http://localhost:8000）。>)
+
+***
+
+## 3. 项目设置
+
+### 3.1 创建新项目
+
+1. 打开 VisioFirm
+2. 点击 **"New Project"** 或 **"创建新项目"**
+3. 输入项目名称（如：YOLO_Demo）
+4. 选择项目保存位置
+
+### 3.2 配置项目
+
+**导入图片：**
+
+1. 点击 **"Import Images"** 或 **"导入图片"**
+2. 选择你的图片文件夹
+3. 选择要标注的图片文件（可全选）
+
+**设置类别：**
+
+1. 点击 **"Classes"** 或 **"类别"** 标签
+2. 点击 **"Add Class"** 或 **"添加类别"**
+3. 输入类别名称（如：car, person, bicycle）
+4. 为每个类别选择颜色（便于区分）
+5. 保存类别配置
+
+示例类别配置：
+
+```
+0: person   (行人)
+1: bicycle  (自行车)
+```
+
+**数据集划分设置（可选）：**
+
+VisioFirm 在导出时会自动将数据集划分为 train/val/test。默认划分比例：
+- 训练集（train）：70%
+- 验证集（val）：15%
+- 测试集（test）：15%
+
+***
+
+## 4. 标注操作
+
+### 4.1 基本标注步骤
+
+1. 从左侧图片列表中选择要标注的图片
+2. 选择标注工具（通常是矩形框工具）
+3. 在图片上拖动鼠标绘制边界框，框选目标
+4. 从类别列表中选择对应的类别
+5. 确认标注无误后，点击保存或自动保存
+
+### 4.2 标注技巧
+
+**精确框选：**
+
+- 尽量紧贴目标边缘绘制边界框
+- 避免框选过多背景
+- 对于部分遮挡的目标，仍然标注可见部分
+
+**类别一致性：**
+
+- 保持同类目标标注标准一致
+- 对于模糊不清的目标，可以选择跳过或标记为不确定
+
+**标注顺序：**
+
+- 按类别顺序标注，减少类别切换
+- 使用快捷键提高效率
+
+**AI 预标注（推荐）：**
+
+VisioFirm 支持 AI 预标注功能，可以大幅提高标注效率：
+1. 点击 AI 预标注按钮
+2. 选择合适的模型（如 YOLO）
+3. 自动生成标注框
+4. 人工检查和修正
+
+***
+
+## 5. 导出 YOLO 格式
+
+### 5.1 导出设置
+
+1. 完成标注后，点击 **"Export"** 或 **"导出"**
+2. 选择 **"YOLO"** 格式
+3. 设置导出选项：
+   - 导出路径：选择项目内的 `dataset/tags/visiofirm/` 目录
+   - 勾选 "自动划分 train/val/test"
+   - 类别映射：确认类别名称正确
+   - 坐标格式：选择归一化坐标（0-1）
+4. 可以选择导出为 ZIP 压缩包或文件夹
+
+### 5.2 执行导出
+
+1. 点击 **"Export"** 或 **"开始导出"**
+2. 等待导出完成
+3. 导出完成后，会在 `dataset/tags/visiofirm/` 目录下生成新文件夹（如 `20260505_01/`）
+
+### 5.3 导出结果说明
+
+导出后，目录结构如下：
+
+```
+dataset/tags/visiofirm/
+├── 20260505_01/           # 每次导出会生成带日期的文件夹
+│   ├── data.yaml          # 数据集配置文件（VisioFirm 格式）
+│   ├── train/
+│   │   ├── images/        # 训练集图片
+│   │   └── labels/        # 训练集标注
+│   ├── val/
+│   │   ├── images/        # 验证集图片
+│   │   └── labels/        # 验证集标注
+│   └── test/
+│       ├── images/        # 测试集图片
+│       └── labels/        # 测试集标注
+└── 1_YOLO.zip             # ZIP 压缩包（可选）
+```
+
+**标注文件格式：**
+
+```
+class_id center_x center_y width height
+```
+
+**示例：**
+
+```
+0 0.5 0.5 0.3 0.4
+1 0.2 0.3 0.1 0.2
+```
+
+**说明：**
+
+- `class_id`：类别 ID（从 0 开始）
+- `center_x, center_y`：边界框中心点坐标（归一化 0-1）
+- `width, height`：边界框宽高（归一化 0-1）
+
+***
+
+## 6. 使用导出数据
+
+### 6.1 配置项目
+
+1. 复制 `configs/dataset-traditional.yaml` 到项目根目录，重命名为 `dataset.yaml`
+2. 编辑 `dataset.yaml`，修改 `path` 指向刚导出的数据文件夹：
+
+```yaml
+path: ./dataset/tags/visiofirm/20260505_01
+train: train/images
+val: val/images
+test: test/images
+
+nc: 2
+names:
+  - person
+  - bicycle
+```
+
+**注意：** `nc` 和 `names` 需要根据你实际标注的类别进行修改。
+
+### 6.2 验证数据集
+
+使用项目验证脚本检查导出的标注：
+
+```bash
+python src/validate_dataset.py
+```
+
+验证通过后，即可开始训练模型！
+
+***
+
+## 7. 快捷键
+
+| 快捷键       | 功能     |
+| --------- | ------ |
+| `W` 或 `R` | 矩形框工具  |
+| `A`       | 上一张图片  |
+| `D`       | 下一张图片  |
+| `Ctrl+S`  | 保存标注   |
+| `Ctrl+Z`  | 撤销     |
+| `Ctrl+Y`  | 重做     |
+| `Del`     | 删除选中的框 |
+| `Esc`     | 取消当前操作 |
+| `Space`   | 平移画布   |
+| `鼠标滚轮`    | 缩放     |
+
+**注意：** 具体快捷键可能因 VisioFirm 版本不同而略有差异，请以实际软件为准。
+
+***
+
+## 8. 标注质量检查
+
+完成标注后，建议进行以下检查：
+
+1. **完整性检查**
+   - 确认所有图片都已标注
+   - 确认所有目标都已框选
+
+2. **准确性检查**
+   - 检查边界框是否准确
+   - 检查类别是否正确
+
+3. **格式验证**
+   - 使用项目中的验证脚本检查标注格式：
+   ```bash
+   python src/validate_dataset.py
+   ```
+
+***
+
+## 9. 常见问题
+
+### Q: VisioFirm 如何获取？
+
+A: 推荐使用 pip 安装：`pip install visiofirm`，详细步骤见"安装与启动"章节。
+也可以访问 GitHub 仓库：<https://github.com/OschAI/VisioFirm> 获取源码。
+
+### Q: VisioFirm 是免费的吗？
+
+A: 是的，VisioFirm 是开源软件，采用 Apache-2.0 许可证，完全免费使用。
+
+### Q: 导出后如何使用这些数据？
+
+A: 导出的数据已经自动划分好 train/val/test。
+只需修改项目根目录的 `dataset.yaml` 中的 `path` 指向导出文件夹即可开始训练。
+
+### Q: 如何批量处理图片？
+
+A: VisioFirm 支持批量导入图片，可以一次选择多张或整个文件夹进行标注。
+导出时也支持批量导出所有标注。
+
+### Q: 标注过程中如何暂停和继续？
+
+A: VisioFirm 会自动保存进度，关闭浏览器标签页后重新打开 <http://localhost:8000> 即可继续。
+
+### Q: 如何修改已有标注？
+
+A: 选择要修改的框，可以拖动调整位置或大小，也可以删除后重新标注。
+对于 AI 预标注的结果，可以直接进行修正。
+
+### Q: 遇到技术问题怎么办？
+
+A: 可以在 GitHub Issues 页面提交问题：<https://github.com/OschAI/VisioFirm/issues>
+
+***
+
+## 下一步
+
+标注完成后，请继续参考 [YOLO 模型测试流程指南](./1.YOLO模型测试流程指南.md) 进行模型训练。
+
+祝你标注顺利！