尝试新数据 (Try New Data)
此功能可帮助您针对预先标记的数据集或盲测数据集评估已训练模型的准确性。此过程有助于识别模型的优势和劣势,对其进行进一步完善,或收集决策见解。
训练 (Train) > 尝试新数据 (Try New Data) 允许您使用包含新数据的样本列表来查看已训练工具的性能。运行准确性测试 (Accuracy Test) 以生成混淆矩阵,显示样本列表内容的预测准确性。运行性能测试 (Performance Test) 以衡量云 API 的响应时间。准确性测试对于针对从现场收集的新数据测试已训练工具非常有用。运行测试,调查错误,然后将任何错误分类的数据添加到训练集中并重新训练。

-
使用左侧菜单,转到 测试与优化 (Test & Optimize) > 尝试新数据 (Try New Data)。此页面专门用于测试您的模型。
-
从下拉菜单中选择 已训练工具 (Trained Tool)(模型)。
-
选择您要进行测试的 数据样本列表 (Data Sample List)。 如果针对 盲测数据集 (blind dataset) 进行测试,请确保预先上传并分段数据文件。
-
点击 准确性测试 (Accuracy Test) 按钮开始测试作业。
注意测试的持续时间取决于数据集的大小(例如,1 GB 的数据集可能需要大约 10 分钟)。
-
开始测试作业后,等待 2-3 分钟并刷新页面。
-
完成后,导航至 试验结果 (Trial Results) 选项卡以获取详细见解。
如果您使用的是流式数据,您可以通过返回 数据 (Data) > 整理 (Curate) 并使用较小的偏移量甚至“所有移位 (All Shifts)”重新分段文件,从原始源文件创建一个新的测试样本列表。这将创建一个新的、更大的样本列表,其中大部分由与训练工具所用样本略有不同的样本组成。在此列表上运行准确性测试,看看您的结果是否成立。
分析结果 (Analyzing the Results)
试验结果选项卡中可用的关键见解
| 字段 | 描述 |
|---|---|
| 混淆矩阵 (Confusion Matrix) | 显示将模型预测与基本事实(如果提供了标记数据)进行比较的矩阵。 |
| 统计数据 (Statistics) | 展开与模型性能相关的详细指标。 |
| 样本级别详情 (Sample-Level Details) | 允许查看单个样本预测,包括错误和正确的结果。 |
| 波形比较 (Waveform Comparison) | 允许可视化每个数据段的波形,以比较成功和不成功的预测。 |
导出结果 (Exporting Results)
要导出测试结果以进行进一步分析:
- 查看样本级别详情
- 点击 显示样本级别详情 (Show Sample-Level Details) 按钮(位于左下角)。
- 使用 GUI 过滤并查看错误、正确预测或所有结果。
- 导出到 CSV
- 点击 导出到 CSV (Export to CSV) 按钮下载结果。
导出结果中的字段:
- 结果 (Results): 模型做出的预测。
- 预期结果 (Expected Results): 数据上传期间提供的标签(基本事实)。
使用盲测数据集 (Working with Blind Datasets)
对于针对盲测数据集(没有标记基本事实的数据)的测试:
- 上传数据文件并适当分段。
- 如前所述启动测试作业。
- 由于不会生成混淆矩阵,您仍然可以将原始结果导出到 CSV 文件中进行分析。
使用波形可视化 (Using Waveform Visualization)
要比较成功与不成功预测的波形图:
- 转到 查看样本 (View Sample) 选项卡。
- 点击特定数据块的波形。
- 分析视觉差异以识别模式或改进领域。
这种可视化有助于理解数据特征与预测结果之间的关系。