MirrorWorkforce 模型检测 Anthropic 兼容接口质量、计费和响应稳定性检测
检测服务 等待配置
MirrorWorkforce Benchmark Console

MirrorWorkforce中转站模型检测网页工作台

填写接口、模型和测试规则后即可自动跑完检测,并输出成功率、质量通过率、延迟、token 与每轮响应。字段旁边给了示例,首次使用可以一键填入演示值再替换成真实 API Key。

检测配置

所有影响检测准确性的参数都需要显式填写

必填

基础参数

先确认中转站和模型

运行参数

建议先用 1 轮试跑
最小试跑建议 模型:claude-opus-4-6;轮次:1;超时:120;间隔:1;version:2023-06-01

测试用例

可编辑 prompt 与质量规则

汇总结果

检测完成后会自动刷新指标

当前中转站-
模型-
用例数-
总请求数-
综合评分-
成功率-
质量通过率-
平均延迟-
输入 Tokens-
输出 Tokens-

指标表

成功率、质量检查和 token 统计

中转站 成功率 质量通过率 空响应计费 平均延迟 总输入 总输出 评分
暂无结果

详细响应

展开查看每轮响应、错误、HTTP 状态和 token

提交检测后显示每轮响应、错误和 token 统计。