MirrorWorkforce Benchmark Console

MirrorWorkforce中转站模型检测网页工作台

填写接口、模型和测试规则后即可自动跑完检测，并输出成功率、质量通过率、延迟、token 与每轮响应。字段旁边给了示例，首次使用可以一键填入演示值再替换成真实 API Key。

检测配置

所有影响检测准确性的参数都需要显式填写

必填

先确认中转站和模型

中转站名称用于报告展示，不影响请求地址。模型名称会作为请求 payload 的 model 字段。

API 地址只填域名和基础路径，不需要写 /v1/messages。 API Key 只在本机提交给本地服务，不会写入文件。

建议先用 1 轮试跑

测试轮次每个测试用例重复请求的次数。超时时间（秒）单次请求最长等待时间。

请求间隔（秒）降低并发压力和限流风险。 Anthropic version 作为 anthropic-version 请求头。

最小试跑建议 模型：claude-opus-4-6；轮次：1；超时：120；间隔：1；version：2023-06-01。

可编辑 prompt 与质量规则

检测完成后会自动刷新指标

当前中转站-

模型-

用例数-

总请求数-

综合评分-

成功率-

质量通过率-

平均延迟-

输入 Tokens-

输出 Tokens-

成功率、质量检查和 token 统计

中转站	成功率	质量通过率	空响应计费	平均延迟	总输入	总输出	评分
暂无结果

展开查看每轮响应、错误、HTTP 状态和 token

提交检测后显示每轮响应、错误和 token 统计。