1.
明确评估目标与环境
- 明确你需要的带宽、延迟、抖动和可用性目标(例如99.99%)
- 列出关键业务流量源/目的地(客户、CDN、云服务区域)用于后续测试
2.
收集供应商基础信息
- 要求供应商提供机房位置、托管层级(Tier)、运营商列表和ASN(自治系统号)
- 索要交叉连接(cross-connect)、可用端口类型、冗余电源和机柜布局图
3.
连通性实测:Ping/Traceroute/MTR
- 执行示例:ping -c 20 <目标IP>、traceroute -n <目标IP>、mtr -r -c 100 <目标IP>
- 观察丢包点、跃点延迟突增和路径不稳定,记录可复现时间窗口用于供应商解释
4.
带宽与吞吐测试(iperf3)
- 在你的测试服务器上运行:iperf3 -s(在机房服务器);在外部客户端:iperf3 -c <机房IP> -P 10 -t 60
- 对多条出口(不同运营商)分别测试,记录吞吐、重传和抖动数据
5.
多运营商与路由冗余检查
- 要求供应商列出直连运营商和对等(peering)名单,使用Looking Glass(如HE或NTT)验证AS路径
- 检查是否支持BGP多出口、BFD、和冷备/热备策略;要求测试从不同外部ASN访问路径切换
6.
机房物理与电力冗余验证
- 查看UPS与发电机测试记录、N+1或2N电力架构、巡检报告;现场或视频验收并拍照留证
- 要求现场切换演练:断电切换至发电机并测量恢复时间及服务影响
7.
故障演练与切换测试
- 制定测试计划:模拟单链路故障、单机房断电、路由黑洞,记录业务影响与恢复时间
- 使用BGP撤销路由或ACL模拟宕机,观察BGP收敛时间与流量切换效果(记录具体时间点)
8.
SLA与合同条款谈判要点
- 要求明确SLA指标(可用性、时延、吞吐)、违约赔偿计算方法和免赔条款
- 加入定期报告、技术支持响应时间(电话/工单)与定期演练条款,明确维护窗口通知期
9.
长期监控与报警接入
- 要求提供或允许接入实时监控接口(SNMP、API、流量镜像、NetFlow/sFlow)
- 部署外部监控(Pingdom、Datadog、自建MTR探针)对比供应商数据并设置差异告警
10.
QA:如何快速判断供应商是否有多运营商接入?
- 问:如何快速判断供应商是否有多运营商接入?
- 答:查看供应商提供的运营商名单与ASN,使用BGP Looking Glass查询其IP前缀的AS PATH,或直接在机房通过traceroute向不同外部目的地测试路径去向;多条不同AS路径即为多运营商接入。
11.
QA:进行切换演练时我需要准备哪些命令与观察点?
- 问:进行切换演练时我需要准备哪些命令与观察点?
- 答:准备ping/traceroute/mtr、iperf3、netstat或ss、BGP路由表查看(show ip bgp)、日志抓取;观察丢包率、延迟变化、BGP收敛时间和应用重连情况,并记录时间戳。
12.
QA:验收不通过时的应对措施有哪些?
- 问:验收不通过时的应对措施有哪些?
- 答:要求供应商制定改进计划并约定重测时间;在合同中保留验收不通过的退换柜或取消条款,并在SLA中加入整改未达标的赔偿或终止权利。
来源:企业如何评估美国洛杉矶服务器托管供应商的连通性与冗余