1. 测试前准备:确认测试环境与权限
- 确认测试主机位置:香港机房公网IP、内网/专线IP、客户端或测试点IP。
- 硬件与系统:Linux(建议 Ubuntu/CentOS)、iperf3、mtr、tcpdump、traceroute 或 tracepath 已安装。
- 权限与时间窗口:确保有管理员权限,业务低峰时段进行,以免影响生产流量并保证测试稳定。
- 记录模板:准备 CSV/Excel 模板,字段包含:时间、源IP、目标IP、协议、带宽(Mbps)、延迟(ms)、抖动(ms)、丢包(%)、traceroute 路径、备注。
2. 基础连通性检测:ping 与 traceroute 操作步骤
- ping 连续测量:ping -c 100 -i 0.2 <目标IP>,记录平均、最小、最大与丢包率。
- traceroute 路由分析:traceroute -n -w 2 <目标IP>(或使用 mtr -r -c 100 <目标IP> 生成报告),保存跳数与每跳延迟波动。
- 结果判读:若前几跳延迟高或抖动大,问题在本地/机房侧;若中后段(过境 ISP)波动显著,问题可能在上游或跨境链路。
3. 带宽测试:使用 iperf3 的标准化步骤
- 服务端部署:在香港主机执行:iperf3 -s -p 5201,并确保防火墙放行端口。
- 客户端测试(单向):iperf3 -c <香港IP> -p 5201 -t 60 -P 4 --logfile client_60s_4p.log(-P 并发流数,-t 测试秒数)。
- 双向/反向测试:加上 -R 或在另一端也起服务端进行双向同步测试。
- 多并发/分包测试:分别测试 TCP 与 UDP(iperf3 -u),UDP 时指定带宽:-b 500M;记录吞吐、丢包、抖动与重传。
4. 时序性指标测量:抖动与丢包的抓取与分析
- 使用 ping/mtr 获取抖动估计:统计连续 100 次往返时间的方差与最大差值。
- tcpdump 报文抓取:sudo tcpdump -i eth0 host <目标IP> and port 5201 -w /tmp/iperf.pcap(用于分析重传、RTO)。
- Wireshark 指标:打开 pcap,使用 Telephony → RTP 或 Statistics → IO graph 检查丢包/延迟分布。
- 判定阈值示例:延迟 < 80ms、稳定性抖动 < 10ms、丢包 < 0.5% 为优;超过则需要排查链路或队列管理。
5. 路由与 BGP 层面排查:查看路由路径与社区策略
- 查询 BGP 路径:从运营商或路由器执行 show ip bgp <目标前缀>,记录 AS 路径与 next-hop。
- 验证 CN2 专线特征:CN2 GIA/BT 对等通常会有特定 AS 路径,确认是否走 CN2(向 ISP 询问对应的社区值)。
- 临时路由测试:在测试窗口申请 ISP 改变出口/使用不同 BGP community,记录速率与延迟变化(需运营商配合)。
- 记录变更:每次路由调整后重复 iperf3 与 traceroute,保存前后配置与指标对比。
6. 优化建议:从配置到流程的可执行措施
- QoS 与队列管理:在边缘设备启用 fq_codel 或 HTB,根据业务流量设置优先级与带宽保障。
- MTU 与分段:确认端到端 MTU,避免因分片引发性能下降;使用 ping -s 测试分片阈值。
- 长期监控:部署 Grafana+Prometheus 监控带宽/延迟/丢包,设置阈值告警并保留历史数据以便回溯。
- 联调流程:建立与供应商(香港机房与 CN2 提供商)协同工单模板,附上 traceroute、pcap、iperf 日志,明确期待变更项与 SLA。
7. Q1:如何判断香港线路是否真正走的是 CN2?
- 操作步骤:通过 traceroute/mtr 记录到香港目标的 AS 路径;在本地路由器或通过网络工具查询各跳的 AS。
- 判定依据:CN2 通常在 AS 路径或 ISP 提供的社区值中可识别(联系运营商索取 CN2 对等信息),并通过样本比对延迟与稳定性来验证。
8. A1(继续):验证与实务建议
- 实务建议:如有疑问,请要求运营商在 BGP 配置中展示 community 与 next-hop,并在低峰期做一次对比测试(更换出口或社区后重复 iperf3/traceroute)。
- 记录保留:保存所有测试结果与路由变更记录以便后续 SLA 争议使用。
9. Q2:若测速发现延迟高但带宽正常,该如何定位?
- 初步判断:带宽正常说明链路容量足够,延迟高可能是路由绕行、排队或跨境拥塞。
- 检查项:使用 traceroute 找出高延迟跳点;排查设备 CPU/队列、QOS 配置以及是否存在微丢包导致重传。
10. A2(继续):解决步骤与落地操作
- 解决步骤:在排查到特定跳点后向对应网络方提交工单并附上 mtr/pcap;在本端限速测试,启用或优化队列管理规则,逐步恢复指标。
- 验证方法:每次调整后执行 3 次以上 1 分钟 iperf3 测试与 traceroute,记录并对比 95 百分位延迟。
11. Q3:如何使用自动化脚本周期性检测 CN2 线路质量?
- 要点概述:编写脚本定时运行 ping、iperf3(短连接)、traceroute 并上报到监控系统。
- 数据采集:建议每 5 分钟采集一次 ping(20 次)、每小时一轮 iperf3(30 秒、P=2),并上传 pcap 或摘要日志到集中存储。
12. A3(继续):示例与报警策略
- 示例实现:使用 cron + bash/python 脚本调用 iperf3 与 mtr,解析输出后通过 HTTP POST 发送到 Prometheus Pushgateway 或直接写入 ELK。
- 报警建议:设置阈值如延迟>100ms 或丢包>1% 持续 3 次触发告警,并自动生成工单模板附上最近 3 次测试日志供人工复核。
来源:香港cn2速度怎样 测速报告解读与改进建议供技术团队参考