请检查BSC下所有逻辑类型为DSP 占有率平均值 80% GPCU的DPU单板所有DSP的“DSP CPU占有率平均值”话统,任一DSP超过预警值都需要予以处理。 当上面登记的这些指标任何一个超过预警值后,说明系统负荷已经很大,应该立即通知相关人员,启动应急流程。
1.2.3 应急处理 KPI部分: A:寻呼:
获取A接口寻呼消息数。如果15分钟的A接口寻呼消息数大于5万/位置区,按照如下处理方式处理: 修改步骤:
1、SET GCELLIDLEBASIC命令中把“接入允许保留块数” 设为 1; 2、SET GCELLIDLEBASIC命令中把“相同寻呼间帧数编码”设为 2; 3、SET GCELLCCCH命令中把“CCCH负荷门限”设为 100; 4、SET GCELLCCBASIC命令中把“MS最大重发次数”设为2; 5、SET GCELLCCBASIC命令中把“寻呼次数”设为1;
6、SET GCELLIDLEBASIC命令中把“扩展传输时隙数”设为32; 7、设置小区参数SET GCELLTMR中的“T3122”定时器为30秒。
B:TCH拥塞:
每个小区的TCH信道拥塞率,如果大于10%,按照如下处理方式处理:
1、普通小区半速率话务忙门限提高为40%,SET GCELLCHMGAD 命令中设置“TCH 话务忙门限”为“40”。 2、开通AMR功能的小区AMR呼叫优先分配半速率小区负荷门限提高到40%,SET GCELLCHMGAD命令中设置“AMR呼叫优先分配半速率小区负荷门限”为40%。
C:短信过载
在短信业务量突增的场景下(15分钟话统中“BSC整体点到点短消息数目(SDCCH)”+“BSC整体点到点短消息数目(TCH)”>40000),BSC下行LAPD链路拥塞,语音寻呼困难。 处理方法:第一时间通知客户及办事处网优及产品值班人员,由客户决定及办事处值班人员决定如何操作
如果需要操作,下面是处理步骤:(开启分类流控功能:红字部分网优侧不操作): 寻呼分类流控功能需要在MSC和BSC同时开启,该功能是指,由MSC在寻呼消息中通过协议扩展字段标志寻呼的类型是呼叫还是短消息,并在无线侧寻呼过载时,在Abis口LAPD链路下发消息队列中优先丢弃短消息寻呼,确保语音呼叫能够正常进行。
操作 MML命令 开启分类流控功能 SET BSCFCPARA: PGCLASSIFINGALLOWED=1;
开启MSC短信漏桶流控功能
MSC短信漏桶流控功能是一种针对短信突发量较大的情况下使用的一种短信流控方法,其作用是依据不同的短信中心,设置短信通过百分比或每秒短信通过次数,来限制突发短信,保护下行网元安全,建议通过设置每秒通过次数方法对现网进行修改,短信中心根据被流控短信返回的错误码,依据短信重发策略进行短信重发,建议设置值为60条/秒。 设置方法:
协调控制短信中心下发速率
寻呼峰值达到150条/秒以上,且具备一定的持续性,如果大量的寻呼以此速度到达BSC设备,将严重超出系统空口及LAPD处理能力,系统有可能会产生雪崩效应,因此,建议SP控制短信下发速率。 增大LAPD RSL滑窗
作用:当前配置为4,可修改为8,提升LAPD消息下发缓冲队列长度,提高发送成功率
操作 增大LAPD RSL滑窗 MML命令 SET BTSLAPDWS: RSLWS=8;
D:PS业务量突增造成的过载
在分组业务量突增的场景下,BSC下行LAPD链路拥塞,语音寻呼困难。
调整PS接入请求门限 操作 调整PS接入请求门限
MML命令 SET BSCFCPARA: STARTCHREQARRIVALCTRL=YES, CHREQPSAVGMSGNUMINPERIOD=120; 为了应对现场突发的大量短信和PS寻呼的场景,可在开启以下分类流控等功能的同时
将该门限设置为与BSC6000是接近的门限,以对PS接入进行流控,避免PS接入过量而影响语音通话。
由于BSC6000时该统计按照框计算,每框800,而在6900是按照每CPUS计算,现场配置每框有7个CPUS,该门限在6900默认为200,则每框1400,将其配置为120,则每框120*7=840,与升级前则相近。
增大LAPD RSL滑窗 作用:当前配置为4,可修改为8,提升LAPD消息下发缓冲队列长度,提高发送成功率
操作 增大LAPD RSL滑窗 MML命令 SET BTSLAPDWS: RSLWS=8;
设置PS寻呼流控门限(默认为200),控制PS寻呼量,避免对CS业务的冲击 操作 设置PS寻呼流控门限 MML命令 SET BSCFCPARA: PGMAXPSMSGNUMINPERIOD=50;
E:小区无话务(单小区或整个站):
实时信道状态监控下,发现单小区或整个站点无话务,周边站点话务正常,且从覆盖上看,该站点应该吸收话务。传输正常,单板正常,没有相关告警。 处理方法:第一时间通知客户及办事处网优及产品值班人员,由由客户决定及办事处值班人员决定如何操作,或是否复位该基站。 如果需要操作,下面是处理步骤:处理方法:
1、如果是单小区:复位小区,使用MML命令:RST GCELL,观察问题是否解决,如果没有解决执行下一步;
操作 复位小区 MML命令 RST GCELL: IDTYPE=BYID, CELLID=0, LEVEL=4-LEVEL; 2、(如果是基站无话务直接进行第2步):四级复位基站,使用MML命令:RST BTS,设置“复位级别”为“4-LEVEL(四级复位)”,观察问题是否解决,如果没有解决执行下一步;
操作 复位基站 MML命令 RST BTS: TYPE=BTSSOFT, IDTYPE=BYID, BTSID=0, LEVEL=4-LEVEL; 3、远端下电复位单板,观察问题是否解决。 F:BSC复位(或大面积传输断):
处理方法:第一时间通知客户及办事处网优及产品值班人员,由客户决定及办事处值班人员决定如何操作:
如果需要操作,下面是处理步骤:打开信道请求消息到达率控制,将信道请求消息到达统计周期设置为1000毫秒,将CS业务新道请求的数目降低到10次/秒,将PS 业务信道请求的数目降到到20次/秒。执行后查看CPU 占用率是否在安全范围,如果正常,可以继续增加(CS每次递增10个,PS每次递增20个)单位时间内允许接入的CS、PS业务信道请求的数目,直至CS达到100,PS达到200。
操作 打开信道请求到达率控制,设置到达率统计周期为1000毫秒,CS业务信道请求数目为50,PS业务信道请求为100 MML命令 SET BSCFCPARA: STARTCHREQARRIVALCTRL=YES, CHREQSTATPERIOD=1000, CHREQCSMAXMSGNUMINPERIOD=10, CHREQPSAVGMSGNUMINPERIOD=20; 负荷监控部分:
查看CPU平均占用率15分钟话统指标,XPU单板的各个CPU中的任何一个平均CPU占用率超过85%;
查看历史告警,在最近5分钟内发现多次CPU过载告警
(CPU过载告警依据的是CPU的瞬时占用率,因此它的出现和恢复的随机性很强在此无法给出这样的一个确切的数字,说出现了多少次告警就有问题。我们可以用另外一个方法,计算出每个告警的存在时间(即告警恢复时间-告警产生时间),将5分钟内所有的CPU过载告警的存在时间加在一起,如果这个存在时间超过了2分钟,则说明存在XPU过载。)
处理方法:第一时间通知客户及办事处网优及产品值班人员,由客户决定及办事处值班人员决定如何操作
如果需要操作,下面是处理步骤:
以下步骤,执行每一步后观察5分钟,如果正常,结束处理,否则继续下一步。使用WEBLMT的CPU占用率监测功能,实时监测XPU单板的CPU占用率。这样便于观测应急措施的效果;
1、关闭CHR记录,修改后观察5分钟后查看XPU CPU是否下降到安全范围(CPUS占用率小于80%为安全范围)。
操作 关闭CHR MML命令 SET CSCHRFILTER: CSRCDSW=OFF; 加PS关闭
2、如果XPU单板的CPU占有率过载,打开测量报告预处理,设置“设置小区切换控制参数〉BTS测量报告预处理”为“BTS_Preprocessing”,设置“设置小区切换控制参数 〉预处理测量报告上报频率”为“Once_2s”;修改后查看LAPD过载告警是否恢复或CPU是否低于80%,如果正常,结束处理,否则继续下一步;
操作 打开测量报告预处理,设置MR上报频率2秒一次 MML命令 SET GCELLHOCTRL: IDTYPE=BYID, CELLID=0, BTSMESRPTPREPROC=BTS_Preprocessing, MRPREPROCFREQ=Once_2s;
如果基站版本是BTS3000V100R001C07之前版本,打开测量报告预处理时,要同时确保避免选用“华为III代功率控制”。 3、设置“设置小区呼叫控制基本参数 〉MS最大重发次数”为1,减少寻呼次数。修改后查看XPU CPU是否下降到安全范围(CPUS占用率小于80%为安全范围),如果正常,结束处理,否则继续下一步;
操作 设置MS最大重发次数为1 MML命令 SET GCELLCCBASIC: IDTYPE=BYID, CELLID=0, MSMAXRETRAN=1_Times;
4、打开信道请求消息到达率控制,将信道请求消息到达率统计周期设置为1000毫秒,将统计周期内允许的CS域信道请求消息最大数目降低到50次/秒,将统计周期内允许的PS域信道请求消息平均数目降到到50次/秒。执行后观察5分钟,查看CPU 占用率是否降低到安
全范围,如果正常,结束处理,否则,可以继续降低(CS每次递减10个,PS每次递减20个)单位时间内允许接入的CS、PS业务信道请求消息平均数目。
操作 打开信道请求到达率控制,设置到达率统计周期为1000毫秒,CS业务信道请求数目为50,PS业务信道请求为50 MML命令 SET BSCFCPARA: STARTCHREQARRIVALCTRL=YES, CHREQSTATPERIOD=1000, CHREQCSMAXMSGNUMINPERIOD=50, CHREQPSAVGMSGNUMINPERIOD=50; 5、关闭GPRS业务。
操作 关闭GPRS业务 MML命令 SET GCELLGPRS: IDTYPE=BYID, CELLID=0, GPRS=NO, EDGE=NO; 6、闭塞部分小区,根据话务量恢复情况逐渐恢复。