Panduan Teknis Monitoring Huawei M2000 [PDF]

  • 0 0 0
  • Suka dengan makalah ini dan mengunduhnya? Anda bisa menerbitkan file PDF Anda sendiri secara online secara gratis dalam beberapa menit saja! Sign Up
File loading please wait...
Citation preview

PANDUAN MONITORING OMC RADIO HUAWEI v1.0



Disusun oleh Nurohman- Maret 2012 For internal use only



PANDUAN TEKNIS MONITORING & FIRST LINE TROUBLESHOOTING Vendor HUAWEI



Tools iManager M2000



Version 1.0



Remark 2G



1. BTS Monitoring Common Alarm - OML Fault - LAPD OML Fault (BSC6000) Remark - Koneksi maintenance link dari protocol LAPD putus/bermasalah. - Penyebabnya bisa karena link BSC-BTS putus atau tidak ada respon dari BTS. - Dipastikan BTS tidak service/down. How to check - DSP BTSSTAT untuk menampilkan status running BTS - DSP GCELLSTAT/DSP CELLSTAT untuk menampilkan status running Cell Related Alarm - GSM Cell Out of Service - Cell Out of Service (BSC6000) Ilustrasi - Tampilan di alarm list:



- Tampilan di main topology:



Action



Probable Cause



- Eskalasi ke NSA regional. - Jika jumlah BTS yang down cukup banyak (kira-kira >= 30), cek di sisi transmisi backbone apakah ada problem, jika ada, segera lakukan koordinasi dengan team transmisi sehingga bisa melakukan eskalasi segera ke team yang berkompeten. - Transmisi problem antara BSC-BTS. - BTS problem (HW, PW, dll).



2. Signaling Monitoring Common Alarm - MTP3 Signaling Link Faulty - MTP3 Signaling Linkset Unavailable - MTP3 DSP Unreachable (BSC6000) 2



Remark



How to check



Related Alarm



Ilustrasi



- MTP3 DSP Inaccessible - MTP3 Link Unavailable (BSC6000) - Koneksi signaling dari BSC kearah MSS putus. - Biasanya masih menggunakan teknologi ATM over TDM. - Jika ada alarm linkset unavailable, berarti semua link dalam linkset tersebut down. - Ada juga SS7 yang sudah dilewatkan via IP, dan biasanya untuk membawa signaling SS7-nya menggunakan protocol M3UA. - Misalnya untuk AoIP, signaling/control plane-nya memakai IP Signaling (SCTP). - LST MTP3LKS untuk mengecek jumlah linkset signaling MTP3 - LST MTP3LNK untuk mengecek jumlah link signaling MTP3 - DSP MTP3LKS untuk mengecek status linkset MTP3 - DSP MTP3LNK untuk mengecek status link MTP3 - LST MTP3RT untuk melihat rute MTP3 link kearah destination mana. Command ini bisa di relasikan dengan LST N7DPC. - DSP MTP3RT untuk mengecek status rute MTP3, jika down, kemungkinan linkset juga down. - M3UA link fault - M3UA Destination Entity Inaccessible. - M3UA linkset broken - Contoh tampilan di alarm list:



- Contoh command untuk menampilkan jumlah linkset (ada 1 linkset).



3



- Contoh command untuk menampilkan jumlah link dalam 1 linkset:



Contoh command untuk menampilkan M3UA link (jika ada, di contoh berikut tidak ada):



4



Action



Probable Cause



- Jika ada alarm MTP3 Signaling Link Faulty , cek jumlah link dengan command “LST MTP3LNK” dan jumlah linkset dengan command “LST MTP3LKS”, sehingga kita bisa menentukan total berapa dari berapa signaling yang jatuh. Segera eskalasi ke NSA regional. - Jika ada alarm linkset, cek jumlah linkset untuk signaling dalam BSC tersebut, jika Cuma 1, bisa dipastikan semua signalingnya jatuh, BSC tersebut tidak service. Segera eskalasi ke NSA regional. - Jika ada alarm M3UA (baik link/linkset) di BSC, cek M3UA linkset dengan command “LST M3LKS” dan M3UA link dengan command “LST M3LNK”. Jika ada linkset/link yang dipakai buat signaling bisa dipastikan signaling link/linkset tersebut down. - Jika ada signaling down secara bersamaan di beberapa BSC, ada kemungkinan problem di transmisi backbone. - Jika status BSC tidak bisa termonitor, segera cek ke rekanrekan OMC Switching untuk melihat status signaling dari BSC tersebut apakah jatuh atau tidak. Jika jatuh, segera eskalasi ke NSA regional. - Transmisi antara BSC dengan core network. - Modul signaling BSC rusak; BSC mati. - Problem di site simpul. - Konfigurasi yang salah; database sampah.



3. A dan Ater Monitoring (over TDM). Common Alarm - Ater RSL Faulty 5



Remark



How to check



Related Alarm Ilustrasi



- E1/T1 Lost Of Signal - E1/T1 Lost of Frame/Multiframe - E1/T1 Alarm Indication Signal - Di BSC6000 nama alarm-nya mirip. - Ater adalah koneksi dari BSC kea rah TRAU/Transcoder Unit. - Untuk alarm Ater RSL faulty menandakan semua koneksi Ater tidak bisa dipakai (Tidak Ada CS services!!). - LST ATERCONPATH untuk mengecek semua E1 yang dipakai untuk koneksi Ater. - Jika tidak ada hasil ketika memakai command LST ATERCONPATH, berarti di BSC tersebut tidak mempunyai koneksi Ater (bisa karena kolokasi dengan Core Network  A interface direct ke Core; atau memakai A over IP). - LST E1/T1 untuk melihat list E1/T1 yang dipakai untuk Ater dengan memasukkan Subrack Number, Slot Number, Port Number (di BM Subrack sesuai yang di dapat di command LST ATERCONPATH) beserta nama board interface-nya. - DSP E1/T1 untuk melihat status E1/T1 yang dipakai untuk Ater dengan memasukkan parameter-parameter seperti di command LST E1/T1. - Untuk A over TDM, untuk melihat koneksi E1 yang dipakai untuk A interface bisa dilakukan dengan command “LST AE1T1”. - Untuk melihat status E1 dengan command “DSP E1/T1”, parameter subrack dan slot numbernya bisa dilihat di command “LST AE1T1”. Sedangkan untuk mengetahui jenis board-nya bisa coba-coba satu persatu atau dengan command “LST BRD”, dengan subrack dan slot number yang sama. - Jika dengan DSP E1/T1 hasilnya terlalu banyak, bisa mengkorelasikan langsung dengan alarm E1/T1 yang ada (tidak perlu display status E1-nya). - Ater OML Fault - Tampilan di alarm list (contoh untuk log alarm):



- Command LST ATERCONPATH:



6



- Command LST E1/T1:



- Command DSP E1/T1:



7



- Ilustrasi hasil DSP E1/T1 per port (kondisi normal):



- Koneksi A interface over TDM (case tidak ada Ater interface):



8



- Melihat jenis interface board yang dipakai A interface (subrack dan slot sda):



Action



Probable Cause



- Jika ada alarm dan sudah melakukan cek ricek terhadap koneksi A/Ater dan ditemukan adanya masalah, segera koordinasikan dengan NSA dan OMC transmisi. - Tidak semua alarm E1/T1 related dengan Ater, jadi lakukan crosscek terlebih dahulu dengan langkah-langkah di atas, terutama jika terjadi alarm E1/T1 yang cukup massive. - Transmission problem. - Board interface problem.



4. A over IP Monitoring (AoIP). 9



Common Alarm



Remark



How to check



Related Alarm Ilustrasi



- M3UA Link Fault - M3UA Link Set Broken - M3UA Destination Entity Inaccessible - M3UA Destination Entity Route Unavailable - Alarm M3UA yang di deteksi merupakan alarm control plane (signaling) dari BSC tersebut. - A over IP memungkinkan Control Plane dan User Plane BSC di lewatkan melalui jaringan IP secara bersamaan. - Saat ini implementasi A over IP dibarengi dengan implementasi MGW Pool, sehingga jika koneksi ke satu MGW putus akan bisa di backup oleh MGW yang lain. - AoIP bisa menggunakan transmisi E1 (IP over E1), maupun transmisi FE/GE (IP over FE/GE). - LST M3DE untuk melihat Destination Entity dari protocol M3UA. - LST M3LKS untuk melihat jumlah linkset M3UA, dengan melihat Destination Entity di hasil run command-nya. - LST M3LNK untuk melihat Link M3UA, jika dipakai untuk A interface, maka perlu memasukkan linkset number-nya. - DSP M3DE, DSP M3LKS, DSP M3LNK untuk melihat status masing-masing dari M3UA link maupun linkset. - DSP IPPATH, untuk melihat status dari IPPATH, bisa juga untuk melihat traffic untuk masing-masing IPPATH. Jika mau melihat IPPATH yang digunakan untuk A interface, tinggal kita list aja dengan LST IPPATH. Jadi kita bisa liat juga traffic A interface-nya. - Group alarm E1/T1 (jika IP over E1) - Tampilan di alarm list:



- LST M3DE:



10



- LST M3LKS :



- LST M3LNK yang dipake untuk AoIP (contoh untuk Indomobil seperti diatas):



11



Untuk mengecek status link-nya (command display (DSP)) caranya sama seperti diatas. - Untuk mengecek koneksi A interface ke arah MGw mana, bisa dicek dengan command LST N7DPC:



Lihat DSP type-nya  A (A interface). Contoh diatas kemungkinan penamaan DSP-nya salah, harusnya ke arah MGW (core Network). - Jika Koneksi kearah MGw pool, untuk melihat BSC tersebut terhubung ke MGw mana saja, coba run command LST IPRT:



12



- Hasil run command DSP IPPATH:



Action



Probable Cause



- Jika ada satu alarm M3UA link yang dipakai A interface jatuh, berarti ada kemungkinan satu Assoc ke arah MGW pool yang jatuh, secara service harusnya tidak berpengaruh. - Jika ada alarm M3UA linkset/route set jatuh, berarti semua Assoc ke arah MGW jatuh, service terganggu, segera eskalasikan ke regional/NSA. - Untuk memastikan service ada atau tidak bisa di cek trafik di A interface-nya seperti cara di atas. - Transmission problem. - Configuration problem. - Hardware problem (port, kabel Ethernet, dll).



13



5. Gb Link / PS Service Monitoring. Common Alarm - NSE Faulty (BSC6900/BSC6000). - GB BC FAULTY (BSC6000); GB BC FAILURE (BSC6900) - NSVC FAULTY (BSC6000); NSVC DISCONNECTION (BSC6900) - PTP BVC FAULTY (BSC6000/BSC6900)  Alarm level Cell - Cell PS Service Faulty (BSC6000/BSC6900)  Alarm level Cell - NSVL FAULTY (BSC6000/BSC6900)  Gb Over IP Remark - Gb adalah interface antara BSC dengan SGSN. Trafik paket data dari BSC ke arah SGSN akan melewati interface ini. - Paket data di Gb bisa dikirim melalui jaringan frame relay (Gb over FR) ataupun jaringan IP (Gb over IP). - BC (Bearer Channel) digunakan untuk interkoneksi NSVC ke transmisi-nya (E1). Jika ada BC failure, berarti NSVC yang melalui BC tersebut tidak bisa membawa paket data. - PTP BVC (Point To Point BSSGB Virtual Connection) merupakan koneksi point to point dari cell yang support PS service ke arah SGSN. Jika ada alarm ini, maka cell yang bersangkutan tidak bisa menggunakan layanan data, biasanya related dengan alarm Cell PS Service Faulty. - Jika ada alarm NSE faulty  semua koneksi NSVC/NSVL di NSE tersebut mati. - NSVC (over FR) dan NSVL (over IP) secara sederhana bisa diartikan 1 link Gb yang bertugas membawa trafik. How to check - LST NSE, untuk melist NSE di BSC tersebut, masing-masing NSE mempunyai ID tersendiri (NSEI). - LST NSVC, untuk me-list NSVC di BSC tersebut. - DSP NSVC, untuk mengecek status NSVC pada masing-masing NSE. - DSP NSVL, untuk mengecek status NSVL pada masing-masing NSE. - LST BC, untuk me-list BC yang sudah di configure di (interface) BSC tersebut. - DSP BC, Untuk mengecek status BC. - LST PTPBVC, me-list semua koneksi PTPBVC per cell di BSC tersebut. - DSP PTPBVC, mengecek status PTPBVC. Related Alarm Ilustrasi - LST NSE



14



- LST NSVC:



- DSP NSVC:



15



- DSP NSVL (Khusus Gb Over IP):



16



- LST BC:



- DSP BC:



17



- LST PTPBVC:



- Output DSP PTPBVC:



18



Action



Probable Cause



- Jika ada alarm NSE, NSVC, NSVL, BC segera eskalasikan ke NSA terkait. - Jika ada alarm PTPBVC atau Cell PS Service Faulty dalam jumlah yang banyak, segera eskalasikan juga ke NSA terkait. - Jika memungkinkan, cek ricek dulu dengan langkah-langkah di atas. - Transmission Problem. - Configuration problem. - Hardware problem (board interface).



6. Overload alarm Common Alarm - CPU Overload Remark - Alarm ini akan muncul jika occupancy dari CPU subsystem di masing-masing board melebihi threshold yang di configure di board tersebut. - Ada kalanya threshold CPU overload ini dibuat agak rendah untuk memberikan early warning. - Satu board bisa memiliki 1 atau lebih CPU subsystem. - Board di BSC beberapa memiliki mode active standby untuk proteksinya. How to check - LST CPUTHD (BSC6900) untuk melihat threshold yang di define di board-board BSC. - DSP CPUUSAGE untuk melihat berapa persen load dari CPU. - DSP CPUSTAT (BSC6000) untuk melihat status CPU (enable, normal, active/standby) Related Alarm - DSP Overload Ilustrasi - Contoh output Command LST CPUTHD di BSC6900:



19



- Contoh output Command DSP CPUUSAGE di BSC6900:



Contoh output DSP CPUSTAT di BSC6000:



Action



Probable Cause



- Eskalasi ke NSA regional. - Jika ada alarm CPU overload, lihat dulu berapa persen overload dari thresholdnya, jika sudah cukup tinggi (kira-kira >95%), cek berapa usage masing-masing CPU di board tersebut dengan command DSP CPUUSAGE ; Jika masih ada yang berfungsi, bisa jadi secara service tidak terganggu, tetapi tetap eskalasikan ke NSA regional. - Jika CPU load sudah melebihi 95% dan tidak ada redundancy, segera eskalasikan ke NSA. - Board problem. - High traffic. 20



- Selain karena loadnya sudah melebihi thresholdnya.



21



PANDUAN TEKNIS MONITORING & FIRST LINE TROUBLESHOOTING Vendor HUAWEI



Tools iManager M2000



Version 1.0



Remark 3G



1. NodeB Monitoring. Common Alarm - NodeB Unavailable Alarm - NodeB Unavailable (BSC6900) Remark - Semua cell di Node B tersebut tidak bisa service. - Alarm ini bisa terjadi jika NCP (NodeB Control Port) atau semua CCP (Communication Control Port) kearah nodeB unavailable. - NCP dan CCP berhubungan dengan mode signaling control RNC ke NodeB, yaitu Common-NBAP dan Dedicated-NBAP. How to check - LST NODEB (BSC6810) / LST UNODEB (BSC6900), untuk mengelist semua nodeB yang ada di dalam satu RNC. - DSP NODEB (BSC6810) / DSP UNODEB (BSC6900), untuk melihat status nodeB. Related Alarm - Cell unavailable alarm. - Cell Congested Alarm. - UMTS Cell Unavailable. - UMTS Cell Congested. Ilustrasi - Tampilan di alarm list:



- Tampilan di main topology:



- Contoh output DSP NODEB:



22



Action



Probable Cause



- Eskalasi ke NSA regional. - Jika jumlah NodeB yang down cukup banyak (kira-kira >= 30), cek di sisi transmisi backbone apakah ada problem, jika ada, segera lakukan koordinasi dengan team transmisi sehingga bisa melakukan eskalasi segera ke team yang berkompeten. - Transmisi problem antara RNC-NodeB. - NodeB problem (HW, PW, port interface dll).



2. IuCS Monitoring. Common Alarm - MTP-3b DSP Inaccessible (BSC6810) - MTP-3b Signaling Route Unavailable (BSC6810) - MTP3 DSP Inaccessible Alarm (BSC6810) - MTP3 Signaling Link Unavailable (BSC6810) - MTP3 Signaling Linkset Unavailable (BSC6810/BSC6900) - MTP3 Signaling Route Unavailable Alarm (BSC6810) - MTP3 DSP Inaccessible (BSC6900) - MTP3 Signaling Link Faulty (BSC6900) - MTP3 Signaling Route Inaccessible (BSC6900) - MTP3 Signaling Link Set Broken (BSC6900) - MTP3B Link Set Broken (BSC6900) Remark - IuCS adalah interface antara RNC kearah CS core network. Signaling dan traffic CS akan dilewatkan melalui interface ini. - Semua alarm DSP (Destination Signaling Point) di atas menandakan semua link yang ke arah DSP yang bersangkutan tidak berfungsi. - Alarm Linkset di atas menandakan signaling linkset-nya (terdiri dari beberapa link) tidak berfungsi. - Alarm Link di atas menandakan Signaling Link tidak berfungsi, jika ada alarm ini, asalkan tidak semua link mati, service masih 23



How to check



Related Alarm Ilustrasi



akan tetap terjaga, meskipun dalam kondisi tertentu bisa terjadi congestion. - Alarm route unavailable menandakan semua link ke DSP tertentu dengan route yang ada tidak bisa digunakan, kecuali jika ada alternative route yang lain, maka service akan tetap termaintain. - Signaling MTP3 di 3G memakai teknologi ATM. - LST MTP3BLKS / LST MTP3LKS  Melihat signaling link set yang ada di RNC tersebut. - LST MTP3BLNK / LST MTP3LNK  Melihat signaling link dalam linkset tertentu di RNC tersebut. - LST MTP3BRT / LST MTP3RT  Melihat route dari signaling linkset kearah DSP tertentu yang ada di RNC tersebut. - DSP MTP3BLKS / DSP MTP3LKS  Melihat status signaling link set - DSP MTP3BLNK / DSP MTP3LNK  Melihat status signaling link - DSP MTP3BRT / DSP MTP3RT  Melihat status signaling route. - LST SAALNK  Melihat signaling link AAL. - DSP SAALNK  Melihat status Signaling link AAL, jika status-nya unavailable/down, maka semua signaling link yang dilewatkan ke AAL (ATM Adaptation Layer) tersebut tidak berfungsi. - Untuk mengecek apakah SAAL dipakai untuk IuCS bisa dilihat dari SAAL link numbernya dengan Command LST MTP3LNK; Bisa juga jika ada alarm SAAL link, maka langsung bisa di cek alarm SAAL link tersebut dipakai untuk IuCS atau bukan dengan command LST SAALNK. - SAAL Link Unavailable (BSC6810) - SAAL Link Fault (BSC6900) - Tampilan di alarm list:



- Melihat signaling link set:



24



- Melihat Signaling Link yang dipakai untuk IuCS:



- Melihat destination point dari signaling linkset:



25



- Melihat route dari IuCS:



- Mengecek status signaling Linkset, Link, dan route:



26



27



Action



Probable Cause



- Segera koordinasikan dan eskalasikan ke NSA jika ada alarm link, linkset maupun route untuk IuCS. - Untuk memastikan dan mempertajam informasi, lakukan langkah-langkah cek dan ricek seperti yang di ilustrasikan di atas. - Transmisi problem antara RNC-Core Network. - Configuration problem. - Interface atau port problem.



3. IuPS Monitoring. Common Alarm - M3UA Destination Entity Inaccessible (BSC6810 / BSC6900) - M3UA Destination Entity Inaccessible Alarm (BSC6810) - M3UA Link Fault (BSC6810 / BSC6900) - M3UA Link Fault Alarm (BSC6810) - M3UA Route Unavailable (BSC6810) - M3UA Destination Entity Route Unavailable (BSC6900) - M3UA Link Set Broken Remark - IuPS adalah interface antara RNC kearah PS core network / SGSN. Signaling dan traffic PS akan dilewatkan melalui interface ini. - Semua alarm “Destination Entity” di atas menandakan semua link yang ke arah destination yang bersangkutan tidak berfungsi. - Alarm “Linkset” di atas menandakan signaling linkset-nya (terdiri dari beberapa link) tidak berfungsi. - Alarm “Link” di atas menandakan Signaling Link tidak berfungsi, jika ada alarm ini, asalkan tidak semua link mati, service masih akan tetap terjaga, meskipun dalam kondisi tertentu bisa terjadi 28



How to check



Related Alarm Ilustrasi



congestion. - Alarm route unavailable menandakan semua link ke destination entity tertentu dengan route yang ada tidak bisa digunakan, kecuali jika ada alternative route yang lain, maka service akan tetap termaintain. - Protocol M3UA selalu memakai IP network. - LST M3LKS  Melihat signaling link set yang ada di RNC tersebut. - LST M3LNK  Melihat signaling link dalam linkset tertentu di RNC tersebut. - LST M3RT  Melihat route dari signaling linkset kearah Destination Entity tertentu yang ada di RNC tersebut. - LST M3DE  Melihat Destination Entity M3UA dari RNC tersebut. - DSP M3LKS  Melihat status signaling link set - DSP M3LNK  Melihat status signaling link. - DSP M3RT  Melihat status signaling route. - DSP M3DE  Melihat status Destination Entity M3UA dari RNC tersebut. - LST SAALNK  Melihat signaling link AAL. - DSP SAALNK  Melihat status Signaling link AAL, jika status-nya unavailable/down, maka semua signaling link yang dilewatkan ke AAL (ATM Adaptation Layer) tersebut tidak berfungsi. - Untuk mengecek apakah SAAL dipakai untuk IuCS bisa dilihat dari SAAL link numbernya dengan Command LST MTP3LNK; Bisa juga jika ada alarm SAAL link, maka langsung bisa di cek alarm SAAL link tersebut dipakai untuk IuCS atau bukan dengan command LST SAALNK. - SCTP Link Down (BSC6810) - SCTP Link Fault (BSC6900) - Tampilan di alarm list:



- Melihat signaling link set IuPS:



29



- Melihat Signaling Link yang dipakai untuk IuPS:



- Melihat route dari IuPS:



- Melihat Destination Entity M3UA: 30



- Mengecek status signaling Linkset, Link, route, dan Destination Entity:



31



Action



Probable Cause



- Segera koordinasikan dan eskalasikan ke NSA jika ada alarm link, linkset maupun route untuk IuPS. - Untuk memastikan dan mempertajam informasi, lakukan langkah-langkah cek dan ricek seperti yang di ilustrasikan di atas. - Transmisi problem antara RNC-Core Network. - Configuration problem. - Interface atau port problem.



4. Overload Alarm Common Alarm - CPU Overload Alarm (BSC6810) - CPU Overload (BSC6900) Remark - Alarm ini akan muncul jika occupancy dari CPU subsystem di masing-masing board melebihi threshold yang di configure di board tersebut. - Ada kalanya threshold CPU overload ini dibuat agak rendah untuk memberikan early warning. 32



How to check



Related Alarm Ilustrasi



- Satu board bisa memiliki 1 atau lebih CPU subsystem. - Board di RNC beberapa memiliki mode active standby untuk proteksinya. - LST CPUTHD untuk melihat threshold yang di define di boardboard RNC. - DSP CPUUSAGE untuk melihat berapa persen load dari CPU. - DSP CPU Overload - Contoh output Command LST CPUTHD di BSC6900:



- Contoh output Command DSP CPUUSAGE di BSC6900:



Action



- Eskalasi ke NSA regional. - Jika ada alarm CPU overload, lihat dulu berapa persen overload dari thresholdnya, jika sudah cukup tinggi (kira-kira >95%), cek berapa usage masing-masing CPU di board tersebut dengan command DSP CPUUSAGE ; Jika masih ada yang berfungsi, bisa jadi secara service tidak terganggu, tetapi tetap eskalasikan ke 33



Probable Cause



NSA regional. - Jika CPU load sudah melebihi 95% dan tidak ada redundancy, segera eskalasikan ke NSA. - Board problem. - High traffic. - Selain karena loadnya sudah melebihi thresholdnya. Sementara Selesai 



34