常見(jiàn)排障指南(FAQ)
一、定時(shí)數(shù)據(jù)保護(hù)相關(guān)問(wèn)題
1、文件備份恢復(fù)(File組件)
Q1:文件備份失敗,詳細(xì)日志里報(bào)“初始化驅(qū)動(dòng)管理代理失敗”
A1:
問(wèn)題原因:安裝代理時(shí)未退出殺毒軟件進(jìn)行安裝。
解決方案:退出殺毒軟件后重新進(jìn)行安裝。
Q2:文件備份失敗,詳細(xì)日志里報(bào)“寫(xiě)操作異常:Java heap space”
A1:
問(wèn)題原因:JVM可用內(nèi)存不足。
解決方案:
1. 將海量大文件夾分為多個(gè)小文件夾分別備份。
2. 打開(kāi)uagent\lib\file\all\conf\excutorArgs.properties文件,將def.args.2=-Xmx1024m修改為def.args.2=-Xmx2048m或更大值。
2、SQL Server數(shù)據(jù)庫(kù)備份恢復(fù)(SQLServer組件)
Q1:備份失敗,報(bào)“服務(wù)器主體NT AUTHORITY\SYSTEM無(wú)法在當(dāng)前安全上下文訪問(wèn)數(shù)據(jù)庫(kù)test”
A1:
將登錄名NT AUTHORITY\SYSTEM的屬性中的服務(wù)器角色和用戶映射改成與登錄名sa的屬性中相同的參數(shù)。
Q2:SQL Server2000數(shù)據(jù)庫(kù)無(wú)法添加集群策略(sp4之后的版本不再支持SQL Server2000)
A1:
需安裝SQL Server2000 SP4補(bǔ)丁包。
3、MySQL數(shù)據(jù)庫(kù)物理方式備份恢復(fù)(MySQLPhysical組件)
Q1:若MySQL 8.0.x備份失敗,日志中報(bào)錯(cuò):ERROR: MySQL query 'LOCK INSTANCE FOR BACKUP': 1227, Access denied; you need (at least one of) the BACKUP_ADMIN privilege(s) for this operation
A1:
執(zhí)行如下語(yǔ)句:
use mysql;
grant BACKUP_ADMIN on *.* to `root`@`%` with grant option;
flush privileges;
A1:
檢查mysqldump和mysqlbinlog文件位置是否輸入錯(cuò)誤。
4、達(dá)夢(mèng)數(shù)據(jù)庫(kù)備份恢復(fù)(DM組件)
Q1:掛載方式的備份集用緩存方式恢復(fù),緩存位置在哪里
A1:
緩存位置默認(rèn)為掛載方式備份時(shí)掛載的路徑。
Windows系統(tǒng)默認(rèn)緩存位置:C:\windows\Temp\mountpoint\s_dm
Linux系統(tǒng)默認(rèn)緩存位置:/tmp/mountpoint/s_dm
Q2:Windows進(jìn)行掛載方式備份,報(bào)錯(cuò)掛載mds失?。簾o(wú)法創(chuàng)建掛載點(diǎn)設(shè)備
A1:
將360殺毒工具卸載后,重新進(jìn)行掛載方式備份,即可備份成功。
5、Kingbase數(shù)據(jù)庫(kù)物理方式備份恢復(fù)(KingbasePhysical組件)
Q1:什么情況下會(huì)出現(xiàn)“增量備份轉(zhuǎn)為完全備份”
A1:
最多支持連續(xù)7次增量備份,超過(guò)7次,則會(huì)轉(zhuǎn)為完全備份。
Q2:異機(jī)恢復(fù)失敗,報(bào)“數(shù)據(jù)庫(kù)alldatabase恢復(fù):FAILED”
A1:
問(wèn)題原因:目標(biāo)機(jī)器的歸檔路徑與源虛擬機(jī)不同,恢復(fù)的過(guò)程中會(huì)將源虛擬機(jī)的配置文件覆蓋給目標(biāo)虛擬機(jī),導(dǎo)致配置文件發(fā)生改變從而無(wú)法啟動(dòng)實(shí)例。
解決方案:將兩臺(tái)機(jī)器設(shè)置相同的歸檔路徑。
6、Oracle數(shù)據(jù)庫(kù)物理方式備份恢復(fù)(OraclePhysical組件)
A1:
l 數(shù)據(jù)庫(kù)控制文件損壞或丟失時(shí)。
l 數(shù)據(jù)庫(kù)的邏輯結(jié)構(gòu)發(fā)生改變時(shí)。
l 恢復(fù)數(shù)據(jù)庫(kù)到備份了7天以前的時(shí)間點(diǎn)時(shí)。
l 異機(jī)恢復(fù)。
Q2:RAC1恢復(fù)到RAC2,報(bào)錯(cuò)(RAC2的節(jié)點(diǎn)正在使用,恢復(fù)失敗)
A1:
例如RAC1和RAC2,如果要恢復(fù)RAC1,則必須要關(guān)閉RAC2節(jié)點(diǎn)。
A1:
1. 在“保護(hù)對(duì)象列表”中,右擊需要備份的代理主機(jī),在出現(xiàn)的菜單中選擇“屬性。
2. 在彈出的對(duì)話框中,單擊“環(huán)境變量”,添加ENABLE_HIGH_PERF變量,其變量值改為TRUE,可使Oracle多通道備份恢復(fù)數(shù)據(jù)分配均勻,提高備份恢復(fù)性能。
7、ZStack備份恢復(fù)(Zstack組件)
A1:
問(wèn)題原因:
恢復(fù)機(jī)與源機(jī)的BIOS模式不一致。需要手動(dòng)調(diào)整恢復(fù)機(jī)與源機(jī)的BIOS模式一致,才能啟動(dòng)成功。
解決方案:
登錄到ZStack平臺(tái)的Web頁(yè)面,手動(dòng)修改恢復(fù)機(jī)的BIOS模式。
源機(jī)BIOS模式如下圖所示為UEFI,恢復(fù)機(jī)BIOS模式如下圖所示為Legacy。手動(dòng)將恢復(fù)機(jī)的BIOS模式更改為UEFI即可。
圖 1 源機(jī)BIOS模式
圖 2 恢復(fù)機(jī)BIOS模式
8、華為云備份恢復(fù)(HCS組件)
Q1:華為云備份失敗未發(fā)現(xiàn)dsware_insight命令
A1:
需要將代理節(jié)點(diǎn)加入到FusionStorage集群中,具體操作步驟參見(jiàn)《黑方容災(zāi)備份與恢復(fù)系統(tǒng)(V6)華為云定時(shí)備份恢復(fù) 操作指導(dǎo) V9.2.0》。
Q2:恢復(fù)報(bào)錯(cuò)mds連接失敗,日志打印mds報(bào)錯(cuò)碼:-3001
A1:
修改osvi_client.conf中的超時(shí)時(shí)間。
9、OpenStack虛擬化平臺(tái)副本備份恢復(fù)(OpenStackEcs組件)
Q1:跨平臺(tái)恢復(fù)虛機(jī)后啟動(dòng)異常,問(wèn)題截圖如下
A1:
方案一:在原機(jī)上添加完驅(qū)動(dòng)后,重新備份恢復(fù)。
方案二:將恢復(fù)機(jī)引導(dǎo)進(jìn)入救援模式后,添加驅(qū)動(dòng)。操作步驟如下。
1. 在恢復(fù)平臺(tái)上找一臺(tái)相似系統(tǒng)的正常環(huán)境,查詢所需驅(qū)動(dòng)類型,主要看磁盤(pán)和網(wǎng)絡(luò),命令:lspci -k。
2. 通過(guò)命令:lsinitrd /boot/內(nèi)核名 | grep 驅(qū)動(dòng)名,查詢內(nèi)核的驅(qū)動(dòng)加載情況,對(duì)比正常內(nèi)核和救援內(nèi)核的驅(qū)動(dòng)差異。此處由于是正??梢詥?dòng)的環(huán)境,所以兩種內(nèi)核都加載了驅(qū)動(dòng)mptspi,問(wèn)題環(huán)境的正常內(nèi)核是沒(méi)有加載mptspi驅(qū)動(dòng)的。
3. 通過(guò)命令:dracut --force --add-drivers "驅(qū)動(dòng)名稱" --kver=版本號(hào),將驅(qū)動(dòng)加入到內(nèi)核中。
如果是多個(gè)驅(qū)動(dòng),中間以空格隔開(kāi)。
例:dracut --force --add-drivers "mptsas virtio" --kver=3.10.0-957.el7.x86_64
如果覺(jué)得上述步驟過(guò)于繁瑣,可采用以下方法:
1. 無(wú)論是原機(jī)環(huán)境還是恢復(fù)機(jī)的救援模式,直接比較正常內(nèi)核和救援內(nèi)核的差異,比較關(guān)鍵詞:virtio、virtio_scsi、virtio_net、mptspi、mptsas等。
命令:lsinitrd /boot/內(nèi)核 | grep 關(guān)鍵詞
2. 比較出驅(qū)動(dòng)差異后,一般都是救援內(nèi)核有,而正常內(nèi)核沒(méi)有,通過(guò)命令將缺少的驅(qū)動(dòng)加載進(jìn)內(nèi)核。驅(qū)動(dòng)名稱就是上述的關(guān)鍵詞,版本號(hào)從內(nèi)核名稱上截取。
命令:dracut --force --add-drivers "驅(qū)動(dòng)名稱" --kver=版本號(hào)
3. 重啟機(jī)器。
二、持續(xù)數(shù)據(jù)保護(hù)與應(yīng)用容災(zāi)相關(guān)問(wèn)題
A1:
問(wèn)題原因:
回遷完成后,網(wǎng)卡為“不可用的狀態(tài)”和代理配置文件匹配不上,所以代理在注冊(cè)的時(shí)候使用的是新的MAC,會(huì)觸發(fā)資產(chǎn)變更功能。
解決方案:
回遷完成后,手動(dòng)修改網(wǎng)卡配置信息并重啟網(wǎng)卡,再重啟代理服務(wù)。在此期間不可以單擊頁(yè)面上的資產(chǎn)變更,保證機(jī)器上MAC地址、IP與配置文件中的MAC、IP一致。
Q2:異機(jī)恢復(fù)后,恢復(fù)機(jī)不上線,如何處理
A1:
問(wèn)題原因:
異機(jī)恢復(fù)后的恢復(fù)機(jī)沒(méi)有IP,恢復(fù)機(jī)代理ID與原生產(chǎn)機(jī)代理ID一致。
解決方案:
配置恢復(fù)機(jī)IP,修改恢復(fù)機(jī)代理ID,重啟代理服務(wù)。
操作方法:
1. 配置恢復(fù)機(jī)IP
2. 修改恢復(fù)機(jī)代理ID:
1) 進(jìn)入恢復(fù)機(jī):在/opt/agent/ubackup/uagent/conf/目錄下修改config.xml和node.properties文件。
2) 修改config.xml文件下的ID(設(shè)置成與原生產(chǎn)機(jī)ID不一致),修改IP為已經(jīng)配置好的恢復(fù)機(jī)IP。
3) 修改node.properties文件中的localId,需與config.xml文件中的ID值一致。
4) 進(jìn)入/opt/agent/ubackup/uagent/lib/cdp/all/conf目錄,修改MAC地址,與恢復(fù)機(jī)的MAC地址一致。
5) 進(jìn)入/opt/agent/ubackup/uagent/bin目錄,重啟代理服務(wù)。
三、存儲(chǔ)空間相關(guān)問(wèn)題
Q1:介質(zhì)服務(wù)器后臺(tái)命令遷移索引庫(kù)方法
A1:
6.9版本介質(zhì)服務(wù)器不提供管理界面,如果需要對(duì)介質(zhì)服務(wù)器遷移索引庫(kù),需要通過(guò)后臺(tái)命令進(jìn)行遷移。
遷移方法:介質(zhì)服務(wù)器提前準(zhǔn)備索引庫(kù)遷移的卷,如/dev/_BKSoftVG_b/aa,進(jìn)入bin目錄執(zhí)行索引庫(kù)遷移腳本。
cd /opt/bksoft/ubackup/bin
./move_mdsdb.sh /dev/_BKSoftVG_b/aa
腳本執(zhí)行的日志輸出路徑:/opt/bksoft/ubackup/logs/mds/move_mdsdb.log,遷移完成后卷掛載情況如下圖所示。
Q2:源端重刪庫(kù)清理過(guò)程中顯示剩余空間充足,創(chuàng)建重刪備份任務(wù)卻提示重刪庫(kù)剩余空間不足
A1:
重刪清理結(jié)束后重刪庫(kù)清理的空間才會(huì)回收,等待頁(yè)面重刪庫(kù)狀態(tài)由“清理中”變?yōu)橐褑⒂煤螅賵?zhí)行重刪備份任務(wù)即可。
四、集群相關(guān)問(wèn)題
Q1:分布式集群恢復(fù)時(shí)選擇不同的介質(zhì)服務(wù)器,報(bào)獲取待恢復(fù)備份集大小失敗
A1:
分布式存儲(chǔ)在添加完共享目錄后,需將共享目錄的掛載添加到rc.local增加啟動(dòng)項(xiàng),確保節(jié)點(diǎn)在重啟后能自動(dòng)掛載。
A1:
分布式災(zāi)備集群僅支持將自備份數(shù)據(jù)存儲(chǔ)在分布式存儲(chǔ)介質(zhì)中。
Q3:集群重啟主節(jié)點(diǎn)黑方災(zāi)備系統(tǒng)服務(wù)后集群發(fā)生切換
A1:
集群重啟服務(wù),如果重啟的是主機(jī)節(jié)點(diǎn),登錄集群下主機(jī)物理服務(wù)器后,輸入/unary/unabackup/bin/unabackup.sh safeclose后,再使用service unabackup restart重啟黑方災(zāi)備系統(tǒng)服務(wù)。
如果是備機(jī),則可以直接重啟黑方災(zāi)備系統(tǒng)服務(wù)。
Q4:集群VIP無(wú)法通過(guò)終端訪問(wèn)
A1:
直接通過(guò)服務(wù)器真實(shí)IP進(jìn)行后臺(tái)訪問(wèn)。
五、服務(wù)器配置相關(guān)問(wèn)題
Q1:黑方災(zāi)備系統(tǒng)服務(wù)器目前使用端口及需要開(kāi)放端口號(hào)
A1:
| 防火墻位置
|
端口用途
|
端口號(hào)(TCP)
|
開(kāi)放要求
|
| 機(jī)房?jī)?nèi),災(zāi)備代理端與壹進(jìn)制設(shè)備之間的防火墻
|
控制流
|
5672
|
必須開(kāi)放
|
| 對(duì)象數(shù)據(jù)存儲(chǔ)端口
|
10000
|
必須開(kāi)放
|
|
| 塊設(shè)備數(shù)據(jù)存儲(chǔ)端口
|
3260
|
定時(shí)數(shù)據(jù)保護(hù)中使用塊設(shè)備方式備份,副本數(shù)據(jù)備份,實(shí)時(shí)數(shù)據(jù)備份(iSCSI方式)功能時(shí)必須開(kāi)放
|
|
| 重刪服務(wù)與重刪庫(kù)
|
10002(含)至10013(含)
|
使用此功能時(shí)必須開(kāi)放
|
|
| Web https訪問(wèn)
容災(zāi)機(jī)遠(yuǎn)程桌面訪問(wèn)(ESXi容災(zāi)平臺(tái))
|
443
|
必須開(kāi)放
|
|
| 兩地機(jī)房壹進(jìn)制設(shè)備之間的防火墻
|
異地?cái)?shù)據(jù)復(fù)制
|
20100
|
使用此功能時(shí)必須開(kāi)放
|
| 對(duì)像數(shù)據(jù)存儲(chǔ)端口
|
10000
|
使用異地復(fù)制時(shí)必須開(kāi)放
|
|
| 重刪服務(wù)與重刪庫(kù)
|
10002(含)至10013(含)
|
使用此功能時(shí)必須開(kāi)放
|
|
| 機(jī)房?jī)?nèi),災(zāi)備管理員計(jì)算機(jī)與壹進(jìn)制設(shè)備之間的防火墻
|
Web https訪問(wèn)
容災(zāi)機(jī)遠(yuǎn)程桌面訪問(wèn)(ESXi容災(zāi)平臺(tái))
|
443
|
必須開(kāi)放
|
| 容災(zāi)機(jī)遠(yuǎn)程桌面訪問(wèn)
(內(nèi)置容災(zāi)平臺(tái)(kvm))
|
8822
|
使用此功能時(shí)必須開(kāi)放
|
|
| SSH連接
|
22
|
提供堡壘機(jī)連接途徑也可
|
|
| 軟件升級(jí)端口
|
9000
|
也可直連進(jìn)行升級(jí)
|
Q2:黑方災(zāi)備系統(tǒng)服務(wù)器對(duì)象數(shù)據(jù)存儲(chǔ)端口修改方法
A1:
將黑方災(zāi)備系統(tǒng)服務(wù)器對(duì)象數(shù)據(jù)存儲(chǔ)默認(rèn)端口10000修改為10050的步驟如下:
1. 修改端口號(hào)。
進(jìn)入黑方災(zāi)備系統(tǒng)的MDS服務(wù)端配置路徑:/opt/bksoft/ubackup/conf
編輯mds.conf文件,將port后面的10000改為10050。
保存退出。
重啟MDS服務(wù):進(jìn)入/unary/unabackup/bin,執(zhí)行命令./stop_mds.sh、./start_mds.sh。
2. 添加防火墻規(guī)則。
vi /etc/sysconfig/iptables
加入如下兩條語(yǔ)句:
A INPUT -p tcp -m tcp --dport 10050 -j ACCEPT
A INPUT -p udp -m udp --dport 10050 -j ACCEPT
重啟iptables:systemctl restart iptables.service
3. 遠(yuǎn)程復(fù)制時(shí),源端和目標(biāo)端服務(wù)器均按照上述流程修改,代理端不需要進(jìn)行任何修改。
Q3:主控服務(wù)器和介質(zhì)服務(wù)器界面修改IP的順序,代理(定時(shí)和實(shí)時(shí))如何相應(yīng)修改,保證代理上線
A1:
建議修改順序:介質(zhì)服務(wù)器 > 主控服務(wù)器
1. 修改介質(zhì)服務(wù)器IP,點(diǎn)擊確定后,等待服務(wù)重啟,可以訪問(wèn)介質(zhì)服務(wù)器后,再進(jìn)行下一步。
2. 修改主控服務(wù)器IP,點(diǎn)擊確定后,等待服務(wù)重啟,可以訪問(wèn)主控服務(wù)器后,再進(jìn)行下一步。
3. IP修改后進(jìn)入代理裝目錄bin目錄下,執(zhí)行modify_config.bat(Windows代理執(zhí)行modify_config.bat;Linux代理執(zhí)行modify_config.sh),輸入新的黑方災(zāi)備系統(tǒng)服務(wù)器IP即可(其他參數(shù)如未修改則可用默認(rèn)值)。
Q4:介質(zhì)服務(wù)器恢復(fù)出廠設(shè)置后介質(zhì)不顯示
A1:
介質(zhì)服務(wù)器在進(jìn)行恢復(fù)出廠設(shè)置操作后,介質(zhì)服務(wù)器需要重新綁定主控服務(wù)器IP。
Q5:黑方災(zāi)備系統(tǒng)后臺(tái)查詢組件版本號(hào)方法
A1:
方法如下。
1. 后臺(tái)進(jìn)入/unary/unabackup/bin/目錄,cd /unary/unabackup/bin/。
2. 執(zhí)行./unabackup.sh version +組件名稱(區(qū)分大小寫(xiě))如:
./unabackup.sh version MTS
./unabackup.sh version Core
查詢的結(jié)果同黑方災(zāi)備系統(tǒng)頁(yè)面一致。
Q6:黑方災(zāi)備系統(tǒng)服務(wù)器運(yùn)行情況分析日志
A1:
黑方災(zāi)備系統(tǒng)服務(wù)器默認(rèn)在每天的0點(diǎn)0分自動(dòng)執(zhí)行MonitorLog.sh腳本,生成運(yùn)行狀態(tài)監(jiān)控日志,日志保存的目錄為/var/log/nmonlog/,獲取的日志文件包括:iostat、network、syslog、top日志文件。其中top日志文件由于每天產(chǎn)生的日志量較大,除當(dāng)天日志外其他時(shí)間的日志會(huì)壓縮為tar.gz格式,所有日志默認(rèn)保留時(shí)間為60天。
Q7:黑方災(zāi)備系統(tǒng)配置時(shí)間同步服務(wù)器后,修改黑方災(zāi)備系統(tǒng)時(shí)間后不再次同步
A1:
黑方災(zāi)備系統(tǒng)配置時(shí)間同步服務(wù)器,會(huì)使用ntpdata同步時(shí)間,并重啟服務(wù),服務(wù)啟動(dòng)后會(huì)使用ntpd去同步時(shí)間,間隔為64秒一次,為了防止網(wǎng)絡(luò)風(fēng)暴,進(jìn)程啟動(dòng)后會(huì)在定義好的間隔64秒之上再加一個(gè)隨機(jī)延遲值,這個(gè)隨機(jī)值的范圍是0~16秒,因此進(jìn)程啟動(dòng)后需要數(shù)分鐘才會(huì)開(kāi)始同步時(shí)間。
使用ntpd進(jìn)行時(shí)間同步過(guò)程中,ntpd發(fā)現(xiàn)操作系統(tǒng)本地時(shí)間與時(shí)間服務(wù)器時(shí)間差別超過(guò)1000秒,nptd認(rèn)為此時(shí)發(fā)生了嚴(yán)重問(wèn)題,ntpd服務(wù)即會(huì)退出,唯一可靠的處理方法是人為介入。
修復(fù)方法:
1. 停止ntpd服務(wù):service ntpd stop
2. 手動(dòng)同步時(shí)間:ntpdata ntpIP(時(shí)間同步服務(wù)器IP)
3. 啟動(dòng)ntpd服務(wù):service ntpd start
Q8:時(shí)間同步服務(wù)器填錯(cuò)或需要修改
A1:
由于6.8版本加入時(shí)間同步服務(wù)器,當(dāng)填錯(cuò)或想修改時(shí)間同步服務(wù)器時(shí),需要清理掉原來(lái)的時(shí)間同步服務(wù)器配置。
手動(dòng)處理方法:
1. 進(jìn)入黑方災(zāi)備系統(tǒng)bin目錄下:cd /unary/unabackup/bin/。
2. 執(zhí)行清理命令:./ntpset.sh -d。
3. 刷新頁(yè)面。
Q9:介質(zhì)服務(wù)器如何升級(jí)補(bǔ)丁包
A1:
1. 若介質(zhì)服務(wù)器已綁定主控節(jié)點(diǎn),且主控節(jié)點(diǎn)和介質(zhì)節(jié)點(diǎn)均正常運(yùn)行,可以登錄黑方災(zāi)備系統(tǒng)頁(yè)面上,進(jìn)入“存儲(chǔ)介質(zhì)管理 > 介質(zhì)節(jié)點(diǎn)管理 > 控制臺(tái)-安全設(shè)置”頁(yè)面,選擇需要開(kāi)啟升級(jí)服務(wù)的節(jié)點(diǎn)服務(wù)器,將“升級(jí)服務(wù)”的開(kāi)關(guān)狀態(tài)置為開(kāi)即可。
2. 若介質(zhì)服務(wù)器未綁定主控節(jié)點(diǎn),或已綁定主控節(jié)點(diǎn)但主控節(jié)點(diǎn)已關(guān)機(jī),可進(jìn)入介質(zhì)服務(wù)器后臺(tái),輸入命令打開(kāi)升級(jí)服務(wù)systemctl start bcupdated。