hoatranlab.io.vn Zalo: 0917516878 Hotline: 0917516878 [email protected]
HoaTranLab Logo HoaTranLab
Phase 2 / 7 Yêu cầu Phase 01 hoàn thành Cập nhật: 2026-05-03

1. Tổng Quan & Kiến Trúc

Phụ thuộc
Phase 01 hoàn thành 100%
Tất cả 15 checklist items
Thời gian ước tính
2–3 ngày
Bao gồm testing HA
Output chính
HA Cluster Active
Cluster IP + MFA + SAML SSO

Mục tiêu Phase 02:

Kiến Trúc HA:

  Site Chính (Production)              Site DR (Disaster Recovery)
  ┌─────────────────────────┐          ┌─────────────────────────┐
  │  VSA Node 1             │          │  VSA Node 2             │
  │  veeam-node1.domain.local│         │  veeam-node2.domain.local│
  │  (ACTIVE — primary)     │◄──WAL──►│  (STANDBY — hot standby)│
  │  PostgreSQL (primary)   │  sync    │  PostgreSQL (replica)   │
  │  Rocky Linux 9 JeOS     │          │  Rocky Linux 9 JeOS     │
  └──────────┬──────────────┘          └─────────────────────────┘
             │
        Cluster IP
   veeam-cluster.domain.local
   (luôn trỏ vào node Active)
             │
    ┌────────┴────────┐
    │  Admin Console  │        Tất cả clients kết nối qua
    │  Web UI :9443   │        Cluster IP — không bao giờ
    │  API    :9392   │        kết nối trực tiếp vào node
    └─────────────────┘

  Failover flow:
  Node 1 down → Cluster IP cập nhật → trỏ sang Node 2 → ~6-10 min (unplanned)
                                                        → ~10-15 min (planned)
        

2. Breaking Changes v13 Quan Trọng

Thay đổi Breaking
  • JeOS platform: Rocky Linux 9 (thay Photon OS) — DISA STIG compliant out-of-box, không cần hardening thêm
  • HA topology: Active/Passive; cả 2 nodes PHẢI cùng L2 subnet (không hỗ trợ routed giữa 2 nodes)
  • NTLM đã bị xóa hoàn toàn — chỉ Kerberos + Certificate auth
  • MFA bắt buộc trên tất cả admin accounts — không thể disable
Failover Times
Unplanned Failover (node crash)
~6–10 phút
Health check timeout + WAL replay + IP takeover
Planned Switchover (manual)
~10–15 phút
Graceful drain + sync + handover + verify
Security Officer Approval — Bắt buộc trước khi Enable HA

Veeam v13 yêu cầu Security Officer phê duyệt việc kích hoạt HA cluster. Đây là biện pháp bảo vệ chống lại attacker cố tình tắt HA để cô lập backup data. Security Officer phải đăng nhập riêng và approve trong UI.

Bước 1 Deploy VSA Node 1 (Site Chính)

1 Download OVA từ Veeam 15 phút

Download Veeam Backup & Replication v13.0.1.1071 hoặc mới hơn. Build number quan trọng — phiên bản cũ hơn có thể thiếu DISA STIG patches.

# Verify checksum sau khi download (SHA256)
# Veeam cung cấp file .sha256 cùng với OVA
sha256sum VeeamBackup&Replication_13.0.1.1071.ova
# So sánh với giá trị trên veeam.com/downloads
Lỗi hay gặp: Download incomplete do timeout. Luôn verify SHA256 trước khi deploy OVA.
2 Deploy OVA trong vSphere 20 phút
TrườngGiá trị cho Node 1Lý do
VM NameVEEAM-NODE1Phải khớp với hostname FQDN
FirmwareUEFI (bắt buộc)JeOS Rocky Linux 9 không boot BIOS
Secure BootEnabled (khuyến nghị)DISA STIG requirement
Network AdapterVMXNET3Hiệu năng tốt nhất trong vSphere
IP Address192.168.10.11/24 (static)DHCP không cho phép — Kerberos SPN cần IP cố định
Hostnameveeam-node1.domain.localFQDN đầy đủ — không dùng shortname
DatastoreSSD datastore riêngI/O intensive — không share với production VMs
3 Initial Configuration Wizard 30 phút
Truy cập lần đầu:
https://veeam-node1.domain.local:9443

Default credentials: admin / veeam — BẮT BUỘC đổi ngay sau lần đăng nhập đầu tiên

a
Accept EULA — đọc và accept license agreement
b
Set Admin Password — tối thiểu 16 ký tự, uppercase + number + symbol. Lưu vào password vault ngay.
c
Configure Network — xác nhận static IP, gateway, DNS (nên cấu hình trước qua OVA properties)
d
Join AD Domain — nhập domain.local, credentials của account có quyền join domain
e
Configure gMSA — nhập DOMAIN\svc-veeam-backup$ (dấu $ ở cuối là bắt buộc cho gMSA)
4 Tạo Security Officer Account (BẮT BUỘC tách biệt) 10 phút
Tại sao Security Officer phải là người khác?

Security Officer là cơ chế four-eyes: người ra lệnh (admin) và người phê duyệt (security officer) phải khác nhau. Nếu cùng một người, toàn bộ cơ chế kiểm soát bị vô hiệu hóa.

  • • Settings → Security → Security Officers → Add Officer
  • • Chọn user từ AD: VeeamSecurityOfficer group
  • • Email notification: bắt buộc (nhận approval requests)
  • • MFA: bật ngay, KHÔNG thể tắt sau này
5 Cài đặt License 5 phút

Settings → License → Install License → upload file .lic nhận từ Veeam.

Expected output: License tier hiển thị "Enterprise Plus" hoặc "VUL", số workloads khớp với hợp đồng, expiry date đúng.
Expected Output — Bước 1 hoàn thành:
  • • Web UI accessible: https://veeam-node1.domain.local:9443 — hiển thị dashboard
  • • Node status: "Standalone" (chưa join cluster — bình thường)
  • • gMSA service account: hiển thị trong Settings → Service Account
  • • License: Enterprise Plus hoặc VUL confirmed

Bước 2 Deploy VSA Node 2 (Site DR)

Lặp lại toàn bộ Bước 1 với các thông số DR-specific sau đây. Node 2 sẽ ở trạng thái "Standalone" cho đến khi join cluster ở Bước 7.

TrườngNode 1 (Site Chính)Node 2 (Site DR)
VM NameVEEAM-NODE1VEEAM-NODE2
IP Address192.168.10.11/24192.168.10.12/24
FQDNveeam-node1.domain.localveeam-node2.domain.local
vSphere ClusterCluster-ProductionCluster-DR (khác AZ/rack)
Security OfficerTạo tại đâyKHÔNG tạo lại — dùng chung
LicenseCài tại đâyCài cùng .lic file
Quan trọng: Node 2 phải cùng L2 subnet với Node 1 (192.168.10.0/24). Nếu site DR ở khác subnet, cần L2 extension (VXLAN/OTV) — không hỗ trợ pure L3 routing giữa HA nodes.

Bước 3 Console Configuration & Kết Nối vCenter

Thêm vCenter Server

Infrastructure → Virtual Infrastructure → Add Server → VMware vSphere

TrườngGiá trịLý do
DNS Name / IPvcenter.domain.localFQDN, KHÔNG dùng IP — SSL cert validation cần hostname
CredentialsDedicated service accountKhông dùng [email protected]
Port443Mặc định HTTPS API
SSL CertificateVerify và TrustKhông dùng "Skip certificate check" trong production
Lỗi hay gặp: Nhập IP thay vì FQDN → SSL certificate validation fail → connection refused. vCenter SSL cert được issue cho hostname, không phải IP.

Bước 4 Cấu Hình RBAC

Account / AD Group Veeam Role Scope Quyền chính
VeeamAdminsVeeam Backup AdministratorAllFull control trừ Security Officer actions
VeeamBackupOpsVeeam Backup OperatorAssigned jobsCreate/edit/run backup jobs; no delete
VeeamRestoreOpsVeeam Restore OperatorAssigned VMsRestore only; cannot create backup jobs
VeeamSecurityOfficerVeeam Security OfficerGlobal (approval)Approve/reject critical operations only
Four-Eyes Approval — Bắt buộc cho:
Xóa Backup Job
Admin request → Security Officer receive email → Approve trong UI
Disable Immutability
Không thể bypass — ngay cả root không thể tắt nếu chưa được approve
Remove Repository Extent
Xóa SOBR extent cần approval để tránh accidental data loss
# Cấu hình RBAC qua Veeam PowerShell module (sau khi VSA deploy)
# Chạy trên Windows machine có Veeam Console cài đặt

# Kết nối VSA qua Cluster IP
Connect-VBRServer -Server veeam-cluster.domain.local -Port 9392 `
    -Credential (Get-Credential)  # Dùng gMSA admin account

# Tạo scope cho backup jobs (optional — restrict Operators)
$vcenter = Get-VBRServer -Name "vcenter.domain.local"
$scope = New-VBRBackupOperatorScope -Entity (Get-VBRViEntity -Server $vcenter)

# Thêm AD groups vào Veeam roles
Add-VBRBackupAdministrator -Account "DOMAIN\VeeamAdmins"
Add-VBRBackupOperator     -Account "DOMAIN\VeeamBackupOps" -Scope $scope
Add-VBRRestoreOperator    -Account "DOMAIN\VeeamRestoreOps" -Scope $scope

# Verify
Get-VBRUserRole | Select-Object Name, Account, Role | Format-Table

Bước 5 Cấu Hình MFA (Multi-Factor Authentication)

MFA không thể tắt sau khi bật

Đặc biệt với Security Officer account: MFA permanent, không exception. Đảm bảo mỗi admin có smartphone và đã cài authenticator app trước buổi setup này.

1
Truy cập: Settings → Security → Multi-Factor Authentication → Enable
2
Chọn enforcement scope: "All Users" — không chọn "Administrators only"
3
Mỗi admin đăng nhập, quét QR code với Google Authenticator, Microsoft Authenticator, hoặc Authy
4
Backup codes (10 codes): Download và lưu trong password vault (CyberArk/HashiCorp Vault/1Password). KHÔNG lưu trong email hoặc file trên desktop.
Test MFA:

Logout → Login lại → Nhập username/password → Nhập 6-digit TOTP code từ app. Nếu login thành công: MFA configured correctly.

Bước 6 SAML 2.0 SSO — Azure AD / ADFS

Azure AD App Registration:

1.Azure Portal → Azure Active Directory → App Registrations → New Registration
2.Name: Veeam-VBR-SSO | Account type: Single tenant
3.Redirect URI (Web): https://veeam-cluster.domain.local:9443/saml/callback
4.Certificates & Secrets → New client secret → copy value ngay
5.Token Configuration → Add group claim → Security Groups
6.Expose API → Add scope: veeam.backup.admin

Veeam SAML Configuration:

1.Settings → Security → Single Sign-On → Enable SAML 2.0
2.Identity Provider URL: https://login.microsoftonline.com/{tenant-id}/saml2
3.Entity ID: https://veeam-cluster.domain.local:9443
4.Import Federation Metadata XML từ Azure AD
5.Group Mapping: AD Group VeeamAdmins → Role Veeam Backup Administrator
6.Test SSO Login trước khi set as default

Bước 7 Hình Thành Cụm HA (Critical Steps)

Đây là thao tác không thể hoàn tác dễ dàng

Sau khi HA cluster hình thành, việc "unjoin" Node 2 sẽ xóa toàn bộ backup metadata trên node đó. Verify kỹ tất cả pre-requisites trước khi click "Enable HA".

1
Security Officer Approval (bắt buộc)

Settings → High Availability → Enable → Security Officer nhận email notification và phải approve trong UI trong vòng 30 phút.

Request approval timeout: 30 phút. Nếu hết giờ, request bị từ chối tự động và phải request lại.
2
Set Cluster IP

Nhập Cluster IP đã reserve từ Phase 01:

Cluster IP:      192.168.10.10/24   # IP đã reserve, chưa cấp
Cluster FQDN:    veeam-cluster.domain.local
Subnet Mask:     255.255.255.0
Gateway:         192.168.10.1       # Same gateway as Node 1 & 2
3
Add Node 2

Add Secondary Node → nhập FQDN của Node 2: veeam-node2.domain.local

Wizard sẽ SSH vào Node 2 và verify: same gMSA, same license, network reachability. Nếu bất kỳ check nào fail → resolve trước khi proceed.
4
Initial Sync — Chờ 15–30 phút

PostgreSQL WAL initial sync — thời gian phụ thuộc vào số backup jobs đã có. Không làm gì trong lúc sync.

# Monitor sync progress từ Node 1 SSH
sudo -u postgres psql -c "SELECT * FROM pg_stat_replication;"
# Expected: state = 'streaming', sent_lsn ≈ write_lsn ≈ replay_lsn (khi sync xong)
Expected Output — Bước 7 hoàn thành:
  • • Dashboard: cả 2 nodes hiển thị Green / Healthy
  • • Cluster IP: veeam-cluster.domain.local resolve thành Node 1 IP
  • • HA Status: "Protection: Enabled, Replication: Synchronized"
  • • Node 2: trạng thái "Standby"

Bước 8 Kiểm Tra HA (Planned Switchover)

CẢNH BÁO QUAN TRỌNG

KHÔNG test unplanned failover (giả lập Node 1 crash) trong môi trường production mới setup. Luôn dùng Planned Switchover để kiểm soát quá trình. Unplanned failover test chỉ nên thực hiện trong maintenance window với sự chấp thuận đầy đủ.

1
Dừng tất cả backup jobs đang chạy
Jobs → Stop all running jobs. Verify: không job nào ở trạng thái "Running" hoặc "Pending"
~5 phút
2
Khởi động Planned Switchover
Settings → High Availability → Planned Switchover → Confirm. Bắt đầu timer: ~10–15 phút
10–15 phút
3
Reconnect qua Cluster IP
Sau khi switchover, reconnect vào https://veeam-cluster.domain.local:9443 — phải hiển thị Node 2 là primary
~2 phút
4
Kiểm tra sau switchover
# Từ Windows admin machine
nslookup veeam-cluster.domain.local
# Expected: phải trả về IP của Node 2 (192.168.10.12)

# Kiểm tra backup catalog còn nguyên vẹn
# Home → Backups → Disk — tất cả backup points vẫn visible
~5 phút
5
Switch back về Node 1
Lặp lại Planned Switchover để Node 1 là primary. Production nên có Node 1 là active (naming convention).
10–15 phút
HA Test Pass Criteria:
Switchover hoàn thành trong 10–15 phút
Cluster IP DNS cập nhật tự động
Backup catalog không mất dữ liệu
Web UI accessible sau switchover
Switch back về Node 1 thành công
RBAC & MFA còn hoạt động đúng

Bước 9 Auto-Update Policy

Loại UpdateAuto?Lý do
OS Security Patches (Rocky Linux) BẮT BUỘC AUTO Cannot disable — DISA STIG requirement
VBR Security Fixes (critical CVEs) BẮT BUỘC AUTO Patch trong maintenance window tự động
VBR Minor (13.0.x → 13.0.x+1) TÙY CHỌN Khuyến nghị bật; test trong staging trước
VBR Major (v13 → v14) KHÔNG BAO GIỜ AUTO Major upgrade cần change management, test window, rollback plan
Maintenance Window khuyến nghị:

Settings → Maintenance → Schedule: Chủ Nhật 02:00 sáng — thời điểm ít backup jobs nhất, đủ thời gian apply patches + verify trước giờ làm việc.

Configuration Backup

Backup Configuration ≠ Backup của Data

Configuration backup chỉ chứa job definitions, RBAC, settings — KHÔNG chứa actual backup data. Nhưng nếu mất config, sẽ mất toàn bộ job schedule và phải reconfigure từ đầu. Phải backup config ra ngoài VSA.

Cấu hình Config Backup
  • • Settings → Configuration Backup → Enable
  • • Location: NAS offsite (KHÔNG phải SOBR main repo)
  • • Schedule: Daily, 23:00 (sau khi backup jobs chạy xong)
  • • Retention: 7 copies
  • • Encryption: AES-256, passphrase lưu trong password vault
Verify Config Backup
# Verify file tồn tại trên NAS
ls -lh /mnt/nas-offsite/veeam-config/
# Expected: VeeamConfigBackup_.bco

# Test restore (trên lab node)
# Settings → Configuration Backup
# → Restore → chọn file → Verify Only
Lỗi hay gặp: Lưu config backup trong SOBR chính — nếu SOBR gặp sự cố, mất cả config lẫn data. Luôn dùng independent storage cho config backup.

Checklist Hoàn Thành Phase 02

Deploy & Config
Security & HA

Đánh Giá Rủi Ro Phase 02:

Rủi roMức độBiện pháp giảm thiểu
Node 1 & 2 không cùng L2 — HA fail to form CAO Verify VLAN/subnet trước Bước 7; dùng L2 extension nếu cross-site
BIOS firmware thay vì UEFI — JeOS không boot CAO Check VM settings trước khi power on; xem VM Hardware → Boot Options
Security Officer và Admin là cùng người — four-eyes vô hiệu CAO Kiểm tra AD group memberships; Security Officer phải là người khác, không trong VeeamAdmins
Backup codes MFA lost — admin bị lock out TRUNG BÌNH Lưu backup codes trong password vault ngay khi nhận; test recovery procedure
Config backup cùng location với data backup THẤP Verify config backup path trỏ vào NAS offsite, không phải SOBR extents
Phase 01: Prerequisites Index Phase 03: Proxy & Repo