
안녕하세요, Microsoft Build에 오신 걸 환영합니다. 오늘은 애플리케이션의 복원력, 즉 resiliency를 어떻게 처음부터 끝까지 지켜낼 수 있는지 함께 이야기해 보겠습니다.

Agentic AI로 완성하는 복원력
이번 세션 주제는 빌드에서 복구까지, Agentic AI로 만드는 현대적 복원력입니다. Aakanksha, Abhimanyu, Adity, Shobhit이 함께 준비했고, 개발부터 장애 복구까지 전 과정을 다뤄보겠습니다.

먼저 복원력이 왜 중요한지, 그 기본 개념부터 정리하고 시작하겠습니다.

복원력의 세 가지 축
복원력은 크게 세 축으로 봅니다. 예기치 못한 장애와 계획된 이벤트를 견디는 Infra resiliency, 데이터 무결성과 가용성·복구·규정 준수를 지키는 Data resiliency, 그리고 사이버 위협에 대비하고 방어·복구하는 Cyber resiliency입니다. 오늘 이 세 가지를 관통하는 이야기를 드리겠습니다.

복원력 라이프사이클
복원력은 한 번 설정하고 끝나는 게 아니라 라이프사이클로 봐야 합니다. 처음부터 복원력 있게 배포하는 Start resilient, 기존 앱의 복원력을 확보하는 Get resilient, 그리고 정기 드릴로 계속 검증하는 Stay resilient까지, Azure Copilot·Resiliency Agent·Azure Advisor·Azure Backup·Chaos Studio가 각 단계를 받쳐줍니다.

이제 이 복원력을 대규모 환경에서 실제로 어떻게 경험하게 되는지 살펴보겠습니다.

애플리케이션 중심 경험
핵심은 애플리케이션 중심의 접근입니다. Service Group으로 워크로드를 표준화해 정의하고, Advisor 추천으로 복원력 목표를 세우고, Chaos Studio 기반 드릴로 검증하고, Service Health로 관측하고, 복구 계획까지 한 흐름으로 관리합니다. 그리고 이 모든 걸 아우르는 Azure Infrastructure Resiliency Manager가 지금 Public Preview로 공개됐습니다.

그럼 첫 단계, 처음부터 복원력 있게 시작하는 방법부터 보겠습니다.

Resiliency Agent로 배포하기
여기 핵심 도구가 Resiliency Agent입니다. Azure Copilot 기반의 전문 도메인 에이전트로, 앱의 복원력을 관리해 주고 end-to-end IaC 템플릿을 생성해 줍니다. 덕분에 Day 1부터 zonal하게 복원력 있는 애플리케이션을 배포할 수 있습니다.

데모: IaC 템플릿 생성
말로만 설명하면 감이 안 오시죠. Resiliency Agent가 IaC 템플릿을 실제로 생성하는 모습을 직접 보여드리겠습니다.

데모 영상
보시는 것처럼 프롬프트 한 번으로 복원력을 갖춘 템플릿이 만들어집니다. 배포 전에 이미 green 상태로 출발하는 거죠.

VS Code에서 바로 Advisor
이 경험은 포털에만 있지 않습니다. GitHub Copilot이나 Cursor에서 프롬프트 한 번이면 Azure MCP server를 통해 ARM·Terraform 템플릿을 Azure Advisor 카탈로그와 대조합니다. 복원력 갭과 은퇴 예정 SKU를 한 번에 잡아주고, 제안 변경을 에디터 안에서 검토·수정·커밋까지 끝낼 수 있습니다.

데모: 기존 템플릿 점검·수정
그럼 Azure MCP server의 Azure Advisor로 기존 IaC 템플릿을 평가하고 고치는 과정을 데모로 보겠습니다.

데모: Zava Commerce
여기 Zava Commerce의 ARM 템플릿을 VS Code에서 열어두었는데요, 개발 워크플로를 벗어나지 않고 복원력 이슈를 바로 잡아내는 걸 확인하실 수 있습니다.

이제 두 번째 단계로 넘어가서, 이미 운영 중인 기존 애플리케이션의 복원력을 확보하는 방법을 살펴보겠습니다.

Zonal 복원력 강화
새로운 zonal resiliency 기능을 쓰면 Service Group을 만들어 리소스와 앱 전반의 복원력 상태를 자세히 파악할 수 있습니다. Zonal Goal을 설정해 목표 대비 리소스를 평가·개선하고, 복원력이 부족한 자원을 찾아 추천을 받고, Resiliency Agent가 zone redundancy를 적용하는 스크립트까지 자동 생성해 가이드해 줍니다.

데모: Resiliency Agent
그럼 Get Resilient 단계에서 Resiliency Agent가 어떻게 동작하는지 데모로 보여드리겠습니다.

데모: 복원력 대시보드
이 Resiliency Overview 대시보드에서 앱 전반의 복원력 상태가 한눈에 들어오는 걸 보실 수 있습니다.

Data·Cyber 복원력
복원력은 인프라만의 이야기가 아닙니다. Azure MCP Server로 리소스의 data·cyber 복원력 상태를 점검하고, Azure Backup을 연동해 vaulted backup을 구성할 수 있습니다. 안전한 오프사이트 저장과 장기 보존으로 랜섬웨어 복구와 규정 준수까지 대비하는 거죠.

데모: Azure MCP Server
Azure MCP Server로 data·cyber 복원력을 확보하는 과정을 직접 보여드리겠습니다.

데모: MCP 확장
여기 Azure MCP server extension을 통해 백업 구성과 복원력 점검이 개발 환경 안에서 매끄럽게 이어지는 걸 확인하실 수 있습니다.

Advisor AI로 우선순위 정하기
추천이 수백 개 쌓이면 뭘 먼저 해야 할지 막막하죠. Advisor AI powered는 워크로드의 중요도와 blast radius를 분석해 추천의 우선순위를 매기고, 왜 지금 중요한지 설명해 줍니다. 진행 상황을 추적하고, 단기·중기·장기 액션 플랜으로 내보내 팀과 함께 대응할 수 있습니다.

데모: Advisor AI (Preview)
그럼 Azure Advisor AI powered Preview로 복원력 갭의 우선순위를 대규모로 정리하는 모습을 데모로 보겠습니다.

데모: Advisor 대시보드
이 Advisor Overview 대시보드에서 무엇이 끝났고 무엇이 아직 노출돼 있는지 한눈에 파악할 수 있습니다.

복원력, 증명하세요
복원력은 바라기만 해선 안 되고 증명해야 합니다. Azure Chaos Studio Workspaces가 Public Preview로 나왔는데요, AKS·SQL·Cosmos·Storage 전반에 AZ 장애를 재현하고, AI·RAG 워크로드에 실제 장애를 주입하고, 과거 실제 장애 시나리오까지 재생할 수 있습니다. 6월 11일 Azure Portal에서 만나보세요.

Q&A
여기까지 준비한 내용이었습니다. 궁금한 점 있으시면 편하게 질문해 주세요.

리소스와 설문
마지막으로 aka.ms/build/evals에서 세션 설문에 참여해 주시고, 세션 상세 페이지에서 튜토리얼과 코드, 리소스로 바로 이어가 보세요. 감사합니다.