M.S. Thesis Website

RSMA를 적용한 5G MIMO 네트워크에서의 강화학습 기반 자원 최적화 연구

김지명

부산대학교 대학원 정보융합공학과

지도교수 유영환

2026년 8월 석사학위논문

Keywords: 5G MIMO, RSMA, 강화학습, TD-MPC2, 교차 계층 제어

초록

5G MIMO 네트워크에서는 사용자 이동, 셀 간 간섭, 이기종 트래픽이 동시에 발생하기 때문에 네트워크 상태가 시시각각 변한다. RSMA는 이런 환경에서 간섭을 유연하게 다룰 수 있는 유망한 전송 기법이지만, 실제 네트워크 운용에서는 전송 효율만이 아니라 셀 간 부하 분산과 핸드오버 안정성까지 함께 고려해야 한다.

본 연구는 저복잡도 사용자 선택 기반 RSMA와 TD-MPC2 모델 기반 강화학습을 결합해, RSMA 분할 비율과 CIO를 공동으로 최적화하는 교차 계층 제어 프레임워크를 제안한다. 시뮬레이션 결과 제안 기법은 기존 비교 기법 대비 처리량 향상, 부하 불균형 감소, 핸드오버 실패율 완화를 동시에 달성했으며, 학습되지 않은 이질적 트래픽 환경에서도 비교적 안정적인 일반화 성능을 보였다.

연구 배경 및 문제의식

다중 셀 5G MIMO 환경에서는 사용자 수 변화, 셀 간 간섭, 이기종 트래픽, 이동성 때문에 네트워크 상태가 지속적으로 변한다. 따라서 물리 계층의 전송 효율만 높이는 방식으로는 실제 운용에서 요구되는 안정성과 균형을 충분히 확보하기 어렵다.

본 연구는 RSMA의 전송 측 장점과 CIO 기반 부하 분산 제어를 하나의 문제로 결합해, 처리량과 셀 간 균형, 핸드오버 안정성을 함께 개선할 수 있는 학습 기반 접근이 필요한 이유를 논문 전반의 출발점으로 삼는다.

방법 개요

제안 방법은 저복잡도 사용자 선택 기반 RSMA 구조를 사용해 공통 스트림 복호 부담과 계산 복잡도를 줄이면서, RSMA 분할 비율과 CIO를 공동 제어하는 교차 계층 최적화 문제를 구성한다.

이를 위해 네트워크 제어 문제를 MDP로 정식화하고, 잠재 공간 예측과 계획 기반 추론이 가능한 TD-MPC2를 적용해 시변 네트워크 환경에서도 빠르게 적응하는 정책을 학습하도록 설계했다.

결과 요약

시뮬레이션 결과 제안 기법은 기존 비교 기법 대비 총 처리량을 개선하면서도 셀 간 부하 불균형과 핸드오버 실패율을 함께 줄였다. 특히 Fixed-action 기준으로 처리량은 23.25% 향상됐고, 부하 불균형은 28.71% 감소했으며, 핸드오버 실패율도 크게 완화됐다.

또한 학습 수렴 속도 측면에서도 비교적 빠르게 안정 구간에 도달했고, 학습에 사용하지 않은 이질 트래픽 환경에서도 성능 저하가 제한적이어서 일반화 가능성을 확인할 수 있었다.

페이지 안내

아래 페이지들은 논문의 주요 흐름에 맞춰 구성되어 있으며, 연구 배경부터 방법, 실험 결과, 참고문헌과 자료까지 자연스럽게 이어서 확인할 수 있도록 정리했다.

연구 동기: 연구 배경, 연구 목적, 연구의 기여점을 요약한다.
연구 내용: 시스템 모델과 TD-MPC2 기반 자원 최적화 프레임워크를 설명한다.
결과 및 성능: 실험 환경, 비교 결과, 효용성 분석, 일반화 성능을 정리한다.
참고문헌 / 자료: 논문 기반 참고문헌과 부가 자료 구성을 제공한다.