당사는 링크를 통해 이루어진 구매에 대해 수수료를 받을 수 있습니다.
Amazon Web Services는 수년 동안 인터넷의 상당 부분을 지원해 왔습니다. CRN에 따르면 2026년 1분기 현재 클라우드 및 AI 회사는 전 세계 클라우드 인프라 시장의 28%를 장악하고 있습니다. 그렇기 때문에 AWS가 중단될 때마다 인터넷의 대부분을 차지하는 것처럼 느껴집니다. 이로 인해 네트워크 탄력성은 모든 데이터 센터에서 최우선 순위가 되며, AWS가 운영되는 규모와 그에 의존하는 인터넷의 양을 고려할 때 이는 AWS 데이터 센터에 특히 중요합니다.
데이터 센터의 오랜 장애물은 소위 “팻 트리” 네트워크 토폴로지를 넘어서는 것입니다. 규모에 따라 안정적이고 예측 가능하지만 효율성과 대역폭 면에서 상충 관계가 있다는 것은 잘 알려져 있습니다. Amazon은 자사의 새로운 네트워크 설계가 동종 최초이며 AWS 데이터 센터에서 뚱뚱한 나무 네트워크를 대체할 수 있다고 보고했습니다. Amazon은 이 새로운 네트워크 설계를 탄력적인 네트워크 그래프의 약자인 RNG라고 부릅니다.
Amazon 보도 자료에 따르면 새로운 RNG 네트워크 계층 구조는 “AWS 고객에게 더 큰 안정성과 성능을 제공하고, 수십억 달러의 하드웨어를 절약하며, 회사가 운영하는 점점 더 많은 그리드에서 CO2 배출량을 낮추는 획기적인 기술입니다.”
Amazon은 새로운 데이터 센터를 두껍게 만드는 대신 횡보하고 있습니다.
Amazon과 그 팀은 RNG 네트워크 설계를 위한 새로운 접근 방식을 개발했지만 그 기반은 새로운 것이 아닙니다. 이는 트리 계층 구조에서 사용되는 레이어가 아닌 라우터와 스위치를 서로 직접 연결하는 아이디어인 플랫 네트워크(예: Jellyfish 네트워크 상호 연결 설계)에 대한 기존 작업 및 연구를 기반으로 합니다. 팻 트리 토폴로지는 노드가 계층으로 연결되고 트리 상단의 분기가 하단의 분기보다 더 높은 대역폭(“더 두꺼운”)을 갖는 데이터 센터의 일반적인 네트워크 설계였습니다. 그런 다음 데이터 패킷은 트리의 위아래로 이동하여 지정된 경로로 라우팅됩니다.
이 토폴로지는 미국인들이 반발하고 있음에도 불구하고 데이터 센터의 하이퍼 스케일링에 매우 중요하지만 병목 지점과 혼잡이 발생하기 쉽습니다. 트리 상단에 있는 라우터는 심각한 장애 지점이 될 수 있으며, 라우터가 다운되면 그 아래에 있는 전체 부품을 제거할 수 있습니다. 평면 네트워킹 이론을 기반으로 하는 Amazon의 RNG는 무작위 연결을 통해 대역폭을 향상시켜 네트워크의 데이터 병목 현상을 줄이면서 단일 장애 지점도 줄입니다. 라우터가 다른 라우터보다 중요하지 않습니다.
Amazon Science에 게재된 기사에서 Amazon이 팻 트리 토폴로지에 대한 대안으로 진출하도록 이끈 팀인 Giacomo Bernardi, Ratul Mahajan 및 Seshadhri Comandur는 라우터의 1% 손실이 무작위 네트워크의 용량 손실의 약 1%에 해당한다고 지적하여 트리 토폴로지에 대한 복원력이 향상되었음을 강조했습니다. 그러나 무작위 네트워크를 구현하는 것은 항상 특정 비실용성을 야기했습니다. 즉, 데이터 센터에서 수백만 개의 광섬유 케이블을 교차시키는 것은 단순히 불가능하기 때문에 이러한 네트워크에 케이블을 연결하는 방법이 있습니다. 확립된 토폴로지가 제공하는 엄격한 프로토콜 없이 데이터를 효율적으로 라우팅하는 방법에 대한 과제도 있습니다.
Amazon은 준 무작위 네트워크를 달성하기 위해 스프레이포인트(Spraypoint)와 셔플박스(ShuffleBox)를 만들었습니다.
무작위 네트워크의 문제를 해결하기 위해 Amazon은 무작위 네트워크 아키텍처의 선택된 부분과 혼합된 고정 네트워크 요소를 혼합하여 “준 무작위” 네트워크를 생성합니다. 이를 위해 Amazon은Spraypoint라는 데이터 라우팅 알고리즘과 ShuffleBox라는 수동 광학 장치를 만들었습니다. arXiv에 게시된 백서에 따르면,Spraypoint는 소스의 모든 패킷을 모든 적합한 다음 홉인 이웃에 “스프레이”하는 방식으로 작동하며, ECMP(Equal-cost Multi-Path Routing)를 기반으로 하나가 선택됩니다.
아이디어는 소스에서 스프레이된 각 패킷이 임의의 이웃으로 이동한 다음 최단 경로가 웨이포인트로 이동하고 웨이포인트가 트래픽을 목적지로 보내는 것입니다. Amazon은 웨이포인트를 사용하여 트래픽을 분산시키고 패킷이 한 목적지에 쌓이는 것을 방지합니다. 스프레이포인트 알고리즘은 상용 라우터에서 일정 수준의 무작위 네트워킹을 허용하므로 라우터는 가능한 모든 라우팅 경로를 저장하고 처리하기 위해 특수한 CPU나 메모리가 필요하지 않습니다.
ShuffleBox는 RNG의 물리적 연결을 해결합니다. ShuffleBox는 밀폐된 인클로저가 있고 전원 공급 장치가 없는 광학 장치이므로 대기 시간을 추가하지 않고 오류 위험을 줄입니다. ShuffleBox는 서버 랙을 연결하기 위한 라우터 방향 포트와 이를 다른 ShuffleBox에 연결하기 위한 또 다른 포트 세트를 사용하여 작동합니다. 광섬유 와이어는 백서에 설명된 특수 패턴에 따라 내부적으로 섞인 다음 ShuffleBox가 무작위로 상호 연결됩니다. 이는 네트워크에 준 무작위 연결을 제공할 뿐만 아니라 케이블링 복잡성을 낮게 유지하고 AWS가 운영하는 공간에 맞게 확장할 수 있게 해줍니다. Amazon은 또한 비용이 일반 패치 패널과 유사하여 비용 효율적인 솔루션이라고 말합니다.
아마존은 최첨단에 있으며, 아마존이 하는 일이 중요합니다.
Amazon 백서에는 RNG가 다양한 네트워크 트래픽 패턴 및 워크로드에서 팻 트리 네트워크와 일치하거나 이를 능가하며, 구현 비용이 최대 45% 저렴하면서도 데이터를 최대 3분의 1 더 빠르게 이동할 수 있다고 명시되어 있습니다. 이는 Amazon의 새로운 준무작위 네트워크가 라우터 수를 69%나 줄여준다고 주장하기 때문일 것입니다. 이는 하드웨어 비용 절감뿐만 아니라 전력 사용량 감소로 이어집니다. Amazon은 RNG를 사용하는 AWS 데이터 센터가 계층적 네트워크에 비해 전력을 40% 적게 소비할 것으로 기대합니다.
전력과 하드웨어가 적다는 것은 AWS 데이터 센터에 필요한 냉각 양의 감소를 의미하며, 이 두 가지 모두 Amazon이 데이터 센터 사이트 전체에서 CO2 배출량을 줄이는 데 도움이 됩니다. 데이터 센터의 탄소 및 물 발자국은 대중과 국회의원 모두에게 주요 논쟁거리가 되었으며, 이러한 위치의 나사를 더욱 환경적으로 지속 가능하게 만들었습니다. Amazon은 이미 특정 데이터 센터를 냉각하기 위해 재생수를 사용하고 있지만 이는 방정식의 일부일 뿐입니다.
그러나 RNG를 통해 데이터 센터의 기본 냉각 및 전력 요구 사항을 줄임으로써 Amazon은 실제로 2030년까지 물을 긍정적으로 만들고 2040년까지 순 제로 탄소 배출을 달성하려는 목표를 달성할 수 있습니다. 시장 리더로서 Amazon은 데이터 센터 기술의 최첨단에 있습니다. 업계에 파급효과를 미치기 때문에 그것이 무엇인지가 중요합니다. 이제 회사가 하이브리드 네트워킹 접근 방식의 실행 가능성을 입증했으므로 Google 및 Microsoft와 같은 다른 회사도 이를 따를 수 있습니다.
Amazon에 따르면 최초의 준 무작위 RNG 네트워크는 2024년 아일랜드 더블린에서 가동되었습니다. 2025년 내내 스페인과 독일로 확장되었으며 2026년 4월 현재 새로운 AWS 데이터 센터의 표준이 되었습니다.