Torus 인터커넥트
Torus interconnect토러스 인터커넥트는 병렬 컴퓨터 시스템에서 처리 노드를 연결하기 위한 스위치가 없는 네트워크 토폴로지입니다.
서론
기하학에서 토러스는 축 코프라인을 중심으로 원을 원에 회전시킴으로써 생성됩니다.이것은 지오메트리의 일반적인 정의이지만, 이러한 유형의 쉐이핑의 토폴로지 속성은 네트워크 토폴로지의 본질에 대해 설명합니다.
지오메트리 일러스트
아래 이미지는 1D와 2D 토러스입니다. 1D 토러스는 단순한 원이고 2D 토러스는 도넛 모양입니다.아래 애니메이션은 직사각형의 반대쪽 모서리 두 쌍을 연결하여 직사각형에서 2D 토러스를 생성하는 방법을 보여 줍니다.여기서 토러스 개념은 일련의 노드가 도넛처럼 연결되어 있는 시작과 끝을 본질적으로 설명하기 위해 사용됩니다.이 개념을 더 잘 설명하고 네트워크 인터커넥트에서 토폴로지가 의미하는 바를 이해하기 위해 토러스 토폴로지를 사용한 병렬 상호접속 노드의 3가지 예를 제시합니다.1차원에서 토러스 토폴로지는 원의 형상으로 링 인터커넥트 네트워크와 동등하다.2D에서는 2D 메쉬와 동일하지만 엣지 노드에 추가 연결이 있어 2D 토러스의 정의입니다.
Torus 네트워크 토폴로지
우리는 위의 수치에서 규칙을 일반화 할 수 있다.Torus interconnect는 스위치가 없는 토폴로지로 N = 2, 3 또는 그 이상의 직선형 배열로 배열된 노드와의 메시 인터커넥트로 볼 수 있으며 프로세서는 가장 가까운 이웃에 연결되고 대응하는 프로세서는 연결된 어레이의 반대쪽에 있습니다.[1] 이 격자에서 각 노드는 2N의 연결을 가집니다.이 위상은 이러한 방식으로 형성된 격자가 위상적으로 N차원 토러스와 동일하다는 사실에서 이름을 얻었다.
시각화
Torus 네트워크 토폴로지의 처음 3차원은 시각화하기 쉬우며, 아래에 설명되어 있습니다.
- 1D Torus: 1차원입니다.n개의 노드가 닫힌 루프로 연결되어 각 노드가 2개의 가장 가까운 인접 노드에 연결되어 +x와 -x의 양방향 통신이 가능합니다. 1D Torus는 링 상호 연결과 동일합니다.
- 2D Torus: 4차원의 2차원입니다.노드는 n개의 행과 n개의 열의 2차원 직사각형 격자로 배치되며, 각 노드는 4개의 가장 가까운 이웃에 연결되고, 대응하는 노드는 반대쪽 모서리에 연결됩니다.직사각형 배열을 "튜브"로 굴려 두 개의 반대 에지를 연결한 다음 "튜브"를 토러스 모양으로 구부려 다른 두 개를 연결함으로써 반대 에지의 연결을 시각화할 수 있습니다. 통신은 +x, -x, +y 및 -y의 4가지 방향으로 이루어질 수 있습니다.2D Torus의 총 노드는 n입니다2.
- 3D Torus: 3차원입니다.노드는 직사각형 프리즘 모양의 3차원 격자로 이미지화되어 각 노드는 6개의 인접 노드와 연결되고 어레이의 마주보는 면에 대응하는 노드가 연결됩니다.각 에지는 n개의 노드로 구성됩니다.통신은 +x, -x, +y, -y, +z, -z의 6가지 방향으로 이루어집니다.3D Torus의 각 가장자리는 n개의 노드로 구성됩니다.3D Torus의 총 노드는 n입니다3.
- ND Torus: N차원, N차원 Torus의 각 노드에는 2N개의 네이버가 있으며, 2N방향으로 통신이 가능합니다.각 에지는 n개의 노드로 구성됩니다.이 토러스의 총 노드는 n입니다N.Torus의 치수가 높은 주된 동기는 대역폭, 레이텐시, scalability를 높이는 것입니다.
고차원 배열은 시각화하기 어렵지만 위의 규칙에서 고차원마다 각 노드에 가장 가까운 네이버 연결 쌍이 추가된다는 것을 알 수 있습니다.
성능
TOP500 목록에 있는 많은 슈퍼컴퓨터에서는 IBM의 Blue Gene/L과 Blue Gene/P, Cray XT3 [1]등 3차원 토러스 네트워크를 사용합니다.IBM의 Blue Gene/Q는 5차원 토러스 네트워크를 사용합니다.후지쯔의 K컴퓨터와 PRIMEHPC FX10은 [2]두부라고 하는 독자적인 3차원 토러스 3D 메쉬 인터커넥트를 사용하고 있다.
3D Torus 성능 시뮬레이션
Sandeep Palur와 Dr.일리노이 공과대학의 요안 라이쿠는 3D 토러스 성능을 시뮬레이션하는 실험을 실시했다.이 실험은 250GB RAM, 48코어 및 x86_64 아키텍처를 탑재한 컴퓨터에서 실행되었습니다.그들이 사용한 시뮬레이터는 ROSS(Rensselaer's Optimistic Simulation System)였다.주로 다음 세 가지 측면에 초점을 맞췄습니다.
- 다양한 네트워크 크기
- 다양한 서버 수
- 다양한 메시지 크기
서버 및 네트워크 크기가 증가함에 따라 스루풋이 감소한다는 결론을 내렸습니다.그렇지 않으면 메시지크기의 [3]증가에 따라 throughput이 증가합니다.
6D Torus 제품 퍼포먼스
후지쯔 주식회사는 「두부」라고 불리는 6D 토러스 컴퓨터 모델을 개발했습니다.이 모델에서는 6D Torus는 100GB/s 오프칩 대역폭, 3D Torus보다 12배 높은 확장성 및 높은 내결함성을 실현할 수 있습니다.이 모델은 K컴퓨터나 후가쿠에서 [4]사용되고 있습니다.
장점과 단점
이점
- 고속화, 레이텐시 단축
- 반대쪽 가장자리의 연결로 인해 데이터는 한 노드에서 다른 노드로 이동할 수 있는 옵션이 많아져 속도가 크게 향상되었습니다.
- 공정성 향상
- 4×4 메쉬 인터커넥트에서는 노드 간의 거리가 왼쪽 상단 모서리에서 오른쪽 하단 모서리까지로 가장 깁니다.각 데이터는 가장 긴 경로를 이동하기 위해 6홉이 소요됩니다.그러나 4×4 Torus 인터커넥트에서는 왼쪽 상단 모서리가 오른쪽 하단 모서리까지 2홉으로 이동할 수 있습니다.
- 소비 전력의 삭감
- 데이터는 홉을 적게 이동하기 때문에 에너지 소비량은 더 낮은 경향이 있습니다.
단점들
- 배선의 복잡성
- 추가 와이어는 물리 설계 단계의 라우팅 프로세스를 더욱 어렵게 만들 수 있습니다.칩에 와이어를 더 많이 배치하려면 금속층을 늘리거나 칩 밀도를 낮춰야 할 가능성이 높기 때문에 비용이 더 많이 듭니다.그렇지 않으면 반대쪽 가장자리를 연결하는 와이어가 다른 와이어보다 훨씬 길어질 수 있습니다.이러한 링크 길이의 불균형은 RC 지연으로 인해 문제를 일으킬 수 있습니다.
- 비용.
- 긴 랩 어라운드링크가 접속 토폴로지를 시각화하는 가장 쉬운 방법일 수 있지만 실제로는 케이블 길이에 제한이 있기 때문에 긴 랩 어라운드링크가 실용적이지 않은 경우가 많습니다.대신, 직접 연결된 노드(위의 시각화가 그리드의 반대쪽 가장자리에 배치하고 긴 랩 어라운드 링크로 연결된 노드 포함)는 접힌 토러스 [5][6]네트워크 내에서 물리적으로 서로 거의 인접하게 배치됩니다.접힌 토러스 네트워크 내의 모든 링크는 매우 짧습니다(단순한 그리드 인터커넥트의 가장 가까운 네이버 링크와 거의 같음). 따라서 지연이 [7]낮습니다.
「 」를 참조해 주세요.
레퍼런스
- ^ N. R. Agida et al. 2005 Blue Gene/L Torus Interconnection Network, IBM Journal of Research and Development, Vol 45, 2005년 3월 - 5월 2/3호"Archived copy" (PDF). Archived from the original (PDF) on 2011-08-15. Retrieved 2012-02-09.
{{cite web}}
: CS1 maint: 제목으로 아카이브된 복사(링크) - ^ 후지쯔, 포스트K 슈퍼컴퓨터 공개 HPC 와이어 2011년 11월 7일
- ^ Sandeep, Palur; Raicu, Dr. Ioan. "Understanding Torus Network Performance through Simulations" (PDF). Retrieved 28 November 2016.
- ^ Inoue, Tomohiro. "The 6D Mesh/Torus Interconnect of K Computer" (PDF). Fujitsu. Retrieved 28 November 2016.
- ^ "소세계 토러스 토폴로지"
- ^ 파벨 트브르딕"병렬 컴퓨팅의 토픽: IN의 임베딩 및 시뮬레이션: 메시에 토리를 최적으로 임베딩합니다."
- ^ "3D Torus 아키텍처와 Eurotech 접근"