인텔, 엔비디아 모델보다 최대 3% 빠른 AI 칩 '가우디 50' 발표

인텔, 엔비디아 모델보다 최대 3% 빠른 AI 칩 '가우디 50' 발표

오타비오 케이로즈의 화신
신제품은 이전 세대보다 최대 4배 향상된 성능과 NVIDIA H2,3보다 100배 향상된 에너지 효율성을 약속합니다.

A 인텔 이번 주 화요일(9)에 공개되었습니다. 인텔 가우디 3, 막내 AI 가속기 대규모 AI 컴퓨팅을 목표로 한다. 5나노미터 공정을 사용하여 제조된 이 출시는 이전 세대(Gaudi 2)에 비해 더 나은 에너지 효율성과 더 많은 처리 능력을 제공합니다.

인텔 가우디 3

인텔, 엔비디아 모델보다 최대 3% 빠른 AI 칩 '가우디 50' 발표
새로운 라인은 이전 세대(Disclosure/Intel)보다 최대 4배 향상된 컴퓨팅 AI 성능을 제공합니다.

에 따라 회사, 제시한 인텔 가우디 3 이벤트 기간 동안 인텔 비전 2024를 통해 새로운 라인업은 이전 세대보다 최대 4배 향상된 컴퓨팅 AI 성능과 1,5배 향상된 메모리 대역폭, 2배 향상된 네트워크 대역폭을 제공합니다. 증가함에 따라 회사의 솔루션은 대규모 Generative AI 인프라 시장에서 몇 안되는 대안 중 하나로 부상하고 있습니다.

Intel Gaudi 3는 가격 성능, 시스템 확장성 및 가치 실현 시간 이점의 강력한 조합을 제공하는 GenAI 대안으로 돋보입니다.

저스틴 호타드(Justin Hotard), 인텔 수석 부사장 겸 데이터 센터 및 AI 그룹 총괄 관리자

가우디 3 가지다 64개의 텐서 프로세싱 코어(TPC) AI에 맞게 맞춤화되었으며 완전히 프로그래밍 가능합니다. 8개의 행렬 곱셈 엔진(MME), 이는 이종 계산 처리에서 탁월한 성능을 발휘합니다. 각 MME 보조 프로세서는 64개의 병렬 작업을 실행할 수 있음이는 딥러닝 알고리즘에 필수적인 복잡한 행렬 연산을 처리하는 능력을 보장합니다.

인텔은 또한 가속기가 인텔 가우디 3 금융, 제조, 의료 등 가장 다양한 분야의 기업이 AI에 대한 접근성을 빠르게 확장하고 실험 단계에서 본격적인 구현에 이르기까지 생성적 AI 프로젝트의 전환을 지원할 것을 약속합니다.

회사는 솔루션이 이러한 요구 사항을 충족하고 커뮤니티 기반 개방형 소프트웨어와 업계 표준 개방형 이더넷을 통해 다양성을 제공하여 기업이 AI 시스템과 애플리케이션을 유연하게 확장할 수 있도록 지원합니다.

Intel은 NVIDIA 모델보다 최대 3% 빠른 AI 칩인 Gaudi 50를 발표했습니다. 신제품은 이전 세대보다 최대 4배 향상된 성능과 NVIDIA H2,3보다 100배 향상된 에너지 효율성을 약속합니다.
Gaudi 3 GPU에는 AI용으로 맞춤화된 64개의 TPC(텐서 처리 코어)가 있으며 8개의 MME(행렬 곱셈 엔진)를 사용하여 완전히 프로그래밍 가능합니다(Disclosure/Intel)

이번 행사의 주요 하이라이트 중에는 인텔 가우디 3 아직도:

  • AI 전용 컴퓨팅 엔진: 이 솔루션은 높은 수준의 계산 효율성을 허용하여 딥 러닝 알고리즘의 기본 계산 유형인 복잡한 행렬 연산을 능숙하게 처리할 수 있도록 해줍니다. 이 독특한 디자인은 병렬 AI 작업의 속도와 효율성을 가속화하고 FP8 및 BF16을 포함한 다양한 데이터 유형을 지원합니다.
  • LLM 용량 요구 사항에 대한 메모리 부스트: 128GB의 HBMe2 메모리 용량, 3,7테라바이트(TB)의 메모리 대역폭, 96MB의 통합 SRAM(Static Random Access Memory)은 더 적은 수의 Intel Gaudi 3에서 대규모 GenAI 데이터 세트를 처리할 수 있는 충분한 메모리를 제공하며 특히 유용합니다. 대규모 언어 및 다중 모드 모델을 제공하여 작업 부하 성능과 데이터 센터 비용 효율성을 향상시킵니다.
  • Enterprise GenAI를 위한 효율적인 시스템 확장: 200개의 3기가비트(Gb) 이더넷 포트가 각 Intel Gaudi XNUMX 가속기에 통합되어 유연한 개방형 표준 네트워킹을 제공합니다.
  • 개발자 생산성을 위한 개방형 산업 소프트웨어: Intel Gaudi 소프트웨어는 PyTorch 프레임워크를 통합하고 오늘날 GenAI 개발자를 위한 가장 일반적인 AI 프레임워크인 포옹 얼굴 커뮤니티를 기반으로 최적화된 모델을 제공합니다. 이를 통해 GenAI 개발자는 사용 및 생산성이 용이하고 다양한 유형의 하드웨어에서 모델을 쉽게 이식할 수 있도록 높은 수준의 추상화에서 작업할 수 있습니다.

AI 시장을 위해 AMD, NVIDIA와 싸워라

출시 인텔 등 다른 제조사와의 분쟁이 심화되고 있다. AMD e NVIDIA, 후자는 최근에도 발표 H200, HPC와 인공지능 부문을 겨냥한 GPU. 에이 AMD, 차례로 최근에 발표했습니다. 산업용 애플리케이션용 임베디드 시스템을 위한 Ryzen Embedded 8000 CPU

현재 업계에서는 이미 많은 AI 도구가 컴퓨터 비전 및 빅데이터 처리 분야를 중심으로 사용되고 있습니다. 이를 통해 제조업체는 이미 AI가 가장 다양한 영역에서 훨씬 더 많은 공간을 지배할 것을 약속하는 새로운 컴퓨팅 세대를 준비하고 있습니다.

유효성

인텔 가우디 3
Intel Gaudi 3는 2024년 XNUMX분기에 OEM(Original Equipment Manufacturer)에 표준 구성으로 제공될 예정입니다(Disclosure/Intel).

가속기 인텔 가우디 3 2024년 XNUMX분기에 OEM(Original Equipment Manufacturer)에 표준 구성으로 제공될 예정입니다. 그 중에는 주목할만한 파트너십이 있습니다. Dell Techonolgies, HPE, Lenovo 및 Supermicro, 새로운 가속기를 사용하는 솔루션이 3분기에 시장에 출시됩니다.

참조 :

Qualcomm RB3 Gen 2는 AI 성능이 10배 향상되었습니다. 모든 출시 세부정보를 확인하세요..

출처 : 인텔 [1] [2].

검토자 글라우콘 바이탈 9년 4월 24일.


쇼메텍에 대해 자세히 알아보세요.

최신 뉴스를 이메일로 받아보시려면 등록하세요.

댓글을 남기

귀하의 이메일 주소는 공개되지 않습니다. 필수 필드가 표시되어 있습니다 *

관련 게시물