Sayfa Seç

Denedim: AMD GCN - Radeon HD 7970 ve HD 7950 ile tanışın

Sonunda AMD GCN (Graphics Core Next) mimarisini ve onun en güçlü iki temsilcisi olan Radeon HD 7970 ve Radeon HD 7950'yi tanıtmanın zamanı geldi.

GCN makale logoları

HD 7950'den ikisini hemen takdir ettik, böylece CrossFireX'i de test etme fırsatı bulduk ve ayrıca her iki kartla da ayarlı ölçümler yaptık. Elbette, kartların önceki nesil GeForce ve Radeon'lara kıyasla ne kadar hızlandığını görmek için iki yeni topa karşı birkaç yarışçı gönderdik. 


Katılımcılara ve testlere geçmeden önce GCN mimarisine daha yakından bakacağız ve HD 7970 ve HD 7950'nin özelliklerini ele alacağız.

 tüm kart kutuları 2k

 Grafik Çekirdeği Sonraki

Mayıs 2007'de AMD, zaten birleşik bir gölgelendirici mimarisi üzerine kurulmuş olan Radeon HD 2900 XT grafik kartını tanıttı. Görünüşe göre tasarımda bir takım kusurlar vardı, ancak Radeon HD 4000 serisinin zamanına kadar sorunlar neredeyse tamamen ortadan kalktı ve şirkete masaüstü grafik kartı pazarında bir yer edindi. Bu noktada artık radikal değişikliklere ihtiyaç olduğu görülüyordu. HD 6900 “Cayman” serisi ilk adım olarak kabul edilir. Burada, önceki 5 yollu süperskaler işlemciler (VLIW5), 4 yollu işlemciler (VLIW4) ile değiştirildi ve Cayman, birden fazla bağımsız talimat akışını işleyen ilk çip oldu. Diğer büyük yenilik, üçgen kurulum kapasitesini iki katına çıkaran - mozaikleme gücünü artıran - ve bazı öğelerin (Rasterizer, Hiyerarşik Z, Mozaikleyici) sayısını iki katına çıkaran iki "grafik motorunun" tanıtılmasıydı. Bugün bir sonraki seviye testimizin konusu oldu. Graphics Core Next (GCN) adı verilen bir mimari sayesinde, şimdiye kadar kullanılan VLIW talimatlarıyla çalışan gölgelendirici dizilerinin modası geçti ve yerini Hesaplama Birimleri (CU'lar) aldı. GCN ilk çıkışını Radeon HD 7900 “Tahiti” ailesinde yaptı.

19 m

İlginç bir şekilde, ancak şaşırtıcı olmayan bir şekilde, Tahiti GPU'ları, TSMC'nin 28nm bant genişliği üretim teknolojisi sayesinde olağanüstü transistör yoğunlukları elde etti - 365 milimetre kare başına 4,3 milyar transistör içerirler. Bir Hesaplama Birimi, dört SIMD ve bir skaler birim içerir. AMD'nin amiral gemisi Radeon HD 7970 “Tahiti XT”, toplam 32 shader işlemcisi (dört adet 2048-yollu SIMD, 16 ALU) varsayarak 64 aktif CU ile çalışır. Nesillerin şimdiye kadar kaydettiği ilerleme göz önüne alındığında, bu ilk bakışta olağanüstü bir değer gibi görünmese de, daha iyi verimlilik ve kullanım adına, bundan kazara geniş kapsamlı sonuçlar çıkarmaya değmeyeceğini belirtmek isteriz. bir teknik gösterge. Teorik olarak, bir CU, tek bir Cayman SIMD ünitesi kadar performans gösterebilir. Önceki nesillerle ilgili büyük bir sorun, kullanımın büyük ölçüde dalgalanmasına neden olan veri bağımlılığıdır (ardışık komutlar birbirine bağlıdır). GCN mimarisi, akış işleme yoluyla daha önce deneyimlenen bağımlılıkları ortadan kaldırdığı için bu alanda da bir adım öne çıkıyor. Avantajlar yalnızca anahtar kelimelerdedir: zamanlama, hata ayıklama, beklenen performansı tahmin etme ve sürücü geliştirme de radikal biçimde daha basit ve daha şeffaf hale geldi. 

24

36 mBir CU yalnızca dört SIMD birimi içermekle kalmaz, aynı zamanda kendi zamanlayıcısına, 340 KB arabellek deposuna ve bir tekstüre kümesine sahiptir. Bu, 4 × 64 KB vektör kaydı, 64 KB Yerel Veri Paylaşımı, 4 KB skaler kayıt ve 16 KB kapasiteli birinci seviye önbelleğin toplamıdır. Yukarıdaki resim, kesinlikle bahsetmeye değer başka bir bileşeni göstermektedir ve bu, daha verimli program kontrolünde rol oynayan “Dal ve Mesaj Birimi” olarak adlandırılır.
Buraya kadar olan bilgilere sahip olarak, “Tahiti XT” grafik işlemcisinin temel parametrelerini tekrar gözden geçirelim: 32 CU (2048 shader işlemci, 128 SIMD), 128 tekstüre birimi, 512 Load-Store Birimi ve toplamda 8,2 MB önbellek. Yani daha yeni "soyunmaya" başlamış olmamıza rağmen kızın pozisyonu hemen farklıydı.

35 mBaşlangıç ​​aşaması

Ön uç açısından NVIDIA GF110'un mimarisine kıyasla önemli farklılıklar görebiliriz. Yönetim temel olarak GB düzeyinde yapılmaz. Bu görev, Komut İşlemci ve Asenkron Hesaplama Motoru (ACE) tarafından gerçekleştirilir. Yongaya, Geometri-Assembler'a ek olarak Vertex-Assembler'a ek olarak, dokuzuncu nesil mozaikleme ünitelerini de barındıran iki geometrik motor verildi. Birimler ile iletişim, bu birimlerin de birbirleriyle veri paylaşabileceği Global Veri Paylaşımı (GDS) ile kolaylaştırılır. Ön uç bölümü iki rasterleştirici içerir - aşağıdaki düzeni görebilirsiniz.

37

ROP'ler ve bellek arayüzü
AMD Tahiti 8 ROP kümesi içerir - bu noktada Cayman çipiyle bir eşleşme bulduk. Bu tür her "dizi", dört ROP birimi ve 16 Z örnekleyici içerir. Her kümeye kendi önbelleğinin verildiğini belirtmek önemlidir. Bir başka önemli değişiklik daha gerçekleşti: artık bellek denetleyicisine doğrudan bağlantı yok. Hareket, Pitcairn bağlamında görebileceğimiz esnekliği ve kullanılabilirliği iyileştirmeyi amaçlıyor… ROP'lar 768 KB L2 önbelleğe yazabilir ve bu da birden fazla birim tarafından okunabilir. Bellek arayüzü neşeli bir görüntü alır. Altı 64 bit bellek denetleyicisinin toplam kapasitesi 384 bittir. Buna sadece bir kelime ekleyeceğiz. Nihayet! Varsayılan video belleği boyutu 3072 MB'dir, ancak teoride 1536 MB ve 6 GB da mümkündür.

Okurlarımızın kötü bir isimle almamasını umuyoruz, ancak bu noktada arka uç alanı hakkında kişisel görüşümüzü ifade edeceğiz. Gerçekten iyi performans gösteren Barts ile nispeten mütevazı sonuçlar veren Cayman çipi arasındaki ilişki, AMD çipleriyle ilgili “genel problemin” dar ROP kapasitesi olduğunu gösteriyor. Burada da Tahiti konusunda hiçbir ilerleme kaydedilmedi, ancak çipin diğer yenilikleri hakkında biraz abartılı bir şekilde sayfalar yazılabilir. ROP'ların rolü özellikle oyunlar sırasında belirgindir, GPGPU görevleri ve uygulamaları sırasında ikinci kemancı olurlar. Bu bölümün çok sayıda transistör tükettiği de kesin, bu da elbette çipin boyutuna da yansıyor.

 

AMD'nin şimdiye kadarki geliştirmeleri, büyük ölçüde oyuncuların ihtiyaçlarına hizmet etti. Artık en az 90 derecelik bir dönüş oldu ve profesyonel ihtiyaçları karşılamak, GPU'yu daha yaygın kullanmak için güçlü bir kavşak haline geldi. Tabii ki, bu bir sorun değil, çünkü temelde modern oyunların denemelerine birkaç yıl dayanacak çok kaba bir performans seviyesinden bahsediyoruz. Söylentilere göre sadece AMD değil NVIDIA da Kepler ile ROP'ları dar bir şekilde ele alıyor.

Bellek veri yolunu genişletmek övgüye değer bir adımdı. Aslında, tasarımcıların çok az seçeneği vardı. Saatler artık önemli ölçüde artırılamıyor, ancak çip veri için açlıktan ölüyor. Bize göre, bu hareket tek başına oyunlardaki performansı yüzde 15'e kadar artırabilirdi.

44DirectX 11.1 ve PCI Express 3.0
PCI-Express 3.0 standardı, hızı 16 GB/saniyeden 32 GB/saniyeye çıkararak PCIe 2.0'ın veri aktarım hızını ikiye katlar. Anakart üreticileri hemen "konuya takıldı" ama ne kadar isteseler de switch şu anda önemli bir avantaj sunmuyor. PCIe 3.0, pazarlama açısından önemli bir silah, AMD ve NVIDIA için zorunlu bir standart ve kullanıcılar için başka bir "para tuzağı".
DirectX 11.1, küçük düzeltmeler ve optimizasyonlar içeren aşağıdaki Windows işletim sistemi ile fethine başlayabilir. Resmi materyallere göre, yeni API'den yerel stereo 3D desteği ve daha verimli rasterleştirme bekleyebiliriz. Ne yazık ki, grafik donanımının esnekliğinin ve yaygın kullanılabilirliğinin nasıl geliştirilebileceğini tartışan belki de en ilginç nokta ayrıntılandırılmamış.

31 m

Graphics-Core-Next mimarisi genel olarak böyle görünüyor. Tabii ki chip sadece oyuncuların ihtiyaçlarına hizmet etmekle kalmıyor, aynı zamanda profesyonel görevler için de yer var. Tahiti'nin teorik hesaplama tepe performansı (çift duyarlıklı hesaplamalar için), tek duyarlıklı kayan nokta işlemleri için dört kat daha yüksek olan 947 GFLOP'tur. Ek olarak, bellekler ECC desteğine sahiptir ve GPU, DirectCompute 11.1, OpenCL 1.2 C ++ AMP API'lerini iyi tanır.27 Yeni özellikler: Sıfır Çekirdek
Genel olarak, Radeon HD 7900 seviyesindeki en iyi yırtıcılar, bir tabu olarak tüketmeye alışkındır, ancak AMD mühendisleri yaratıcılıktan yoksundur. Fikir basit ama harika ama yeni değil. Bilgisayarınızı uzun süre bırakırsanız ancak herhangi bir nedenle kapatmak istemiyorsanız, monitörü yalnızca bekleme modunda bırakmak isteyebilirsiniz. ZeroCore Power teknolojisi sayesinde ekran kapalıyken tüm grafik denetleyicisinin enerjisi kesilebilir ve bu formda aktif soğutma gerekmez. Avantajları ikna edici: sıfır gürültü, 3 watt güç tüketimi. Birçoğu için önemsiz bir faktör olacak, ancak dört yönlü Crossfire sistemleri için prosedür, birincil olmayan video kartlarını kapatarak elektrik faturanızı önemli ölçüde azaltır - böyle bir montajı düşünen herhangi biri enerji verimliliğini ele almak için çok az şey yapsa da.

21a

20

Eyefinity 2.0
Yeni sürümün ilginç özelliklerinden biri, çok bantlı ses ile çok monitörlü konferans görüşmeleri yapmanıza izin vermesidir. Prosedürün resmi adı Ayrık Dijital Çok Noktalı (DDM) Ses'tir. Radeon HD 7970, sekiz kanallı bir ses akışı alabilen aynı anda üç ekrana bağlanabilir. Bu, özellikle ev kullanıcılarının ilgisini çekmeyebilir, ancak yeni topun kaç alanda kullanılabileceğinin güzel bir örneği. Catalyst sürücüsü de gelişiyor, örneğin tepsiyi konumlandırmayı kolaylaştırıyor ve özel çözünürlükleri derlemenize olanak tanıyor. Full HD stereo 3D içeriğin Eyefinity modunda da görüntülenebildiğini belirtmekte fayda var. 

29 m

UVD ve VCE
UVD 3.0 zaten DivX / Xvid, MPEG-4 Part 2 MVC içeriği için donanım hızlandırma sunar ve Video Code Engine (VCE), Intel Quick Sync Video'nun neredeyse AMD eşdeğeridir. VCE bağımsız bir donanımdır ve yalnızca H.264 videolarının kod dönüştürmesini hızlandırmak için tasarlanmıştır. Motor, grafik işlemcideki gölgelendirici işlemcilerden daha yavaştır, ancak çok daha fazla enerji verimlidir. Kullanıcılar için iki mod mevcuttur. İlkinde, yalnızca kendi içinde çoğu CPU'dan daha hızlı olan VCE çalışır. Bu durumda bir yavaşlama yaşamayacağız, ekran kartını veya merkezi üniteyi sorunsuz bir şekilde yükleyebiliriz. İkinci seçenek hibrit moddur. VCE ve GPU'nun aritmetik-mantık birimleri, göreve birlikte atlar. Bu "evliliğin" kodlama hızı üzerinde iyi bir etkisi olduğu açıktır, ancak bu durumda en sevdiğiniz oyun "slayt gösterisi" moduna geçerse şaşırmayın.

32

Artık teorinin ve sayıların farkında olduğumuza göre, testteki üç GCN modelini tanıyalım!

Yazar hakkında