Arm Mali-G77 GPU - seluk beluk lengkap

Pengarang: Randy Alexander
Tanggal Pembuatan: 3 April 2021
Tanggal Pembaruan: 1 Juli 2024
Anonim
Arm Mali-G77 GPU - seluk beluk lengkap - Teknologi
Arm Mali-G77 GPU - seluk beluk lengkap - Teknologi

Isi


Bersamaan dengan inti CPU Cortex-A77 yang baru, Arm telah meluncurkan GPU generasi mendatang yang diperuntukkan bagi SoC smartphone generasi berikutnya. Mali-G77, tidak menjadi bingung dengan prosesor tampilan Mali-D77 yang baru, menandai kepergian arsitektur Bifrost Arm dan pindah ke Valhall.

Kami akan segera masuk ke detail arsitektur baru. Pertama, kami akan melompat ke apa yang seharusnya diharapkan pengguna dalam hal peningkatan kinerja.

Ikhtisar kinerja Mali-G77

Arm membanggakan peningkatan kinerja grafis hingga 40 persen dengan perangkat Mali-G77 generasi terbaru dibandingkan dengan model Mali-G76 saat ini. Jumlah ini sedang mempertimbangkan proses serta perbaikan arsitektur. Mali-G77 dapat dikonfigurasi dari 7 hingga 16 inti shader, dan masing-masing inti memiliki ukuran yang hampir sama persis dengan inti G76. Ini berarti bahwa smartphone kelas atas kemungkinan akan dikirimkan dengan jumlah inti GPU yang sama seperti yang mereka lakukan hari ini - di suatu tempat di kalangan remaja rendah. Dengan mudah, ini memungkinkan kami membuat beberapa penilaian kinerja spekulatif terhadap chipset yang ada.


Melihat benchmark Manhattan GFXBench yang populer, peningkatan kinerja 40 persen membuka keunggulan yang cukup besar terhadap perangkat keras generasi saat ini. Chip Adreno generasi berikutnya dari Qualcomm akan membutuhkan peningkatan kinerja sendiri yang signifikan untuk menjaga level permainan. Tabel tampaknya berbalik mendukung Arm.

Dari segi arsitektur, kinerja game meningkat 20 hingga 40%, sementara pembelajaran mesin menghasilkan 60% peningkatan

Berdasarkan pada ballparking yang agak kasar ini, Mali-G77 10 inti (konfigurasi yang sering kita lihat dari Huawei) tampaknya akan menyulitkan perangkat keras grafis mobile generasi terbaru ini. Konfigurasi 12 inti, biasanya terlihat di Exynos Samsung, memberikan petunjuk besar untuk GPU terbaru Arm. Tentu saja, tolok ukur nyata akan tergantung pada faktor-faktor lain, termasuk simpul proses, memori cache GPU, konfigurasi memori LPDDR, dan jenis aplikasi yang Anda uji. Jadi, ambil grafik di atas dengan dosis garam yang lumayan.


Dalam hal arsitektur baru saja, Arm menyatakan bahwa Mali-G77 menawarkan peningkatan rata-rata 30 persen untuk efisiensi energi dan kepadatan kinerja. Ada juga peningkatan besar 60 persen untuk aplikasi pembelajaran mesin, berkat dukungan produk INT8 dot. Ekspektasi kinerja gaming ditetapkan antara 20 dan 40 persen, tergantung pada judul dan jenis beban kerja grafis yang ditawarkan.

Untuk memahami dengan tepat bagaimana Arm telah meningkatkan kinerja ini, mari selami lebih dalam arsitekturnya.

Temui Valhall, penerus Bifrost

Vahall adalah arsitektur skalar GPU generasi kedua Arm. Ini adalah mesin eksekusi warp 16-lebar, yang pada dasarnya berarti GPU mengeksekusi 16 instruksi secara paralel per siklus, per unit pemrosesan, per inti. Itu naik dari 4 dan 8 lebar di Bifrost.

Fitur arsitektur baru lainnya termasuk penjadwalan instruksi dinamis yang dikelola sepenuhnya dalam perangkat keras dan set instruksi semua-baru yang mempertahankan kesetaraan operasional ke Bifrost. Lainnya termasuk dukungan untuk format kompresi Arm AFBC1.3, target render FP16, rendering berlapis, dan output vertex shader.

Mali-G77 melakukan 33% lebih banyak matematika secara paralel dari pada G76.

Kunci untuk memahami perubahan arsitektur utama ditemukan dengan mengeluarkan unit eksekusi di dalam inti. Bagian dari GPU ini bertanggung jawab untuk angka-angka.

Di dalam mesin eksekusi

Di Bifrost, setiap inti GPU berisi tiga atau dua mesin eksekusi dalam hal beberapa desain Mali-G52 kelas bawah. Setiap mesin berisi i-cache, register file, dan unit kontrol warp. Di Mali-G72, setiap mesin menangani 4 instruksi per siklus, yang meningkat menjadi 8 pada Mali-G76 tahun lalu. Menyebar di ketiga inti ini memungkinkan untuk instruksi floating point (FP32) 12 dan 24 floating-bit (FMA) per siklus.

Dengan Valhall dan Mali-G77, hanya ada satu mesin eksekusi di dalam setiap inti GPU. Seperti sebelumnya, mesin ini menaungi unit kontrol warp, register, dan icache, yang sekarang dibagi di dua unit pemrosesan. Setiap unit pemrosesan menangani 16 instruksi warp per siklus, untuk total throughput 32 instruksi FMA FP32 per core. Itu adalah peningkatan 33 persen untuk throughput instruksi atas Mali-G76.

Arm telah beralih dari tiga menjadi hanya satu unit eksekusi per inti GPU, tetapi sekarang ada dua unit pemrosesan dalam inti G77.

Selain itu, masing-masing unit pemrosesan ini berisi dua blok fungsi matematika baru. Unit konversi baru (CVT) menangani integer dasar, logika, cabang, dan instruksi konversi. Unit fungsi khusus (SFU) mempercepat perkalian integer, divisi, akar kuadrat, logaritma, dan fungsi integer kompleks lainnya.

Unit FMA standar telah melihat beberapa penyesuaian, mendukung 16 instruksi FP32 per siklus, 32 instruksi produk FP16, atau 64 INT8 dot. Optimalisasi ini menghasilkan peningkatan kinerja 60 persen dalam aplikasi pembelajaran mesin.

Quad Texture Mapper

Perubahan kunci lainnya di Mali-G77 adalah pengenalan mapper tekstur quad, naik dari mapper tekstur ganda pada generasi sebelumnya. Mapper tekstur bertanggung jawab untuk memetakan poligon 3D dalam sebuah adegan ke representasi 2D yang Anda lihat di layar. Ini bertanggung jawab untuk pengambilan sampel, interpolasi, dan pemfilteran untuk memuluskan konten yang miring dan bergerak untuk menghindari tepi yang kasar dan berkualitas rendah.

Anti-aliasing berbiaya rendah tetap ada untuk membantu kualitas gambar, tetapi penggandaan kinerja tekstur adalah manfaat utama di sini. Unit tekstur sekarang memproses 4 bilinear texels per jam naik dari 2 sebelumnya, 2 trilinear texels per jam, dan menangani penyaringan FP16 dan FP32 yang lebih cepat.

Mapper tekstur quad dibagi menjadi dua jalur, menyediakan jalur pipa yang lebih pendek untuk utas yang mengenai konten dalam cache. Jalur yang hilang, yang menangani konversi format dan dekompresi tekstur, menampilkan antarmuka yang lebih luas ke cache L2. Ini juga berguna untuk beban kerja pembelajaran mesin yang mungkin sering perlu menarik data baru dari memori.

Menyatukan semuanya di Mali-G77

Arm telah melakukan sejumlah penyesuaian lain pada Mali-G77 untuk bertepatan dengan perubahan besar dalam arsitektur Valhall. Blok kontrol disederhanakan berkat desain unit eksekusi tunggal, sementara penjadwal dinamis internal sebenarnya memungkinkan untuk mengeluarkan instruksi yang lebih fleksibel di dalam setiap inti. Dengan throughput yang lebih tinggi di setiap inti, datapath juga lebih pendek dan lebih rendah dalam latensi, turun menjadi hanya 4-siklus dari 8 sebelumnya.

Desain baru juga lebih selaras dengan Vulkan API, menyederhanakan deskriptor driver untuk menurunkan overhead driver untuk meningkatkan kinerja "ke logam".

Singkatnya, Mali-G72 dan Valhall membuat perubahan penting dari Bifrost yang menjanjikan peningkatan kinerja yang signifikan untuk aplikasi game dan pembelajaran mesin. Yang penting, desainnya sesuai dengan anggaran daya dan area yang sama dengan Bifrost, memastikan bahwa perangkat seluler akan dapat menawarkan kinerja puncak yang lebih tanpa khawatir tentang panas, daya, dan biaya silikon. Berdasarkan proyeksi kinerja, Mali-G77 harus dapat memberikan Adreno generasi baru Qualcomm penghasilan yang baik.

Kasus Huawei P30 Pro terbaik

Peter Berry

Juli 2024

Huawei P30 Pro adalah martphone andalan terbaru dari peruahaan yang berbai di China. Ini angat kuat, dan terlihat hebat, tetapi juga tidak murah. Anda akan ingin melindungi telepon ini dari bahaya jik...

Huawei P30 Pro memiliki layar OLED ganda melengkung ganda 6,47 inci yang memungkinkan pemilik untuk melihat foto, video, aplikai dan konten lainnya dengan angat jela. Tak perlu dikatakan bahwa Anda me...

Pilihan Kita