Arm Cortex-A77 - semua yang perlu Anda ketahui

Pengarang: Randy Alexander
Tanggal Pembuatan: 2 April 2021
Tanggal Pembaruan: 1 Juli 2024
Anonim
So You Think You Know Meta Model?
Video: So You Think You Know Meta Model?

Isi


Bersamaan dengan prosesor grafis Mali-G77 dan prosesor tampilan Mali-D77, Arm telah meluncurkan desain CPU performa tinggi terbarunya - Cortex-A77. Seperti Cortex-A76 tahun lalu, Cortex-A77 dirancang untuk aplikasi tingkat premium yang menuntut konsumsi daya rendah khas Arm. Semuanya dari smartphone hingga laptop dan sangat mungkin di luar.

Dengan Cortex-A77, Arm telah menargetkan peningkatan kinerja instruksi per siklus / jam (IPC) maksimum yang dapat dikelolanya melalui Cortex-A76. Frekuensi jam, konsumsi daya, dan area, semuanya dirancang untuk tetap berada di sekitar ballpark yang sama, tetapi inti baru dapat melalui lebih banyak instruksi sekaligus. Untuk melakukan ini, Arm telah merancang inti yang bahkan lebih luas dari tahun lalu dan telah membuat sejumlah perbaikan untuk menjaga agar inti CPU tetap memiliki hal-hal yang harus dilakukan. Namun sebelum kita sampai pada hal itu, mari selami ikhtisar tingkat tinggi dan angka kinerja.

Memukul target kinerja

Kembali pada Agustus 2018, Arm biasanya berbagi peta jalan CPU hingga 2020. Dari Cortex-A73 2016 hingga desain "Hercules" tahun 2020, perusahaan ini menjanjikan peningkatan kinerja komputasi 2,5x. Sebagian besar proyeksi besar ini diselesaikan dengan pergeseran mikroarsitektur utama dengan Cortex-A76, kecepatan jam modern yang lebih tinggi, dan perpindahan dari 16 ke 10 dan sekarang manufaktur 7 nm dengan 5 nm untuk diikuti. Sekitar 1,8x kenaikan roadmap telah dicapai pada tahun lalu, dan Cortex-A77 memberikan sekitar 20 persen peningkatan IPC lebih lanjut. Ini menempatkan kami pada jalan yang baik ke target 2.5x Arm, meskipun perangkat seluler dengan daya terbatas dan anggaran termal tidak mengharapkan untuk melihat semua keuntungan ini.


Sebagai perbandingan, Cortex-A76 tahun lalu memberikan peningkatan sekitar 30-35 persen dibandingkan Cortex-A75. Tahun ini kami melihat kenaikan 20 persen IPC yang lebih teredam, namun masih signifikan, antara A77 dan A76. Ini adalah kabar baik karena ini berarti lebih banyak kinerja sambil tetap berpegang pada kendala termal dan daya yang sama seperti sebelumnya. Yang menarik adalah bahwa A77 sekitar 17 persen lebih besar dari A76, sehingga akan sedikit lebih mahal dalam hal area silikon. Jika Anda ingin perbandingan dengan para pemimpin desktop, AMD mengelola peningkatan IPC 15 persen antara Zen2 dan Zen +, sementara IPC Intel tetap statis selama bertahun-tahun.Tentu saja kita berbicara segmen pasar yang berbeda di sini, tetapi ini menunjukkan bagaimana tim desain CPU Arm telah membuat keuntungan yang mengesankan dalam generasi terbaru.

Peningkatan kinerja 20% ditawarkan untuk SoCs berbasis-gen Cortex-A77 berikutnya


Hal yang dapat diambil di sini adalah bahwa A76 menandai perubahan mikroarsitektur besar dengan keuntungan kinerja yang sangat besar, sementara kami kembali ke peningkatan tingkat optimasi dengan A77. Dengan itu, mari selami apa yang baru di Arm Cortex-A77.

Cortex-A77 dibangun di atas arsitektur mikro A76

Kunci untuk memahami perbedaan antara Cortex-A77 dan A76 adalah memahami apa yang dimaksud dengan desain inti "lebih luas". Pada dasarnya, kami berbicara tentang kemampuan untuk mengeksekusi lebih banyak instruksi untuk setiap siklus clock, yang meningkatkan throughput inti. Ada dua bagian penting untuk mendapatkan hak ini - meningkatkan jumlah unit eksekusi untuk melakukan pemrosesan dan memastikan bahwa unit-unit ini terpelihara dengan baik dengan data. Mari kita mulai dengan bagian terakhir dan fokus dalam pengiriman, cache, dan bagian prediktor cabang dari SoC.

Cortex-A77 melihat dorongan 50 persen untuk mengirimkan lebar, hingga enam instruksi per siklus dari empat dengan A76. Itu berarti lebih banyak instruksi menuju inti eksekusi untuk setiap siklus clock untuk potensi kinerja yang lebih besar. Sebagai akibatnya, jendela eksekusi out-of-order juga lebih besar, meningkat menjadi 160 entri untuk mengekspos lebih banyak paralelisme. Ada cache instruksi 64K yang sudah dikenal, sementara Branch Target Buffer (BTB), yang menyimpan alamat untuk prediktor cabang, adalah 33 persen lebih besar dari sebelumnya untuk menangani pertumbuhan dalam instruksi paralel. Tidak ada yang aneh di sini, pada dasarnya versi yang lebih luas dari desain tahun lalu.

Penambahan front-end yang lebih menarik adalah cache MOP 1.5K yang semuanya baru, yang menyimpan makro-ops (MOP) yang diumpankan kembali dari unit decode. Arsitektur CPU Arm menerjemahkan instruksi dari aplikasi pengguna ke dalam operasi makro yang lebih kecil dan kemudian turun ke dalam operasi mikro yang dipahami oleh inti eksekusi. Anda dapat melihat ini pada diagram di atas di bagian decode. Cache MOP digunakan untuk mengurangi penalti biaya dari cabang dan flush yang terlewatkan, karena Anda tetap menggunakan makro-ops daripada mendekode lagi, dan meningkatkan throughput keseluruhan inti. Mengambil dari MOP daripada i-cache melewati tahap decode, menghemat satu siklus. Arm menyatakan bahwa cache MOP dapat mencapai tingkat hit 85 persen atau lebih di berbagai beban kerja, membuatnya menjadi tambahan yang sangat berguna untuk i-cache standar.

Pindah ke bagian inti eksekusi CPU, perhatikan penambahan ALU keempat dan unit Cabang kedua. ALU keempat ini meningkatkan bandwidth umum angka pengolah sebesar 50 persen. ALU tambahan ini mampu instruksi dasar satu siklus (seperti ADD dan SUB) ditambah operasi integer dua siklus seperti perkalian. Dua ALU lainnya hanya dapat menangani instruksi dasar satu siklus, sedangkan unit akhir diisi dengan operasi matematika yang lebih maju seperti divisi, multiply-akumulasi, dll. Unit cabang kedua di dalam inti eksekusi menggandakan jumlah cabang simultan melompat dari core dapat menangani, yang berguna dalam kasus di mana dua dari enam instruksi yang dikirim adalah lompatan cabang. Ini terdengar sedikit aneh, tetapi pengujian internal di Arm mengungkapkan manfaat kinerja dari mengadopsi unit kedua ini.

Cortex-A77 menawarkan paralelisme yang lebih baik dan pandangan baru tentang cache yang diambil sebelumnya

Perubahan lain pada inti CPU termasuk penambahan pipa enkripsi AES kedua. Pipa data-store sekarang memiliki fitur port masalah khusus untuk menggandakan bandwidth masalah memori. Port-port ini sebelumnya dibagi dengan ALU, yang kadang-kadang bisa menjadi hambatan. Ada juga penyempurna data generasi berikutnya untuk meningkatkan efisiensi daya sekaligus meningkatkan bandwidth ke sistem DRAM.

Bagian dari sistem ini di Cortex-A77 juga dilengkapi sistem prefetch "sadar-sistem" yang semuanya baru. Ini meningkatkan kinerja memori berdasarkan berbagai jumlah inti CPU, kapasitas dan latensi cache, dan konfigurasi sub-sistem memori di dalam perangkat final. Perangkat keras yang didedikasikan untuk berbicara dengan Unit Penjadwalan Dinamis (DSU) sebagai bagian dari cluster CPU DynamIQ, yang memantau penggunaan cache L3 bersama. Inti fitur Jarak dinamis dan tingkat agresivitas untuk mengurangi pemanfaatan cache dalam situasi di mana bandwidth L3 dibatasi oleh core CPU lainnya. Core berkinerja lebih tinggi seperti Cortex-A77 lebih cenderung menjenuhkan akses DSU ke memori, sementara core dengan daya yang lebih rendah seperti A55 tidak mungkin.

Menyatukan semuanya

Ada banyak perubahan kecil pada Cortex-A77 yang menambah beberapa perbedaan substansial pada pendahulunya. Singkatnya, cache MOP A77 yang baru dikombinasikan dengan jendela instruksi yang lebih luas dan lebih panjang membantu menjaga unit ALU, Cabang, dan memori yang disibukkan dengan hal-hal yang harus dilakukan. Desain pembangkit tenaga Cortex-A76 telah diperluas untuk meningkatkan throughputnya lebih jauh dengan A77, tanpa mengandalkan kecepatan clock yang lebih tinggi.

Peningkatan kinerja terbesar hingga Cortex-A77 tiba dalam bentuk integer dan floating point math. Ini dikonfirmasi oleh tolok ukur internal Arm, yang menampilkan peningkatan kinerja 20 hingga 35 persen di masing-masing benchmark integer dan floating point. Peningkatan bandwidth memori berada di suatu tempat antara 15 dan 20 persen, sekali lagi menyoroti bahwa perolehan terbesar datang dalam bentuk angka-angka. Secara keseluruhan, perbaikan ini memberikan A77 rata-rata peningkatan 20 persen dari generasi sebelumnya. Kita juga dapat melihat beberapa kenaikan lebih lanjut, lebih marginal sebagai hasil dari proses manufaktur 7nm yang lebih maju akhir tahun ini atau pada awal 2020.

Dalam hal smartphone, SoC bertenaga Cortex-A77 ditakdirkan untuk produk unggulan berperforma tinggi. Arm sepenuhnya berharap untuk melihat desain pembangkit tenaga listrik memanfaatkan 4 + 4 bit. Pengaturan inti SEDIKIT. Mengingat peningkatan throughput dan sedikit benturan ke ukuran area A77, kita mungkin akan melihat desainer SoC melanjutkan tren 1 + 3 + 4 atau 2 + 2 + 4. Dengan satu atau dua core besar yang kuat dengan cache yang lebih besar dan jam yang lebih tinggi, didukung oleh 2 atau 3 core A77 dengan ukuran cache yang lebih kecil dan jam yang lebih rendah untuk menghemat daya dan area. Pada akhirnya, Cortex-A77 mengeja hal-hal baik untuk chip smartphone dan pasar yang terus berkembang untuk laptop berbasis Arm yang selalu terhubung. Mengawasi pengumuman silikon akhir tahun ini.

udah waktunya Pick Plan, tapi hari ini ini adalah keepakatan Flex Leae terbaru dari print yang menarik perhatian kami.Kami menyukai item Flex Leae. Tentu Anda tidak benar-benar memiliki telepon, tetap...

elamat datang kembali di Pilihan Pilihan, di mana kami memberi tahu Anda tentang beberapa yang terbaik dari ponel dan paket penawaran yang menyentuh paar....

Publikasi Segar