Total de visualizações de página

sexta-feira, 1 de abril de 2016

Entendendo o Ivy Bridge


Introdução

Seguindo o lançamento do Sandy Bridge, o Ivy Bridge marca mais um "tick" da Intel, mantendo a mesma arquitetura básica, mas agora migrando para uma técnica de produção de 22 nm com o uso de transistores tri-gate (3d), contra os 32 nm com transistores regulares do Sandy Bridge. Apesar de a arquitetura do processador ter pouco mudado, o Ivy Bridge introduziu uma nova GPU, o que explica o processador ter agora 1.4 bilhões de transistores, contra os 1.16 do Sandy Bridge.
A melhoria na GPU é considerável em relação à geração anterior, suficiente para tornar o Ivy Bridge mais competitivo em relação às APUs da AMD no departamento gráfico. Nos desktops a melhoria pode não parecer tão significativa, já que em geral os usuários que pagam mais caro por um Core i5 ou i7 são os mesmos que também optarão pelo uso de uma GPU dedicada, mas uma GPU mais rápida é muito significativa no mercado móvel, onde não existe uma forma simples de upgrade. Como hoje em dia os notebooks respondem pela maior parte das vendas, a nova GPU do Ivy Bridge acaba sendo um avanço importante, permitindo que mais usuários de notebooks tenham um desempenho "bom o suficiente" em jogos e aplicativos de renderização, sem falar na possibilidade de converter vídeos sem acabar com a carga da bateria, graças à conversão via hardware.
Vendo o diagrama de blocos do Ivy Bridge é fácil entender onde foram os 240 milhões de transistores adicionais em relação ao Sandy Bridge. Embora o restante do processador quase não tenha mudado, o processador gráfico ficou muito maior, ocupando agora quase tanto espaço quanto os núcleos de processamento propriamente ditos:
As unidades programáveis (EUs) dentro da GPU receberam grandes melhorias, oferecendo um IPC quase duas vezes superior ao que tínhamos no Sandy Bridge. Além disso, o Ivy Bridge incorpora 16 EUs (contra 12 do Sandy Bridge). Entretanto, ao contrário do que seria de se esperar, a Intel optou por reduzir sutilmente o clock da GPU (em vez de aumentá-lo, como seria de se esperar com a migração para os 22 nm), com o objetivo de manter o consumo sob controle. Apesar disso, mas melhorias na arquitetura fazem com que o desempenho do vídeo seja consideravelmente superior ao que tínhamos no Sandy Bridge.
A GPU incorporou suporte ao DirectX 11, suporte a até três displays independentes, suporte ao OpenCL e ao DirectCompute (permitindo que o processamento da GPU seja aproveitado por aplicativos que suportam algum dos dois padrões), um pequeno cache L3 dedicado de 256 KB, dentro da própria GPU (que além dele continua tendo acesso ao L3 principal em regime compartilhado) e um conversor mais rápido, trazendo melhoras também na conversão de vídeos através do Quick Sync.
A nova GPU foi batizada de "HD Graphics 4000" pela Intel, e assim como na família anterior, vem em duas versões, de acordo com o modelo. A GT2 (HD 4000) é a versão completa, com todas as EUs ativas, enquanto a GT1 (HD 2500) é uma versão capada, com apenas 8 EUs. Devido ao clock default relativamente baixo, as duas versões oferecem uma boa margem de overclock, que permite reduzir a diferença em relação ao Llano.
Por ser apenas um "tick" do Sandy Bridge, o Ivy Bridge mantém os mesmos 4 núcleos e o mesmo cache L3 compartilhado de 8 MB, acessado através do mesmo barramento de anel compartilhado introduzido no Sandy Bridge. O cache é dividido em 4 módulos de 2 MB, o que permite que a Intel desabilite seções individuais de acordo com os modelos. Assim como no Sandy Bridge, os modelos com 4 núcleos virão com os 8 MB completos, enquanto modelos de baixo custo ou com apenas 2 núcleos virão com apenas 6, 4 ou 2 MB. A configuração dos caches L1 e L2 também não mudou, sendo mantido o mesmo L1 de 64 KB (32 para dados e 32 para instruções) e o L2 de 256 KB por núcleo.
Não houve mudanças no número de unidades de execução por núcleo, mantendo as mesmas 4 instruções por ciclo, que podem ser compartilhadas entre dois threads com o uso do HyperThreading. Entretanto, o DSB Queue e outras estruturas que antes eram estaticamente alocadas podem ser ser agora compartilhadas dinamicamente, permitindo que um único thread ocupe uma percentagem maior dos recursos do processador, reforçando o desempenho em aplicativos single-thread. Houve também um upgrade nas unidades responsáveis por operações de divisão tanto em inteiros quanto em ponto flutuante, que agora oferecem um throroughput duas vezes maior. As operações de divisão não são tão comuns quanto as de soma e multiplicação, por isso o ganho em situações reais é apenas marginal, mas de qualquer forma é uma evolução. Outra pequena melhora é que operações MOV são agora executadas no estágio de registry renaming, no front-end do processador (em vez de precisarem ser realmente executadas), liberando as unidades de execução para o processamento de outras instruções. O Ivy Bridge inclui também um gerador de números aleatórios, uma função que melhora a segurança da geração de chaves de encriptação.
O Ivy Bridge recebeu suporte a memórias DDR3L, um padrão de memórias DDR3 de baixo consumo, que usa tensão de 1.35V em vez dos 1.5V padrão, uma redução considerável, útil no caso dos notebooks. O Ivy Bridge ganhou também a possibilidade de desligar a interface DDR3 nos momentos de inatividade, resultando em um pequeno ganho adicional. Este era um dos poucos componentes que não podia ser desligado até o Sandy Bridge.
Os modelos iniciais do Ivy Bridge incluem:
Core i7-3770K: 4 núcleos, 8 threads, 3.5 GHz (turbo 3.9 GHz), 8 MB de L3, HD 4000, 77W
Core i7-3770: 4 núcleos, 8 threads, 3.4 GHz (turbo 3.9 GHz), 8 MB de L3, HD 4000, 77W
Core i5-3570K: 4 núcleos, 4 threads, 3.4 GHz (turbo 3.8 GHz), 6 MB de L3, HD 4000, 77W
Core i5-3550: 4 núcleos, 4 threads, 3.3 GHz (turbo 3.7 GHz), 6 MB de L3, HD 2500, 77W
Core i5-3450: 4 núcleos, 4 threads, 3.1 GHz (turbo 3.5 GHz), 6 MB de L3, HD 2500, 77W
Core i7-3770S: 4 núcleos, 8 threads, 3.1 GHz (turbo 3.9 GHz), 8 MB de L3, HD 4000, 65W
Core i7-3770T: 4 núcleos, 8 threads, 2.5 GHz (turbo 3.7 GHz), 8 MB de L3, HD 4000, 45W
Core i5-3550S: 4 núcleos, 4 threads, 3.0 GHz (turbo 3.7 GHz), 6 MB de L3, HD 2500, 65W
Core i5-3450T: 4 núcleos, 4 threads, 2.8 GHz (turbo 3.5 GHz), 6 MB de L3, HD 2500, 65W
Veja que todos os chips da série i5 com o Ivy Bridge vêm com o HyperThreading desabilitado, tornando o recurso uma exclusividade dos chips da série i7. Quando forem lançados, os processadores da série i3 virão com o HyperThreading (oferecendo 4 threads, como o i5, mas com apenas dois núcleos), mas eles carecerão do Turbo, limitando ainda mais o desempenho em relação aos modelos mais caros. Como de praxe, apenas os modelos da série K oferecem o multiplicador destravado, os demais podem ser overclocados apenas através da frequência base (o BLCK), o que limita os overclocks a 7% ou menos.
Embora as frequências limite sejam basicamente as mesmas que nos modelos anteriores, o Turbo Boost atua de forma um pouco mais agressiva no Ivy Bridge, permitindo um aumento de até 200 MHz em todos os modelos com os 4 núcleos ativos, mantendo também dois dos núcleos ativos por uma faixa de frequência mais alta antes de chavear para um único núcleo. Este é um dos fatores por trás do aumento de desempenho dos novos modelos em relação aos baseados no Sandy Bridge.
É importante ter em mente também a diferenciação das GPUs. Se você está comprando um notebook ou não pretende usar uma GPU dedicada, é importante escolher um modelo com a HD 4000, já que o desempenho da HD 2500 é bem inferior, próximo ao oferecido pelos modelos baseados no Sandy Bridge. Independentemente do processador ser da série K ou não, a GPU pode ser overclocada.
Em termos de desempenho, o Ivy Bridge oferece ganhos modestos em relação a um Sandy Bridge do mesmo clock. Em diferentes testes, o i7-3770K é consistentemente de 4 a 8% mais rápido que o Core i7-2600K baseado no Sandy Bridge (que opera a uma frequência 100 MHz inferior), embora perca para os modelos baseados no Sandy Bridge-E (de 6 núcleos) em aplicativos multi-thread. Você pode ver alguns números nos links a seguir:
Apesar do grande aumento no poder bruto de processamento, a HD 4000 é capaz de oferecer um FPS apenas 35 a 55% superior na grande maioria dos jogos, uma vez que o desempenho em cenários real é limitado também por outros fatores, especialmente o barramento com a memória. Jogadores exigentes vão continuar torcendo o nariz, mas o desempenho já é suficiente para rodar a maioria dos títulos atuais a 1366x768 (a resolução padrão dos notebooks atualmente) com um FPS na casa dos 30 a 60 quadros, o que é satisfatório para jogadores casuais. Mesmo o pesado Battlefield pode ser jogado a 37 FPS a 1366x768 com baixa qualidade.
Apesar das melhorias, a HD 4000 continua bem atrás da Radeon HD 6550D do Llano em praticamente todas as tarefas, em geral oferecendo apenas 55 a 65% do FPS entregado pela concorrente. É possível reduzir bastante a diferença via overclock, mas mesmo assim o Llano continua sendo mais rápido em jogos, apesar de contar com uma CPU bem mais simples.
O destaque fica por conta do consumo elétrico mais baixo e da melhoria do desempenho da GPU, que tornam o Ivy Bridge um processador bem mais competitivo nos notebooks. Nos desktops, por outro lado, ele não é um upgrade tão suculento, já que o ganho por clock é modesto e as margens de overclock são menores, como veremos a seguir. 

Nenhum comentário:

Postar um comentário