Una mirada más cercana a la tecnología de gráficos Mali de ARM
Smartphones y tablets premium de hoy están empujando los límites de las unidades de procesamiento gráfico de factor de forma pequeño (GPU), que cuenta con la consola de gráficos de calidad a resoluciones de pantalla superiores a la mayoría salón TV. Pero no es sólo el espacio móvil de gama alta que requiere hardware de gráficos dedicados en estos días. Creciendo mercados para smartwatches y cajas Smart-TV compactos también hacen uso de la GPU. Una de las GPU móviles más frecuente oscila es Mali de ARM, y tuvimos la suerte de ser dado una mirada más cercana a los planes futuros para la gama de GPU Mali en Tech Day 2015 semana pasada de ARM.
Más recientemente, ARM anunció su eficiencia energética Mali-T880 y T860 para los dispositivos móviles de gama alta, y su T820 y T830 diseños para las implementaciones rentables. El T880 cuenta con 1,8 veces el máximo rendimiento de su diseño Mali-T760, junto con una reducción del 40 por ciento en energía para las mismas cargas de trabajo y apoyo a la ultra-alta resolución 4K contenido.
ARM no ha descartado un diseño Mali-450 modificado para llevar encima de baja potencia o bien, si los OEM exigen.
En el extremo inferior, que suele ser limitado por los costos de silicio, el T830 y T820 tienen como objetivo reducir el tamaño del área de morir hasta en un 50 por ciento respecto al T622, ofrecen escalado para una variedad de aplicaciones, y aún soportan hasta al día de gráficos y API de cómputo, tales como OpenGL ES 3.1 y Microsoft DirectX 11.1. De hecho, el Mali-T820 es ahora el más pequeño de OpenGL ES 3.0 diseño compatible con ese brazo tiene.A pesar de la introducción de los nuevos diseños de la GPU, los chips de legado como el Mali-450 siguen siendo muy adecuado para aplicaciones exigentes de menos de rendimiento, tales como llevar encima. Con el apoyo bien establecido, este diseño podría quedarse por un buen rato. ARM no ha descartado un diseño Mali-450 modificado para llevar encima de baja potencia o bien, si los OEM exigen.
Resumen Midgard Arquitectura
Últimos diseños de ARM están siendo construidos en su arquitectura Midgard Tri-pipe, que albergan la mayoría, pero no todos los componentes clave de la GPU dentro del "núcleo de sombreado", lo que permite el escalado de rendimiento simplemente ajustando el número de núcleos. La mayoría de los otros diseños de la GPU no adoptar diseños qué escala de esta manera, pero esto permite ARM para apuntar a una gama de usos de los casos con diseños muy similares.
En la gama alta, el Mali-T860 cuenta con 3 ALU por núcleo de sombreado, en comparación con el T860 y T760 de 2 ALU por núcleo, junto con las de carga / tienda y textura unidades. Este adicional ALU ofrece una mejora de hasta 50 por ciento en el rendimiento informático por núcleo. Tanto los diseños T880 y T860 se pueden ampliar, desde individuales hasta 16 implementaciones básicas coherentes, dependiendo del nivel de rendimiento requerido por la GPU.
Con el móvil, los mayores factores limitantes para el rendimiento y el poder vienen de la memoria. En pocas palabras, el ancho de banda disponible es mucho menor que la consola o gráficos de escritorio equivalentes, lo que significa que el rendimiento puede ser un cuello de botella por la memoria. Para superar este problema, ARM hace uso de ASTC, AFBC, Composición inteligente, y las técnicas de eliminación de transacciones, optimiza su arquitectura para cargas de trabajo comunes, tales como tareas de interfaz de usuario, y trata de reducir el número de transacciones de memoria mediante el envío de información de mayor calidad. Esta es también la razón por ARM implementa representación basada azulejo, como el mosaico activo de la trama se mantiene en la memoria local el mayor tiempo posible, en lugar de ser empujado a la memoria principal más lenta.
Dicho llanamente:
- ALU - Unidades lógicas aritméticas son circuitos digitales utilizados para realizar entero matemáticas y la lógica bit a bit.
- Baldosa Rendering - rompe una escena hacia abajo en las baldosas más pequeñas, que luego pueden ser prestados por separado a la memoria en el chip.
- Transacción Eliminación - Reduce el procesamiento saltarse azulejos duplicados desde el marco anterior.
- AFBC - Frame Buffer ARM compresión ahorra ancho de banda de la memoria mediante el almacenamiento de un fotograma utilizando la compresión sin pérdidas.
No sólo eso, sino que la escritura y la lectura constante de la memoria es una tarea costosa energía, consumiendo algún lugar alrededor de 100 mW de potencia de 1 Gbps de ancho de banda con LPDDR4. En cambio, ARM sugiere que los fabricantes de silicio pasan un poco más de espacio en la memoria caché para reducir el consumo de energía y ayudar a mantener tantos datos como sea posible en la GPU.
La mayoría de los otros diseños de la GPU no escalan de esta manera, pero esto permite a ARM para apuntar a una gama de usos de los casos
Hablando de poder, ARM también ha hecho un montón de trabajo para optimizar sus últimos procesadores gráficos para la eficiencia energética en el desempeño de las tareas más comunes. La mayor parte de este cae bajo empujando píxeles alrededor mientras el usuario se desplaza a través de la interfaz de usuario, que, lo creas o no, requiere de procesamiento de gráficos. Esas transiciones suaves pantalla de inicio no son libres.El T830 y T820 extremo inferior heredan muchas de estas características de gama alta, pero las tuberías con unidades escalares se han eliminado de la ALU. El T830 cuenta con 2 ALU por núcleo, mientras que la T820 cuenta con una sola, y puede tanto ser escalado hasta GPUs núcleo 4 de sombreado.
Al igual que el nuevo CPU ARM Cortex-A72, la última iteración de Malí se centra claramente en la eficiencia energética y extraer más rendimiento mientras se pegue dentro del poder apretado y limitaciones térmicas de plataformas móviles. Al reducir los requisitos de memoria y de potencia, los socios de silicio deben tener libertad para empacar en núcleos GPU adicionales y por lo tanto aumentar el rendimiento a través de generaciones anteriores.
El futuro de Malí
Hablando de la energía, el cambio a procesos FinFET 16nm también es seguro que resultará en ganancias decentes para los diseños de la GPU. Con el consumo de energía y tamaños de diseño tanto reduciendo, socios de silicio de alta gama de ARM podrán exprimir núcleos shader adicionales en sus diseños SoC, como ya hemos visto ocho Mali-T760 14nm núcleo de Samsung Exynos 7420. En el mercado de menor costo, GPU huellas más pequeñas o bien podría utilizarse para aumentar el recuento de núcleo o ahorrar en costos de silicio cada vez más caros.
Hemos anteriormente también cubrimos la necesidad de ancho de banda de memoria adicional para las cámaras de alta resolución y pantallas, pero este ancho de banda adicional y el consumo de energía asociado podría ser una gran carga para las baterías. Técnicas de ahorro de memoria de ARM y optimizaciones generales también podrían pagar dividendos ya que los mercados móviles empujan hacia aún más alto contenido de resolución.
Con ARM ofreciendo paquetes completos POP-IP ya diseñados para la fabricación FinFET 16 nm, bien podríamos ver algunas SoC basados en Malí eficientes y poderosos más energía llegará al mercado a finales del 2016.