Tegra X1 - una mirada más cercana a "superchip" de Nvidia

Tegra_X1_Die

Uno de los primeros anuncios de CES 2015 fue NvidiaHay de nuevo Tegra SoC X1, sucesor del gigante de gráficos para su bastante bueno Tegra K1. Con la última casa de máquinas ARM Cortex-A57 y A53 CPU combo y la tecnología GPU de Nvidia Maxwell, SoC primera 20nm de la compañía parece ser lo más eficiente de la energía, ya que es de gran alcance. Vamos a profundizar un poco más en lo que el Nvidia Tegra X1 tiene para ofrecer.

CPU

La primera cosa que usted probablemente ha notado sobre el X1 Tegra es que Nvidia parece haber abandonado su personalizado de 64 bits arquitectura de CPU de Denver, como se encuentra en el Nexus Tegra K1 de 9, y ha vuelto a un ARM más estándar de 64 bits configuración. Eso no quiere decir que este chip no es interesante, Nvidia será de los primeros en poner A57 corteza octa-core y A53 SoC, dispuestos en dos grupos de cuatro, al mercado. Este diseño es similar a Qualcomm de próxima Snapdragon 810 y Samsung existentes Exynos 5433.

Ficha x1 Tegra

Hay un par de razones por Nvidia podría haber optado por volver a los diseños de ARM. Sí Nvidia afirma que el mercado de tiempo-a-es la razón principal, lo que sugiere que la reducción de su diseño de CPU Denver a 20nm era más tiempo que recoger y ajustar un diseño ARM. Como alternativa, quizás Nvidia no fue convencido por los resultados de rendimiento de su CPU costumbre, aunque se ha dado a entender que Denver puede reaparecer en un SoC futuro. De todos modos, vamos a echar un vistazo a lo que Nvidia ha hecho con diseños de referencia de ARM.

Diseño X1 Tegra

El A57 clúster CPU de gama alta tiene 2 MB de caché L2 compartida a través de los cuatro núcleos, junto con la instrucción 48KB L1 y cachés de datos de 32 KB L1. Los cuatro de energía CPU A53 eficiente cuota de 512 KB de caché L2 y tiene dos cachés L1 de 32KB para instrucciones y datos.

A medida que el diseño de múltiple núcleo de la CPU indica, el chip de Nvidia opera como un diseño Big.little con el fin de compartir las cargas de trabajo de manera más eficiente a través de los núcleos de la CPU más adecuadas. Sin embargo, Nvidia ha optado por su propia interconexión costumbre, en lugar de CCI-400 de ARM, y la migración de clúster, en lugar de la programación de tareas mundial, para abrir los ocho núcleos para su uso a la vez.

Nvidia pregona que su diseño de interconexión supera significativamente de Samsung Sistema LSI utiliza en los Exynos 5433, que cuenta con 1,4 veces más rendimiento por la misma cantidad de poder o la mitad de la energía requerida para producir el mismo nivel de rendimiento. Esto es en parte a la coherencia de caché, lo que reduce las penas de potencia / rendimiento por lo general asociados con la migración clúster. Nvidia también ha decidido utilizar su propio sistema de administración de energía Diseño Sistema eléctrico punto de estrangular y reloj puerta de velocidades, en lugar de ARM en la casa Función de asignación inteligente de la energía.

Aunque el X1 Tegra ha vuelto a un diseño de CPU ARM, Nvidia claramente cree que sus propias personalizaciones pueden mejorar en la fórmula ARM estándar.

GPU

La nueva tecnología también se abre paso en el aspecto de la GPU de última SoC de Nvidia. El Tegra X1 de nuevo cuenta con una arquitectura de gráficos de propiedad de Nvidia, aunque esta vez el SoC está empacando última arquitectura Maxwell de la compañía, que alimenta el alto de gama GTX 980 gama de tarjetas gráficas, así como el increíblemente eficiente de energía GTX 750Ti.

Tegra referencia X1

Tome propios puntos de referencia de Nvidia con una pizca de sal, pero el X1 parece ofrecer al menos un 50 por ciento impulso adicional sobre el K1.

Tegra X1 Maxwell GPU

Nvidia afirma haber duplicado el rendimiento de la GPU y reducido a la mitad los requisitos de energía del chip en comparación con el Tegra K1. Puntos de referencia de Nvidia sugieren que esta eficiencia energética ha sido arado hacia atrás en el aumento de rendimiento, lo que significa que la GPU de la X1 es todavía probable que sea el poder bastante hambre. Al igual que el Tegra K1, el X1 es, probablemente destinado a productos de la tableta, donde los fabricantes pueden exprimir en una cierta capacidad de batería adicional.

El diseño de GPU ha cambiado un poco en comparación con la última generación, con dos Maxwell SMM (Streaming multiprocesadores) para un total de 256 núcleos CUDA, en comparación con una sola Kelper SMX y 192 núcleos CUDA en el Tegra K1. Aunque el número de núcleos CUDA puede no haber doblado, Nvidia afirma que un Maxwell SMM es hasta un 40 por ciento más eficiente que un viejo Kepler SMX. Por otra parte, el paso a dos completos SMM significa que importantes unidades de geometría y texturas se han duplicado.

Nvidia también ha cuadruplicado el número de ROP a 16 y ha añadido una caché de 256KB L2 entre las ROP y la interfaz de memoria de 64 bits, lo que debería ayudar a la GPU conducir esas pantallas de mayor resolución. Mejoras generales de memoria también jugarán un papel importante en el rendimiento del Tegra X1 salta a resoluciones más altas, ya que esto es generalmente un área en la que los dispositivos móviles sufren de cuellos de botella.

Hablando de memoria, Nvidia también ha implementado un nuevo y mejorado las características de compresión de memoria en el X1 Tegra, para aliviar aún más las demandas de ancho de banda de DRAM en bus de memoria de 64 bits del chip. La GPU sigue apoyando una serie de OpenGL 4.x y características 11.x DirectX, incluyendo teselación, Recursos de baldosas y Voxel Iluminación Global, asegurando que los clientes móviles de Nvidia pueden aprovechar al máximo los últimos efectos de juego y eficiencias.

Tegra X1 vs Tegra K1

Una característica final importante añadido a la X1 Tegra es el apoyo a "doble velocidad FP16" (operaciones de punto flotante de 16 bits) en núcleos CUDA de la GPU. Normalmente Maxwell sólo presenta núcleos FP32 y FP64, pero Nvidia ha alterado el manejo operación FP16 en el X1, por el que un conjunto limitado de operaciones FP16 puede ser embalado juntos y calcula más de un solo núcleo FP32. Esto no es ideal, pero permitirá Nvidia para competir con sus rivales en situaciones en las operaciones FP16 son importantes. En general, estos cambios se suman a 1024 GFLOPs (1) Tflop rendimiento FP16 y 512 GFLOPs para operaciones FP32.

Conjunto de características

Nvidia no ha ido sin cuartel con su CPU y GPU de diseño. Atar todo el SoC juntos es una interfaz de 64 bits de ancho LPDDR4 memoria que soporta hasta 4 GB de memoria RAM. Ancho de banda de memoria de pico ha sido impulsado hasta 25.6 GB / s, por encima de 14.9GB / s y la eficiencia energética ha mejorado en un 40 por ciento. El Tegra X1 ahora soporta eMMC 5.1 de memoria más rápida lectura y escritura de tarjetas de almacenamiento de alta velocidad.

Tegra X1 Memoria Arquitectura

Vídeo y apoyo pantalla también ha sido golpeado hasta esta generación. El Tegra X1 soporta 4K 60fps H.265, H.264, VP8 VP9 y codificación y decodificación de video, la mejora en los 30fps 4K límite del Tegra K1. Pantallas externas están también apoyaron a 60fps para contenido de vídeo 4K a través de HDMI 2.0 y HDCP 2.2 conexiones. JPEG codificar y decodificar también ha recibido un impulso de velocidad cinco veces, por encima de 120 MP / s a ​​600 MP / s, aunque las otras funciones de ISP aparecen el mismo que el Tegra K1. El ISP dual compatible con 4096 puntos de enfoque, 100 sensores MP y hasta 6 entradas de cámara.

Resumir

El Tegra X1 es una clara mejora respecto a su predecesor y debe proporcionar un salto considerable en el rendimiento de la GPU. Como Qualcomm, Samsung y MediaTek todos se mueven a nuevos diseños de CPU ARM Cortex este año, Nvidia está contando con su destreza gráficos para diferenciarse de la competencia. Tendremos que esperar a tener en nuestras manos el chip para saber a ciencia cierta si el X1 Tegra tiene lo que se necesita para desafiar a jugadores más grandes del mercado móvil, pero el último esfuerzo de Nvidia sin duda se ve como un competidor fuerte este año.


» » » Tegra X1 - una mirada más cercana a "superchip" de Nvidia