Coolidge™ est la troisième génération de processeurs intelligents MPPA® de Kalray, dédiés au traitement intensif des données. Coolidge™ est nativement capable de gérer plusieurs charges de travail en parallèle sans aucun goulot d'étranglement et permettre ainsi des applications plus intelligentes, plus efficaces et plus économes en énergie.
Tirant pleinement parti de l'architecture MPPA® (Massively Parallel Processor Array) brevetée de Kalray, Coolidge™ est un processeur évolutif comprenant 80 cœurs et conçu pour le traitement intelligent des données. Il offre une alternative unique aux GPU, ASIC ou FPGA, apportant une valeur unique à de multiples applications, des data centers, au Edge, en passant par les systèmes embarqués.
- Calcul haute performance : évolutivité des performances au sein d'une puce, d'une puce à l'autre, de plusieurs puces.
- Traitement multiple hétérogène en parallèle : Exécution en parallèle de dizaines de tâches critiques hétérogènes, y compris l'inférence IA.
- Facilité de programmation : C/C++ / Open CL™ / Linux / POSIX / RTOS
- Traitement des données en temps réel : E/S haute vitesse, architecture de type RDMA
- Efficacité énergétique
- Sécurité/Sûreté : Déterminisme, absence d'interférence, démarrage sécurisé
Cas d'utilisation
-
Cas d'utilisationDéveloppez des systèmes de stockage et de réseau de nouvelle génération
Facilité d'intégration dans les baies de dernière génération PCIe Gen4, 100GbE :
- JBOF Target controller, I/O controller, SmartNIC, SmartSSD
- 2 configurations: stand-alone ou x86 CPU offloading
- Support virtualized, containerized or bare metal infrastructures
- Dynamic resource allocation for Control, Data & Management Planes
.Accélération des protocoles, services et QoS haute performance :
- Protocoles NVMe-oF, RoCE/RDMA, TCP/IP, NVMe, OVS/NFV
- Smart Load-Balancer, Priority Flow Control, Stateless L1-L4 parsing
- RAID6: 154 Gbit/s Erasure Coding (Reed-Solomon) per cluster
- Line-rate encryption/decryption/hash (IPSEC, TLS, XTS, MACsec)
- AI capability for analytics and adaptive configuration -
Cas d'utilisationCréer des applications accélérée, à forte intensité de calcul
Accélération des charges de travail complexes :
- Patented core + co-processor boosting Machine Learning Inference
- Computer Vision
- Signal Processing (e.g. FFT), Cryptography, Mathematics
.Construire des systèmes embarqués autonomes et intelligents :
- Multi-OS (Linux, RTOS) systems
- Support ”Freedom from Interference” for mixed criticality
.Construire des systèmes de nouvelle génération pour le Edge Computing :
- Process Data at the Intelligent Edge
- Real-time analytics for automation, prediction, and control
- Easy integration into existing systems
. -
Cas d'utilisationAvec les processeurs MPPA®, les possibilités sont infinies et vous permettent d'innover sans limites.
Propulsé par 80 cœurs, le processeur MPPA® est une nouvelle génération de processeurs intelligents, doté de capacités uniques en termes de programmabilité, de performances, d'exécution parallèle de plusieurs tâches essentielles, d'efficacité énergétique, de sûreté et de sécurité. Notre technologie MPPA® révolutionnaire ouvre la voie à une nouvelle ère du traitement des données.
.Le type de processeur intelligent qui vous donne le pouvoir d'en faire plus. Plus pour accélerer des secteurs en développement rapide, des réseaux de télécommunication 5G aux véhicules autonomes, en passant par les équipements de santé, l'industrie 4.0, les drones et les robots... et plus encore !
Téléchargements
Technical Corner
-
Architecture 80 coeurs
CORE
64-bit/32-bit architecture From 600MHz to 1.2 GHz 6-issue VLIW 16KB instruction cache / 16KB data cache with MMU IEEE 754-2008 Floating Point Unit (FPU) Square root and reciprocal operations in floating single precision 64-bit integer multiplication (Asymmetric cryptography) Up to 4 execution rings Up to 256-bits per cycle Load/Store CO-PROCESSOR (ONE PER CORE)
Acceleration of INT8, INT16 or FP16 accuracy Up to 128 MAC per cycle CLUSTER
16 Application Cores + 1 Management/Security Core 4 MB of Memory / L2 Cache – 600GB/s Low Latency / High Speed Configurable cluster/chip cache coherency & deterministic modes SYSTEM-ON-CHIP
5 clusters (total of 80 Application Cores + 5 Management Cores) Up to 1.15 TFLOPs (SP) / 384 GFLOPs (DP) Up to 3 TFLOPs (16 bits) / 25 TOPs (8bits) for deep learning 56GB/s chip-to-chip communications (16 +12.5) x 2 -
Interface PCIe Gen4
16-lane PCIe GEN4 Endpoint (EP) or Root Complex (RC) Bifurcation up to 8 downstream ports in RC mode SR-IOV up to 8 Physical Functions / 248 Virtual Functions Address translation and protection Up to 2048 MSI-X & 64 MSI interrupts Support for Hot Plug Up to 512 DMAs for multi queues / kernel bypass drivers Direct PCIe-to-clusters and PCIe-to-DDR transfers Support for NVMe and VIRTIO emulation -
Interface LPDDR4/DDR4
64-bit DDR4/LPDDR4-3200 channels with sideband/inline ECC Up to two ranks per DDR4 Channel 2 DDR channels (up to 32GB) with channel interleaving -
Interface 2x100GbE Ethernet
8x1/8x10/8x25/2x40/4x50/2x100 GbE RDMA over Converged Ethernet (RoCE v1 and v2) Jumbo Frame Support (9.6KB) Support for PTP/IEEE 1588v2 Priority Flow Control (PFC), IEEE 802.1Qbb Checksum offload Header & Payload Line rate packet classification/smart load balancing Hash & Round-robin based dispatch policy -
Securité
Secure Boot with authentication & encryption True Random Number Generators (TRNG) RSA, Diffie-Hellman, DSA, ECC, EC-DSA and EC-DH acceleration -
Accélérateurs de cryptographie (option)
AES-128/192/256 (ECB/CBC/ICM/CTR/GCM/GMAC/CCM) AES-XTS for storage application MD5/SHA-1, SHA-2, SHA-3 Kazumi/Snow 3G, ZUC -
Gestion/Controle des interfaces
GPIOs/UARTs/SPI/I2C/CAN/PWM SSI Controller for serial NOR Flash with optional boot SDCARD UHS-I / eMMC 4.51 memory controller 2x USB 2.0 OTG ULPI JTAG IEEE 1149.1 16-bit Parallel Trace Interface -
Sûreté & prédictabilité
Mix criticality support Lockable critical configuration Capability to bank memory and caches for non-interference
& time-predictable executionL1 Cache coherency enabling/disabling