Processeurs

Kalray_Banner_MPPA_Manycore_Processor_1920x1080.jpg
Les processeurs MPPA® de Kalray
Un nouveau type de processeurs, spécialisés dans le traitement intelligent des données, pour l'accélération de l'infrastructure, du calcul et de l'intelligence artificielle.

Coolidge™ est la troisième génération de processeurs intelligents MPPA® de Kalray, dédiés au traitement intensif des données. Coolidge™ est nativement capable de gérer plusieurs charges de travail en parallèle sans aucun goulot d'étranglement et permettre ainsi des applications plus intelligentes, plus efficaces et plus économes en énergie.

Tirant pleinement parti de l'architecture MPPA® (Massively Parallel Processor Array) brevetée de Kalray, Coolidge™ est un processeur évolutif comprenant 80 cœurs et conçu pour le traitement intelligent des données. Il offre une alternative unique aux GPU, ASIC ou FPGA, apportant une valeur unique à de multiples applications, des data centers, au Edge, en passant par les systèmes embarqués.

  • MPPA_processor_1920x1318
Principaux avantages du processeur intelligent MPPA®

 

  1. Calcul haute performance : évolutivité des performances au sein d'une puce, d'une puce à l'autre, de plusieurs puces.
  2. Traitement multiple hétérogène en parallèle : Exécution en parallèle de dizaines de tâches critiques hétérogènes, y compris l'inférence IA.
  3. Facilité de programmation : C/C++ / Open CL™ / Linux / POSIX / RTOS
  4. Traitement des données en temps réel : E/S haute vitesse, architecture de type RDMA
  5. Efficacité énergétique
  6. Sécurité/Sûreté : Déterminisme, absence d'interférence, démarrage sécurisé

Cas d'utilisation

  • Datacenter 3840x2160
    Cas d'utilisation

    Développez des systèmes de stockage et de réseau de nouvelle génération

    Facilité d'intégration dans les baies de dernière génération PCIe Gen4, 100GbE :
    - JBOF Target controller, I/O controller, SmartNIC, SmartSSD
    - 2 configurations: stand-alone ou x86 CPU offloading
    - Support virtualized, containerized or bare metal infrastructures
    - Dynamic resource allocation for Control, Data & Management Planes
    .

    Accélération des protocoles, services et QoS haute performance :
    - Protocoles NVMe-oF, RoCE/RDMA, TCP/IP, NVMe, OVS/NFV
    - Smart Load-Balancer, Priority Flow Control, Stateless L1-L4 parsing
    - RAID6: 154 Gbit/s Erasure Coding (Reed-Solomon) per cluster
    - Line-rate encryption/decryption/hash (IPSEC, TLS, XTS, MACsec)
    - AI capability for analytics and adaptive configuration

  • Kalray Data Flows
    Cas d'utilisation

    Créer des applications accélérée, à forte intensité de calcul

    Accélération des charges de travail complexes :
    - Patented core + co-processor boosting Machine Learning Inference
    - Computer Vision
    - Signal Processing (e.g. FFT), Cryptography, Mathematics
    .

    Construire des systèmes embarqués autonomes et intelligents :
    - Multi-OS (Linux, RTOS) systems
    - Support ”Freedom from Interference” for mixed criticality
    .

    Construire des systèmes de nouvelle génération pour le Edge Computing :
    - Process Data at the Intelligent Edge
    - Real-time analytics for automation, prediction, and control
    - Easy integration into existing systems
    .

  • Processor MPPA_HAND
    Cas d'utilisation

    Avec les processeurs MPPA®, les possibilités sont infinies et vous permettent d'innover sans limites.

    Propulsé par 80 cœurs, le processeur MPPA® est une nouvelle génération de processeurs intelligents, doté de capacités uniques en termes de programmabilité, de performances, d'exécution parallèle de plusieurs tâches essentielles, d'efficacité énergétique, de sûreté et de sécurité. Notre technologie MPPA® révolutionnaire ouvre la voie à une nouvelle ère du traitement des données.
    .

    Le type de processeur intelligent qui vous donne le pouvoir d'en faire plus. Plus pour accélerer des secteurs en développement rapide, des réseaux de télécommunication 5G aux véhicules autonomes, en passant par les équipements de santé, l'industrie 4.0, les drones et les robots... et plus encore !

Technical Corner

    • Architecture 80 coeurs

      CORE

      64-bit/32-bit architecture
      From 600MHz to 1.2 GHz
      6-issue VLIW
      16KB instruction cache / 16KB data cache with MMU
      IEEE 754-2008 Floating Point Unit (FPU)
      Square root and reciprocal operations in floating single precision
      64-bit integer multiplication (Asymmetric cryptography)
      Up to 4 execution rings
      Up to 256-bits per cycle Load/Store

       

      CO-PROCESSOR (ONE PER CORE)

      Acceleration of INT8, INT16 or FP16 accuracy
      Up to 128 MAC per cycle

       

      CLUSTER

      16 Application Cores + 1 Management/Security Core
      4 MB of Memory / L2 Cache – 600GB/s Low Latency / High Speed
      Configurable cluster/chip cache coherency & deterministic modes

       

      SYSTEM-ON-CHIP

      5 clusters (total of 80 Application Cores + 5 Management Cores)
      Up to 1.15 TFLOPs (SP) / 384 GFLOPs (DP)
      Up to 3 TFLOPs (16 bits) / 25 TOPs (8bits) for deep learning
      56GB/s chip-to-chip communications (16 +12.5) x 2
      • Interface PCIe Gen4

        16-lane PCIe GEN4 Endpoint (EP) or Root Complex (RC)
        Bifurcation up to 8 downstream ports in RC mode
        SR-IOV up to 8 Physical Functions / 248 Virtual Functions
        Address translation and protection
        Up to 2048 MSI-X & 64 MSI interrupts
        Support for Hot Plug
        Up to 512 DMAs for multi queues / kernel bypass drivers
        Direct PCIe-to-clusters and PCIe-to-DDR transfers
        Support for NVMe and VIRTIO emulation

         

      • Interface LPDDR4/DDR4

        64-bit DDR4/LPDDR4-3200 channels with sideband/inline ECC
        Up to two ranks per DDR4 Channel
        2 DDR channels (up to 32GB) with channel interleaving

         

      • Interface 2x100GbE Ethernet

        8x1/8x10/8x25/2x40/4x50/2x100 GbE
        RDMA over Converged Ethernet (RoCE v1 and v2)
        Jumbo Frame Support (9.6KB)
        Support for PTP/IEEE 1588v2
        Priority Flow Control (PFC), IEEE 802.1Qbb
        Checksum offload Header & Payload
        Line rate packet classification/smart load balancing
        Hash & Round-robin based dispatch policy

         

      • Securité

        Secure Boot with authentication & encryption
        True Random Number Generators (TRNG)
        RSA, Diffie-Hellman, DSA, ECC, EC-DSA and EC-DH acceleration

         

      • Accélérateurs de cryptographie (option)

        AES-128/192/256 (ECB/CBC/ICM/CTR/GCM/GMAC/CCM)
        AES-XTS for storage application
        MD5/SHA-1, SHA-2, SHA-3
        Kazumi/Snow 3G, ZUC

         

      • Gestion/Controle des interfaces

        GPIOs/UARTs/SPI/I2C/CAN/PWM
        SSI Controller for serial NOR Flash with optional boot
        SDCARD UHS-I / eMMC 4.51 memory controller
        2x USB 2.0 OTG ULPI
        JTAG IEEE 1149.1
        16-bit Parallel Trace Interface

         

      • Sûreté & prédictabilité

        Mix criticality support
        Lockable critical configuration
        Capability to bank memory and caches for non-interference
        & time-predictable execution
        L1 Cache coherency enabling/disabling

         

    Commencez maintenant !

    Vous voulez en savoir plus sur notre processeur MPPA® ?

    Contenus associés

    • Produit
      Kalray AccessCore Software
      AccessCore®

      Un environnement logiciel permettant de développer des applications utilisant des standards de codage ouverts sur les processeurs de Kalray.

      Lire la suite
    • Produit
      Kalray_K200 Board_1920x1281
      Carte K200™

      Une carte PCIe programmable, à faible consommation, pouvant être utilisée en mode accélérateur ou en mode standlone.

      Lire la suite
    • Produit
      Kalray's K200-LP low profile card
      Carte K200-LP™

      Une carte entièrement programmable qui apporte les avantages de la technologie MPPA® DPU aux data centers pour des solutions plus performantes et plus flexibles.

      Lire la suite