Sfida ndaj Nvidia-s: Epoka e re e “AI Agents” po ndryshon kërkesat për hardware
Gjiganti i teknologjisë Amazon ka shënuar një fitore të rëndësishme strategjike ndaj rivalëve të tij në cloud. Meta (kompania mëmë e Facebook dhe Instagram) ka nënshkruar një marrëveshje për të përdorur miliona procesorë AWS Graviton për të fuqizuar infrastrukturën e saj të inteligjencës artificiale që po rritet me ritme galopante.
Pse Graviton? Kalimi nga GPU te CPU për AI
Deri më sot, vëmendja ka qenë te GPUs (si ato të Nvidia) për trajnimin e modeleve të mëdha. Megjithatë, sapo modelet trajnohen, faza e dytë është inferenca (ekzekutimi i kërkesave). Këtu hyjnë në lojë “AI Agents”.
- Arsyetimi në kohë reale: Agjentët e AI kryejnë detyra komplekse si shkrimi i kodit, kërkimi i avancuar dhe koordinimi i detyrave me shumë hapa.
- Optimizimi: Versioni më i fundit i Graviton (arkitekturë ARM) është projektuar posaçërisht për të trajtuar këto ngarkesa pune me një raport kosto-performancë shumë më të mirë se procesorët tradicionalë.
Beteja e Cloud-it: AWS rimerr terren ndaj Google
Kjo marrëveshje është një goditje direkte për Google Cloud, me të cilin Meta kishte nënshkruar një kontratë prej 10 miliardë dollarësh vitin e kaluar. Duke zgjedhur Graviton, Meta po kthehet drejt ekosistemit të Amazon, duke dëshmuar se çipat “homegrown” (të prodhuar vetë) janë bërë avantazhi kryesor konkurrues.
Konkurrenca: Amazon vs. Nvidia dhe Intel

CEO i Amazon, Andy Jassy, ka qenë i qartë: ndërmarrjet duan performancë të lartë me çmime më të ulëta.
- Nvidia Vera: Amazon tashmë konkurron direkt me CPU-në e re të Nvidia-s, Vera, e cila gjithashtu synon ngarkesat e punës së agjentëve AI.
- Ekskluziviteti: Ndryshe nga Nvidia që ia shet çipat e saj të gjithëve, Amazon ofron akses në Graviton dhe Trainium vetëm përmes platformës AWS, duke krijuar një “gardh” teknologjik që vështirë se mund të thyhet.
Analiza e Tregut: Me Anthropic që ka rezervuar kapacitetet e çipave Trainium përmes një marrëveshjeje 100 miliardë dollarëshe, dhe Meta që zgjedh Graviton, Amazon po pozicionohet si lideri i padiskutueshëm i infrastrukturës së ardhshme të AI, ku efiçenca llogaritëse vlen po aq sa fuqia bruto.
