Üretken yapay zeka alanındaki rakiplerini yakalamaya kararlı olan Meta, kendi yapay zeka çalışmaları için milyarlarca dolar harcıyor. Bu milyarların bir kısmı yapay zeka araştırmacılarını işe almaya gidiyor. Ancak daha da büyük bir kısmı, Meta’nın yapay zeka modellerini çalıştırmak ve eğitmek için donanım, özellikle de çipler geliştirmek için harcanıyor.
Meta, Intel’in en son yapay zeka hızlandırıcı donanımını duyurmasından bir gün sonra, çip geliştirme çabalarının en yeni meyvesini bugün tanıttı. Geçen yılki MTIA v1’in halefi olan “yeni nesil” Meta Eğitim ve Çıkarım Hızlandırıcı (MTIA) olarak adlandırılan çip, Meta’nın mülklerinde (örneğin Facebook) görüntülü reklamların sıralanması ve önerilmesi de dahil olmak üzere modelleri çalıştırıyor.
7nm’lik bir süreç üzerine inşa edilen MTIA v1 ile karşılaştırıldığında, yeni nesil MTIA 5nm’dir. (Çip üretiminde “süreç”, çip üzerine inşa edilebilecek en küçük bileşenin boyutunu ifade eder). Yeni nesil MTIA fiziksel olarak daha büyük bir tasarımdır ve önceki modele göre daha fazla işlemci çekirdeğine sahiptir. Ve daha fazla güç tüketirken – 25W’a karşı 90W – aynı zamanda daha fazla dahili belleğe sahiptir (64MB’a karşı 128MB) ve daha yüksek bir ortalama saat hızında çalışır (800MHz’den 1.35GHz’e).
Meta, yeni nesil MTIA’nın şu anda 16 veri merkezi bölgesinde yayında olduğunu ve MTIA v1’e kıyasla 3 kata kadar daha iyi performans sağladığını söylüyor. Bu “3 kat” iddiası kulağa biraz belirsiz geliyorsa, haksız değilsiniz – biz de öyle düşündük. Ancak Meta bu rakamın her iki yonga üzerinde “dört temel modelin” performansının test edilmesiyle elde edildiğini gönüllü olarak açıkladı.
TechCrunch ile paylaşılan bir blog yazısında Meta, “Tüm yığını kontrol ettiğimiz için, piyasada bulunan GPU’lara kıyasla daha yüksek verimlilik elde edebiliyoruz” diyor.
Meta’nın donanım vitrini – şirketin devam eden çeşitli jeneratif yapay zeka girişimleriyle ilgili bir basın brifinginden sadece 24 saat sonra geliyor – birkaç nedenden dolayı sıra dışı.
Birincisi, Meta blog yazısında yeni nesil MTIA’yı şu anda üretken yapay zeka eğitim iş yükleri için kullanmadığını açıklıyor, ancak şirket bunu araştıran “devam eden birkaç programı” olduğunu iddia ediyor. İkincisi, Meta yeni nesil MTIA’nın modelleri çalıştırmak veya eğitmek için GPU’ların yerini almayacağını, bunun yerine onları tamamlayacağını kabul ediyor.
Satır araları okunduğunda, Meta yavaş hareket ediyor – belki de istediğinden daha yavaş.
Meta’nın yapay zeka ekipleri neredeyse kesinlikle maliyetleri düşürme baskısı altında. Şirket, 2024 yılı sonuna kadar üretken yapay zeka modellerini eğitmek ve çalıştırmak için GPU’lara tahmini 18 milyar dolar harcayacak ve – son teknoloji üretken modeller için on milyonlarca dolar arasında değişen eğitim maliyetleri ile – şirket içi donanım cazip bir alternatif sunuyor.
Meta’nın donanımı geride kalırken, rakipleri de Meta’nın liderliğini rahatsız edecek şekilde öne geçiyor.
Google bu hafta yapay zeka modellerinin eğitimi için beşinci nesil özel çipi TPU v5p’yi genel olarak Google Cloud müşterilerinin kullanımına sundu ve modelleri çalıştırmak için ilk özel çipi Axion’u açıkladı. Amazon’un da birkaç özel yapay zeka çip ailesi bulunuyor. Microsoft da geçen yıl Azure Maia AI Accelerator ve Azure Cobalt 100 CPU ile bu mücadeleye katıldı.
Blog yazısında Meta, yeni nesil MTIA’nın “ilk silikondan üretim modellerine geçmesinin” dokuz aydan daha kısa sürdüğünü söylüyor ki bu da adil olmak gerekirse Google TPU’ları arasındaki tipik pencereden daha kısa. Ancak Meta’nın üçüncü parti GPU’lardan bir ölçüde bağımsızlık elde etmeyi ve zorlu rakipleriyle eşleşmeyi umuyorsa yapması gereken çok şey var.