Mistral AI ve NVIDIA iş birliği, yapay zeka teknolojilerinde önemli bir ilerleme olarak değerlendirilebilecek NeMo modelini ortaya çıkardı. Bu yeni model, 128,000 token’a kadar uzanan geniş bir bağlam penceresi sunuyor ve kendi kategorisinde dünya bilgisi, akıl yürütme ve kodlama doğruluğu açısından üst düzey performans vaat ediyor.
Modelin Özellikleri ve Kullanım Kolaylığı
NeMo, özellikle kullanım kolaylığına odaklanarak tasarlanmıştır. Standart mimariye dayanarak, Mistral 7B kullanılan sistemlerin yerini alacak şekilde geliştirilmiştir. Eğitim sürecinde kuantizasyon farkındalığına sahip olan model, FP8 çıkarımını performanstan ödün vermeden gerçekleştirebilmektedir. Bu özellik, büyük dil modellerini verimli bir şekilde kullanmayı hedefleyen kuruluşlar için kritik öneme sahiptir.
Açık Kaynak Erişimi ve Entegrasyon Kolaylığı
Mistral AI, modelin hem eğitim öncesi temel hem de talimatla ayarlanmış kontrol noktalarını Apache 2.0 lisansı altında kullanıma sunarak, araştırmacıların ve şirketlerin erişimini kolaylaştırıyor. Ayrıca, modelin ağırlıkları HuggingFace üzerinden erişilebilir durumda olup, geliştiriciler mistral-inference ve mistral-finetune araçlarıyla NeMo’yu deneyebilirler. NVIDIA ile yapılan iş birliği sayesinde, NeMo aynı zamanda NVIDIA NIM çıkarım mikro hizmeti olarak da sunulmakta, bu da NVIDIA’nın AI ekosistemine yatırım yapan kuruluşlar için entegrasyonu daha da basitleştirmektedir.
Çok Dilli Uygulamalar ve Tekken Tokenizer
NeMo, 100’den fazla dilde eğitilmiş yeni bir tokenleştirici olan Tekken ile geliştirilmiştir. Bu tokenleştirici, önceki Mistral modellerinde kullanılan SentencePiece tokenleştiricisine göre hem doğal dil metinlerinde hem de kaynak kodunda daha yüksek sıkıştırma verimliliği sunmaktadır. Özellikle Korece ve Arapça gibi dillerde daha da büyük kazanımlar sağlamaktadır. Tekken, metin sıkıştırmada Llama 3 tokenleştiricisini %85 oranında geçerek çok dilli uygulamalarda NeMo’ya avantaj sağlamaktadır.
Mistral AI ve NVIDIA’nın ortak geliştirdiği NeMo modeli, yüksek performansı, çok dilli yetenekleri ve açık kaynak erişilebilirliği ile çeşitli endüstrilerde ve araştırma alanlarında kullanılabilecek çok yönlü bir araç olarak konumlandırılmıştır. Bu model, AI teknolojilerinin daha geniş kitlelere ulaşmasını sağlayacak potansiyele sahiptir.
- Mistral AI ve NVIDIA, NeMo modelini duyurdu.
- Model, 128,000 token’a kadar destek sunuyor.
- NeMo, çok dilli uygulamalar için Tekken tokenleştiriciyi kullanıyor.