Mistral 7B

Von Neuromancer, 3. Oktober 2023

Compared Mistral 7B to the Llama 2 family

Das Mistral AI-Team freut sich, Mistral 7B vorzustellen, ein Sprachmodell mit 7,3 Milliarden Parametern, das in allen Benchmarks besser abschneidet als die Llama-Modelle. Es nutzt fortschrittliche Techniken wie Gruppierte Abfrageaufmerksamkeit (GQA) und Gleitende Fensteraufmerksamkeit (SWA) für schnellere Inferenz und bessere Handhabung längerer Sequenzen. Mistral 7B ist unter der Apache 2.0-Lizenz verfügbar und kann ohne Einschränkungen genutzt werden, einschliesslich der Anpassung für spezielle Aufgaben. Hervorzuheben ist, dass dieses Modell keine Moderationsmechanismen besitzt

Website

https://mistral.ai/news/announc…

Tags

Kommentare