Microsoft Open Source la nouvelle version Phi-4 : l'efficacité d'inférence big pump de 10 fois, peut être exécutée sur un ordinateur portable.
Jin10 données 10 juillet, aujourd'hui à l'aube, Microsoft a ouvert sur son site officiel la dernière version de la famille Phi-4, Phi-4-mini-flash-reasoning. La version mini-flash conserve les caractéristiques de faible paramètre et de forte performance de la famille Phi-4, et est spécialement conçue pour les scénarios limités par la puissance de calcul, la mémoire et la latence, pouvant fonctionner sur un seul GPU, adaptée aux ordinateurs portables, tablettes et autres appareils en périphérie. Par rapport à la version précédente, le mini-flash utilise l'architecture innovante SambaY développée par Microsoft, l'efficacité de l'inférence a été multipliée par 10, la latence a été réduite en moyenne de 2 à 3 fois, et la performance globale de l'inférence a connu une amélioration significative.