Microsoft Código abierto la nueva versión Phi-4: la eficiencia de inferencia Gran aumento de 10 veces, se puede ejecutar en portátiles

GoldenOctober2024

2025-07-09 22:12:24

Datos de Jin10, 10 de julio: esta madrugada, Microsoft lanzó en su sitio web la última versión de la familia Phi-4, Phi-4-mini-flash-reasoning. La versión mini-flash mantiene las características de bajo parámetro y alto rendimiento de la familia Phi-4, y está diseñada específicamente para escenarios limitados por potencia computacional, memoria y latencia, pudiendo ser ejecutada en una sola GPU, adecuada para dispositivos de borde como laptops y tabletas. En comparación con la versión anterior, mini-flash utiliza la innovadora arquitectura SambaY desarrollada por Microsoft, logrando una eficiencia de inferencia que sube 10 veces, con una latencia promedio que se reduce de 2 a 3 veces, logrando una mejora significativa en el rendimiento general de inferencia.

Ver originales

This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.

Recompensa
Me gusta
Comentar
Compartir

Comentar

0/400

Sin comentarios

Tema
BTC Hits New High
75k Popularidad
ETH Breaks $3,000
29k Popularidad
VIP Exclusive Airdrop Carnival
9k Popularidad
4Pump.Fun Debuts on Gate
4k Popularidad
5Fed June Meeting Minutes
4k Popularidad
6Join Gate VIP to Win MacBook
29k Popularidad
7Trump Tariff Hikes
16k Popularidad
8Gate xStocks Trading Share
22k Popularidad
9HK Stablecoin Rules
12k Popularidad
10Truth Social Crypto ETF
2k Popularidad

Anclado