Centro Educativo Madre Teresa de Calcuta
Informática Educativa
Phi-2 Inteligencia Artificial de Microsoft
Hace unos días Google daba el pistoletazo de
salida a la era de la IA de bolsillo con Gemini Nano, su modelo de IA
generativa de texto capaz de funcionar directamente desde el móvil y sin
conexión a la nube. Ahora Microsoft acaba de sorprender a todos con el
lanzamiento de su particular rival, un Small Language Model (SLM) llamado
Phi-2 que también se puede usar en móviles.
Phi-2.
En Microsoft Research indicaban que este nuevo modelo de texto a
texto es "suficientemente pequeño para ser ejecutado en un portátil o en
un dispositivo móvil". Satya Nadella ya nos habló de él en el reciente
evento Ignite 2023, y es la evolución de Phi-1, que tan solo contaba con 1.3B
de parámetros.
Un ChatGPT en formato compacto. Estamos ante un modelo con 2.700 millones de
parámetros (2.7B), una cifra que claramente lo orienta precisamente a ser
utilizada en dispositivos más modestos. En Google Gemini Nano tiene dos
versiones con 1.800 (1.8B) y 3.250 millones (3.25B) de parámetros, por ejemplo.
Pequeñito pero matón. Lo es, al menos según sus responsables. ¿La razón?
Es capaz de igualar e incluso superar las prestaciones y precisión de modelos
teóricamente más capaces como Llama 2-7B o Mistral-7B. En las pruebas que han
ejecutado a nivel interno el rendimiento es excelente a pesar de tener casi una
tercera parte de los parámetros de esos modelos.
También supera a Gemini Nano. El nuevo modelo de Microsoft es también capaz de
superar el rendimiento de Gemini Nano 3.25B, el modelo "móvil" más
ambicioso de Google, y según los investigadores de la empresa es también capaz
de ofrecer menos "toxicidad" y mostrarse más subjetivo en las
respuestas que las que por ejemplo ofrece Llama 2.
Las comparaciones son odiosas. En la presentación del modelo Microsoft nos recordó
que la espectacular demostración de Gemini Ultra no había sido tan
espectacular. Había hecho algo de trampa. En uno de los apartados Google
mostró cómo Gemini Ultra era capaz de ayudar a un estudiante con problemas de
física, y en Microsoft usaron los mismos prompts con Phi-2 y se vio que era
también de resolver esas dudas incluso siendo un modelo mucho más pequeño.
La empresa afirma que su nuevo
modelo de lenguaje es capaz de superar en prestaciones a Llama 2 y Mistral 7B. Lamentablemente,
se trata de un modelo que solo estará disponible para propósitos académicos:
los usuarios no podremos aprovecharlo.
Solo para investigar. A pesar de esa capacidad, Phi-2 no llegará a
nuestros móviles, al menos por el momento. El modelo se licencia únicamente
"con propósitos de investigación", y no se podrá desplegar
comercialmente. Sí que se habla de la posibilidad de usarlo "con
propósitos no comerciales y que no generen ingresos", pero su aplicación
práctica es algo menos directa. Se puede acceder a él, eso sí, a través del
catálogo de la nueva plataforma Azure AI Studio.
Fuente Bibliográfica:
No hay comentarios.:
Publicar un comentario
Tu opinion es importante y la valoramos. Opina y Comparte con nosotros.