Home Economía OpenAI Introducción Dos modelos de lenguaje de peso abierto que pueden ejecutarse...

OpenAI Introducción Dos modelos de lenguaje de peso abierto que pueden ejecutarse en GPU del consumidor, optimizados para ejecutarse en dispositivos con solo 16 GB de memoria

2
0

Operai ha desarrollado un par de nuevos modelos de lenguaje de peso abierto optimizados para las GPU de consumo. En una publicación de blog, Openai anunció “GPT-OSS-120B” y “GPT-OSS-20B”, el primero diseñado para ejecutarse en una sola GPU de 80 GB y la segunda optimizada para ejecutar dispositivos de borde con solo 16 GB de memoria.

Ambos modelos aprovechan un transformador utilizando el modelo de mezcla de expertos, un modelo que se popularizó con Deepseek R1. A pesar del enfoque de diseño de GPT-OSS-120B y 20B hacia las GPU del consumidor, ambas admiten hasta 131,072 longitudes de contexto, la más larga disponible para la inferencia local. GPT-OSS-120B activa 5.1 mil millones de parámetros por token, y GPT-OSS-20B activa 3.6 mil millones de parámetros por token. Ambos modelos utilizan patrones de atención de escasos densos y con bandas locales alternas y usan atención múltiple agrupada con un tamaño de grupo de 8.

LEAVE A REPLY

Please enter your comment!
Please enter your name here