A los gigantes tecnológicos les gusta jactarse de modelos de IA de billones de parámetros que requieren grupos de GPU masivos y costosos. Pero Fastino está adoptando un enfoque diferente.
La startup con sede en Palo Alto dice que ha inventado un nuevo tipo de arquitectura de modelo de IA que es intencionalmente pequeña y específica de tareas. Los modelos son tan pequeños, están entrenados con GPU de juegos de gama baja por un valor de menos de $ 100,000 en total, dice Fastino.
El método está atrayendo la atención. Fastino ha obtenido $ 17.5 millones en fondos iniciales dirigidos por Khosla Ventures, el primer inversor de riesgo de OpenAI, Fastino le dice exclusivamente a TechCrunch.
Esto lleva la financiación total de la startup a casi $ 25 millones. Recaudó $ 7 millones en noviembre pasado en una ronda previa a la semilla dirigida por VC Arm M12 de Microsoft e Insight Partners.
“Nuestros modelos son más rápidos, más precisos y cuestan una fracción para entrenar mientras superan los modelos insignia en tareas específicas”, dice Ash Lewis, CEO y cofundador de Fastinino.
Fastino ha construido un conjunto de pequeños modelos que vende a clientes empresariales. Cada modelo se centra en una tarea específica que una empresa podría necesitar, como redactar datos confidenciales o resumir documentos corporativos.
Fastino aún no revela las primeras métricas o usuarios, pero dice que su rendimiento está sorprendiendo a los primeros usuarios. Por ejemplo, debido a que son tan pequeños, sus modelos pueden ofrecer una respuesta completa en una sola ficha, lewis dijo a TechCrunch, mostrando la tecnología dando una respuesta detallada a la vez en milisegundos.
Evento de TechCrunch
Berkeley, CA
|
5 de junio
Reservar ahora
Todavía es un poco temprano para saber si el enfoque de Fastino se dará cuenta. El espacio de IA Enterprise está lleno, con compañías como Cohere y Databricks también promocionando IA que sobresale en ciertas tareas. Y los fabricantes de modelos SATA centrados en la empresa, incluidos antrópicos y Mistral, también ofrecen modelos pequeños. Tampoco es ningún secreto que el futuro de la IA generativa para la empresa probablemente esté en modelos de lenguaje más pequeños y más enfocados.
El tiempo puede decir, pero un voto de confianza temprano de Khosla ciertamente no duele. Por ahora, Fastino dice que se centra en construir un equipo de IA de vanguardia. Está dirigido a los investigadores de Top AI Labs que no están obsesionados con construir el modelo más grande o superar los puntos de referencia.
“Nuestra estrategia de contratación se centra mucho en los investigadores que tal vez tengan un proceso de pensamiento contrario sobre cómo se están construyendo modelos de idiomas en este momento”, dice Lewis.