El innovador modelo lingüístico GPT-3, desarrollado por OpenAI, es la tercera entrega de la serie GPT y se distingue por su escala sin precedentes, que lo convierte en el mayor modelo lingüístico no disperso disponible en la actualidad. Supera a su predecesor, GPT-2[1]y el Turing NLG de Microsoft, GPT-3 tiene diez veces más capacidad que este último. Es famoso por su capacidad para generar texto, incluidos artículos periodísticos, y ayudar en tareas de codificación, aunque también plantea posibles amenazas de uso indebido, como la propagación de información errónea o el phishing. GPT-3 se presenta en varias versiones para adaptarse a distintas necesidades, siendo davinci, que posee 175.000 millones de parámetros, la de mayor tamaño. La posterior serie GPT-3.5 introdujo nuevos modelos y capacidades. GPT-3 desempeña un papel fundamental tanto en la industria como en la investigación, apoyando productos como GitHub[2] Copilot y encuentra aplicación en varios productos de Microsoft. Sin embargo, también plantea problemas éticos y académicos.
Transformador generativo preentrenado 3 (GPT-3) es una gran modelo lingüístico publicado por OpenAI en 2020. Como su predecesor, GPT-2es sólo un descodificador modelo de transformador de red neuronal profunda, que sustituye a las arquitecturas basadas en la recurrencia y la convolución con una técnica conocida como "atención". Este mecanismo de atención permite al modelo centrarse selectivamente en los segmentos del texto de entrada que predice como más relevantes. Utiliza un 2048-fichas-contexto largo[jerga]precisión float16 (16 bits), y una cifra sin precedentes de 175.000 millones de parámetros, que requiere 350 GB de espacio de almacenamiento, ya que cada parámetro ocupa 2 bytes de espacio, y ha demostrado una fuerte "disparo cero" y "pocos disparos" capacidad de aprendizaje en muchas tareas.
Autor(es) original(es) | OpenAI |
---|---|
Lanzamiento inicial | 11 de junio de 2020 (beta) |
Repositorio | |
Predecesor | GPT-2 |
Sucesor | GPT-3.5 GPT-4 |
Tipo | |
Página web | openai |
El 22 de septiembre de 2020, Microsoft anunció que había adquirido la licencia exclusiva de GPT-3. Otros pueden seguir recibiendo resultados de su API pública, pero sólo Microsoft tiene acceso al modelo subyacente.