Anthropic presenta modelos Claude 3: destaca Opus y sus capacidades 'casi humanas'

hace 2 meses 29

La empresa Anthropic dió a conocer su última innovación en el campo de la inteligencia artificial (IA), presentando la familia de modelos Claude 3, que supera a otros modelos del sector, como GPT-4.

Esta nueva generación, encabezada por el modelo Opus, destacó por sus sorprendentes habilidades "casi humanas" de comprensión y fluidez en tareas complejas.

La familia Claude 3 está compuesta por tres modelos distintos: Haiku, Sonnet y Opus, en orden ascendente según su capacidad, cada uno diseñado para cubrir diversas necesidades de los usuarios, en materia de inteligencia, velocidad y precio.

Específicamente, los modelos de Claude 3 tienen la habilidad de entablar conversaciones con los usuarios, completar texto de forma automática y realizar tareas de extracción de datos, asegurando respuestas instantáneas y en tiempo real.

Today, we're announcing Claude 3, our next generation of AI models.

The three state-of-the-art models—Claude 3 Opus, Claude 3 Sonnet, and Claude 3 Haiku—set new industry benchmarks across reasoning, math, coding, multilingual understanding, and vision. pic.twitter.com/TqDuqNWDoM

— Anthropic (@AnthropicAI) March 4, 2024

Además, estos modelos son multimodales, lo que significa que pueden procesar una amplia variedad de formatos visuales, incluyendo fotografías, tablas, gráficos y diagramas técnicos.

En cuanto a su capacidad contextual, los modelos Claude 3 cuentan con una ventana inicial de contexto de 200,000 tokens en el momento de su lanzamiento, pero tienen la capacidad de manejar entradas de más de un millón de tokens.

Con esta nueva gama de modelos, Anthropic logró implementar mejoras significativas en capacidades de análisis y pronóstico, así como avances en la creación de contenido, generación de código y conversaciones en idiomas distintos al inglés, como español, japonés y francés.

La trinidad Claude

La empresa describe el modelo Haiku como el líder en velocidad y rentabilidad en su categoría de inteligencia.

Su eficiencia es tal que puede procesar un artículo de investigación con datos e información equivalentes a 10,000 tokens, incluyendo gráficos y tablas, "en menos de tres segundos".

Según lo señalado por Anthropic, el modelo Sonnet es el doble de rápido que Claude 2 y Claude 2.1, además de contar con niveles superiores de inteligencia.

Por lo tanto, sobresale en tareas que requieren respuestas rápidas, como la recuperación de información, datos o conocimiento.

Por otro lado, Opus se destaca como el modelo más inteligente presentado por la compañía. A diferencia de Sonnet, ofrece velocidades similares a las de los modelos anteriores Claude 2 y 2.1, pero con niveles de inteligencia considerablemente superiores.

Anthropic reveló datos comparativos en una tabla de evaluación de rendimiento, destacando el desempeño superior del modelo Opus de la familia Claude 3 frente al modelo GPT-4 de OpenAI en todos los aspectos.

Por ejemplo, en la categoría de razonamiento experto a nivel de posgrado (GPQA), Opus obtiene una puntuación un 14,7 % más alta (50,4 %) que GPT-4 (35,7 %).

Similarmente, en pruebas de matemáticas básicas, Opus alcanza un 95 %, superando el 92 % de GPT-4, al igual que en el conocimiento MMLU, con un 86,8 % para Opus y un 86,4 % para GPT-4.

Comprensión textual y precisión

Anthropic destacó que los modelos Claude 3 mejoraron su comprensión contextual, lo que reduce considerablemente la probabilidad de negarse a responder algunas solicitudes de los usuarios.

Estos nuevos modelos muestran una comprensión más detallada de las solicitudes, lo que les permite reconocer el verdadero contexto y disminuir la negativa a responder solicitudes "inofensivas".

Además, Anthropic ha subrayado la importancia de mantener una alta precisión en los resultados de los modelos a escala. Para lograr esto, utilizan un conjunto de preguntas fácticas complejas que se relacionan con las debilidades conocidas de los modelos actuales.

Las respuestas se clasifican en correctas, incorrectas y "admisiones de incertidumbre". En caso de incertidumbre, el modelo responde que no sabe la respuesta en lugar de proporcionar información incorrecta.

Gracias a este enfoque, el modelo Opus ofrece el doble de precisión en sus respuestas en comparación con Claude 2.1.

Responsabilidad

Anthropic enfatizó que la familia de modelos Claude 3 fue diseñada para ser tan confiable como sea posible, con equipos dedicados a identificar y mitigar riesgos como la información falsa y la replicación autónoma.

Según afirman, mejoraron la seguridad, transparencia y privacidad de los modelos, reduciendo sesgos y promoviendo la neutralidad.

A pesar de avanzar en varios aspectos con respecto a las versiones anteriores de IA, los modelos Claude 3 mantienen el nivel de seguridad ASL-2 según la política de escalamiento responsable de Anthropic.

Se detalló que los modelos Opus y Sonnet están disponibles a través de la API de Claude para desarrolladores, con Sonnet también disponible en Amazon Bedrock y en vista previa privada en Vertex AI Model Garden de Google Cloud.

Más noticias

*Este contenido fue reescrito con la asistencia de una inteligencia artificial, basado en información de Europa Press, y contó con la revisión de la periodista y un editor.

Read Entire Article