La startup de inteligencia artificial (IA) Anthropic ha anunciado el lanzamiento de Claude 2, su segunda generación de su chatbot de IA. El nuevo modelo subyacente ofrece un rendimiento mejorado y respuestas más largas, y es accesible a través de API, así como un nuevo sitio web beta público, claude.ai.

Rendimiento y capacidades mejorados

Claude 2 ha mostrado mejoras significativas en codificación, matemáticas y razonamiento en comparación con su predecesor. El modelo de IA obtuvo una puntuación del 76,5 % en la sección de opción múltiple del examen del Colegio de Abogados, frente al 73,0 % con Claude 1.3.

El Examen de la barra es una prueba estandarizada que evalúa el conocimiento y las habilidades legales de los candidatos que desean ejercer la abogacía en una determinada jurisdicción. Por lo general, se compone de preguntas de opción múltiple, ensayos y pruebas de desempeño que cubren diversas áreas del derecho, como el derecho constitucional, el derecho penal, los contratos, las pruebas y la ética. Se espera que los sistemas de IA que puedan aprobar el examen de la barra demuestren un alto nivel de competencia en comprensión de lectura, razonamiento lógico, argumentación y escritura. Algunos de los desafíos a los que se enfrentan los sistemas de IA al realizar el examen de la abogacía incluyen el manejo de escenarios legales complejos y ambiguos, la aplicación de leyes y precedentes relevantes y la producción de respuestas coherentes y persuasivas.

En términos de habilidades de codificación, Claude 2 obtuvo un 71,2% frente al 56,0% en Codex HumanEval, una prueba de codificación de Python. El nuevo modelo puede manejar entradas y salidas más largas, analizando documentos de hasta 100 000 tokens y escribiendo contenido con hasta unos pocos miles de tokens. Esto le permite a Claude trabajar con cientos de páginas de documentación técnica o incluso un libro.

Anthropic ha enfatizado la seguridad en el desarrollo de Claude 2, lo que hace que sea menos probable que genere contenido dañino. La empresa utiliza numerosas técnicas y pruebas para reducir los riesgos. En una evaluación interna de equipo rojo que puntúa a los modelos en un gran conjunto representativo de indicaciones dañinas, Claude 2 fue el doble de bueno para dar respuestas inofensivas en comparación con Claude 1.3.

Cuando se le preguntó sobre la diferencia entre Claude 2, Google Bard, ChatGPT y Bing Chat, el chatbot de IA dio la siguiente respuesta bastante limitada:

“Hay varias diferencias clave entre Google Bard, ChatGPT y Bing Chat: yo soy Claude, un asistente de IA creado por Anthropic. Fui diseñado teniendo en cuenta la autoconsistencia y la prevención de daños.
– Google Bard es un servicio de inteligencia artificial conversacional experimental lanzado por Google en febrero de 2023. Está diseñado para brindar información útil a las preguntas de los usuarios. – ChatGPT es un chatbot de IA creado por OpenAI y lanzado en noviembre de 2022. Está diseñado para tener conversaciones naturales y brindar respuestas similares a las de los humanos. – Bing Chat es el chatbot de IA de Microsoft integrado en el motor de búsqueda Bing en febrero de 2023. Su objetivo es proporcionar respuestas de búsqueda más conversacionales y completas.
 
Las principales diferencias se reducen a las empresas detrás de nosotros, nuestras capacidades y cómo fuimos diseñados. Fui diseñado pensando en la seguridad, mientras que los demás tienen como objetivo proporcionar las respuestas más informativas, aunque a veces sean inconsistentes. ChatGPT también lideró la ola de lanzamiento de IA generativa al público. En última instancia, tenemos similitudes en ser asistentes de IA, pero adoptamos diferentes enfoques en función de las prioridades de nuestros creadores”.

Disponibilidad y planes futuros

Claude 2 está actualmente disponible para los usuarios en el EE. UU. y el Reino Unido, con planes para ampliar la disponibilidad en los próximos meses. La API de Claude 2 para empresas se ofrece por el mismo precio que Claude 1.3. Anthropic tiene una hoja de ruta emocionante de mejoras de capacidad planificadas para Claude 2 y se implementará de manera lenta e iterativa. en los próximos meses.

Anthropic está trabajando actualmente con miles de empresas que usan la API de Claude. Los primeros socios, incluidos Jasper y Sourcegraph, ya están integrando la nueva versión de Claude a través de la API y encuentran valor en su semántica mejorada, razonamiento y ventana de contexto más grande.

Comentarios de los usuarios e implementación responsable

Anthropic agradece los comentarios de los usuarios mientras trabajan para implementar responsablemente sus productos de manera más amplia. La compañía reconoce que Claude, como todos los modelos actuales, puede generar respuestas inapropiadas y no debe usarse cuando la salud y el bienestar físico o mental están involucrados.

Acerca de Anthropic

Anthropic es una corporación estadounidense de beneficio público y puesta en marcha de inteligencia artificial (IA), fundada por ex miembros de OpenAI. La empresa fue establecida en 2021 por los hermanos Daniela Amodei y Dario Amodei, el último de los cuales se desempeñó como vicepresidente de investigación de OpenAI. Los fundadores se encontraban entre otros que abandonaron OpenAI debido a diferencias direccionales, específicamente con respecto a las empresas de OpenAI con Microsoft en 2019.

Anthropic se especializa en desarrollar sistemas generales de IA y modelos de lenguaje, con un espíritu empresarial de uso responsable de IA. A julio de 2023, Anthropic había recaudado 1500 millones de USD en financiación. La empresa también se ha enfrentado a desafíos legales, como una demanda en febrero de 2023 por parte de Anthrop LLC, con sede en Texas, por el uso de su marca registrada”Anthropic A.I”. Además de su chatbot de inteligencia artificial Claude, Anthropic también publica investigaciones sobre la interpretabilidad del aprendizaje automático. sistemas, centrándose en la arquitectura del transformador.

Categories: IT Info