DeepSeek V3, un nuevo modelo lingüístico desarrollado por la empresa china DeepMind, ha alcanzado la primera posición en la App Store de Apple en su categoría. Superando a ChatGPT de OpenAI en popularidad, DeepSeek V3 se destaca por su capacidad de razonamiento comparable a los modelos de código cerrado y su enfoque en el aprendizaje de refuerzo puro.
Según afirman, el modelo 'supera a otros modelos de código abierto y logra un rendimiento comparable al de los principales modelos de código cerrado'. El pasado 11 de enero, DeepSeek V3, una aplicación desarrollada por la firma china DeepMind, se lanzó en la App Store .
Desde entonces, ha escalado hasta ocupar la primera posición en la tienda de Apple en la categoría de aplicaciones de inteligencia artificial, por delante de ChatGPT, de OpenAI; un hito para una aplicación que apenas acaba de llegar al mercado y que compite con el ‘chatbot’ más popular desde hace más de dos años.DeepSeek V3 se ofrece bajo una modalidad de uso gratuito con opciones para suscripción premium. La aplicación está diseñada para que los usuarios interactúen con ella como si estuvieran hablando con distintos expertos, cada uno especializado en un campo específico. Dispone también de 37,000 millones de parámetros activados para cada token, como explican sus responsables en el repositorio de GitHub. Y sus responsables han recurrido al mecanismo de (MLA) para “lograr una inferencia eficiente y una capacitación rentable”. La compañía tecnológica ha empleado 14.8 billones de tokens “diversos y de alta calidad” junto con un ajuste supervisado y aprendizaje de refuerzo por fases. Aseguran, además, que cada token ha requerido para su entrenamiento 3.7 días con 2,048 unidades de procesamiento gráfico. DeepSeek V3 logra un rendimiento comparable al de los principales modelos de código cerrado. Así, en la evaluación de la comprensión del lenguaje (MMLU Pro) en una variedad de tareas, DeepSeek V3 alcanza una puntuación de 75.9 frente al 78.0 de Claude 3.5 Sonnet, el 72.6 de GPT 4o y el 73.3 de Llama 3.1 405B. En la prueba de comprensión de razonamiento de nivel posgrado (GPAQ Diamond), DeepSeek V3 ha obtenido una puntuación de 59.1, por debajo de Claude 3.5 Sonnet (65.0), pero por encima de GPT 4o (49.4) y Llama 3.1 405B (42.2). En la evaluación de habilidades del mundo real (SWE), en el que alcanza una puntuación de 42.0, frente a los 50.8 de Claude 3.5 Sonnet, seguidos de GPT 4o (38.8), Llama 3.1 405B (24.5) y Qwen 2.5 de 72B (23.8). En la prueba matemáticas (MATH 500), donde obtiene 90.2, mientras que Claude 3.5 Sonnet alcanza 78.9; Qwen 2.5 de 72B, 80.0; GPT 4o, 74.6, y Llama 3.1 405B, 73.8 puntos. También lo hace en la resolución de problemas matemáticos con AIME 2024, con una puntuación de 39.2, seguido de Qwen 2.5 de 72B y Llama 3.1 405B (ambos 23.3), Claude 3.5 Sonnet (16.0) y GPT 4o (9.3). En la prueba Codeforces, DeepSeek V3 alcanza 51.6 puntos, Qwen 2.5 de 72B , 24.8; Llama 3.1 405B, 25.3 puntos; GPT 4o23.6; y Claude 3.5 Sonnet, una puntuación de 20.3.DeepSeek V3 se desarrolló en dos versiones principales: DeepSeek-R1-Zero y DeepSeek-R1. El primero de ellos entrenado a través del aprendizaje de refuerzo a gran escala sin ajuste fino supervisado como paso preliminar, como explica en el texto de la investigación publicado en Arxiv.org. En el segundo, en cambio, se han empleado también un entrenamiento en múltiples fases y datos de inicio frío antes del aprendizaje de refuerzo para sortear los problemas de . Gracias a ello, sus desarrolladores aseguran que alcanza un rendimiento en tareas de razonamiento comparable a OpenAI o 1. “Nuestro objetivo es explorar el potencial de los LLM para desarrollar capacidades de razonamiento sin ningún dato supervisado, centrándonos en su autoevolución a través de un proceso de aprendizaje de refuerzo puro”, explican
Deepseek V3 IA Aprendizaje De Refuerzo Modelos Lingüísticos Chatgpt App Store Código Abierto Razonamiento
South Africa Latest News, South Africa Headlines
Similar News:You can also read news stories similar to this one that we have collected from other news sources.
Así es DeepSeek, la IA gratuita que deja en ridículo a ChatGPT y GeminiHemos probado DeepSeek, la nueva IA generativa que pone en evidencia a ChatGPT y Gemini. Es increíblemente potente y todo es gratis.
Read more »
Cómo probar ahora mismo DeepSeek: la IA 100% gratuita que deja a ChatGPT en ridículoTe contamos cómo probar DeepSeek de forma 100% gratis y en cualquier dispositivo para que te olvides de ChatGPT y las suscripciones.
Read more »
DeepSeek, el 'ChatGPT chino' que sacude las bolsas y a Silicon ValleyEste 'chatbot' se está haciendo un hueco en la industria de la altas tecnologías, entre gigantes estadounidenses como Nvidia y Meta, que invirtieron sumas colosales para dominar el sector en auge de la inteligencia artificial (IA).
Read more »
DeepSeek desata el caos en medio mundo: la nueva IA china mete miedo a EE.UU.DeepSeek no solo ha conseguido conquistar a los usuarios, también ha generado pérdidas millonarias en activos bursátiles de todo el mundo.
Read more »
DeepSeek: la propuesta china de desarrollo de IA que pone a temblar a los gigantes tecnológicosEl modelo de IA de código abierto de DeepSeek permite que la comunidad de desarrolladores en general pueda inspeccionar y mejorar el software
Read more »
¿Por qué el furor por DeepSeek está hundiendo a NVIDIA?El furor por DeepSeek, la IA china de código abierto, le está dando un bofetón a NVIDIA, cuya acción ha sufrido una fuerte caída este lunes.
Read more »