28 Jan 2025 01:14

Análisis técnico de Deepseek R1, ¿qué hace distinto y cómo?

Deepseek v3 y su modelo de razonamiento R1, han revolucionado el mundo de la IA como hacía mucho que no se sucedía. Incluso afectando al índice bursátil tecnológico (el NASDAQ) y provocando la mayor caída en valor de la historia de la humanidad en un solo en NVIDIA.

Pero, ¿por qué todo este revuelo? ¿Qué hace distinto Deepseek o qué aporta al mercado de la IA para que lleguemos a esa situación?

En este programa, analizamos qué es Deepseek de forma técnica: qué innovaciones ha aportado en su entrenamiento o cómo se ejecuta para ahorrar una considerable cantidad de recursos.

Te explicamos los pilares fundamentales, como la arquitectura MLA de atención latente múltiple, la arquitectura mejorada de sistemas expertos o la predicción multi-token que se usado en su entrenamiento así como las distintas capas de mejora en dicho proceso que ha permitido un modelo más eficiente, con menos necesidad de recursos y menor coste.

Una lección magistral de cómo se entrena y ejecuta la IA analizando el modelo más moderno y eficaz de la actualidad.

Iníciate en el mundo del Desarrollo iOS con el Swift Developer Program 2025. Encuentra toda la información pulsando aquí.

Suscríbete a nuestro canal de Youtube: Apple Coding en YouTube

Descubre nuestro canal de Twitch: Apple Coding en Twitch.

Descubre nuestras ofertas para oyentes:

- Cursos en Udemy (con código de oferta)

- Apple Coding Academy

- Suscríbete a Apple Coding en nuestro Patreon.

- Canal de Telegram de Swift. Acceso al canal.

---------------

Consigue las camisetas oficiales de Apple Coding con los logos de Swift y Apple Coding así como todo tipo de merchadising como tazas o fundas.

- Tienda de merchandising de Apple Coding.


Отзывы


Podcastly – лучшая платформа для любителей подкастов. Более 10 миллионов аудио контента доступных на Android/iOS/Web/Desktop и Telegram.