Estados Unidos ha trabajado de manera constante en los últimos tres años para limitar el acceso de China a los chips informáticos de vanguardia que alimentan los sistemas de inteligencia artificial avanzados. Su objetivo ha sido ralentizar el progreso de China en el desarrollo de modelos de IA sofisticados.
Ahora una firma china, Deepseek, ha creado esa misma tecnología. En las últimas semanas, Deepseek lanzó múltiples modelos de IA y un chatbot cuyo rendimiento rivaliza con los mejores productos hechos por las empresas estadounidenses, todo mientras usa muchos menos chips de IA de alto costo que las empresas generalmente necesitan. Durante el fin de semana, el chatbot de Deepseek se disparó a la cima de las listas de la tienda de aplicaciones de Apple mientras la gente lo descargaba en todo el mundo.
El desarrollo ha planteado grandes preguntas sobre los controles de exportación construidos por los Estados Unidos en los últimos años. La administración de Biden estableció un sistema de reglas globales y las expandió constantemente Para tratar de mantener la tecnología AI avanzada – particularmente chips hechos por Nvidia – fuera de las manos chinas. Les preocupaba que la tecnología le daría a China una ventaja no solo económicamente, pero también militarmente.
El desarrollo de Deepseek ha provocado un debate feroz sobre si los controles tecnológicos de EE. UU. Han fallado. Esto es lo que debe saber.
Las innovaciones de Deepseek sugieren que la administración Biden puede haber actuado demasiado lentamente para mantenerse al día con las empresas privadas que evitan sus controles.
Deepseek ha dicho que su modelo más reciente fue entrenado en NVIDIA H800S. Este es un chip de IA que Nvidia desarrolló específicamente para el mercado chino después de que se impusieron los controles de exportación por primera vez, y eso causó una buena cantidad de drama en Washington.
Cuando Estados Unidos pone restricciones en las chips más avanzadas de Nvidia en 2022Nvidia se adaptó rápidamente creando chips ligeramente degradados que cayeron justo bajo el umbral que el gobierno había establecido. Estos chips eran técnicamente legales para que las empresas chinas lo usen, pero les permitieron lograr prácticamente los mismos resultados.
Esto enfureció a los funcionarios de Biden, y se movieron para restringir los nuevos chips también. Pero el gobierno se movió lentamente y les tomó aproximadamente un año para prohibir el H800 y otras chips degradados. Mientras tanto, las empresas chinas almacenaron muchos de ellos.
No está claro cómo Deepseek obtuvo su NVIDIA H800S, pero habría sido legal para la compañía comprarlos a fines de 2022 o 2023. Ahora, sin embargo, tales compras no lo serían.
«No puedes controlar lo que ya está ahí», dijo Jimmy Goodrich, asesor principal de análisis de tecnología en Rand Corporation. «Si la administración Biden hubiera respondido y limitado más rápidamente el H800 a China, no hay duda de que Deepseek habría sido más desafiado al sacar este modelo».
Deepseek también pasó años acumulando su suministro de chips antes de que entrara en vigencia los controles de Washington. Para 2021, Deepseek era una de un puñado de compañías chinas que habían adquirido al menos 10,000 A100 nvidia, el Chip Nvidia avanzado lanzado en 2020, según una entrevista con Liang Wenfeng, el fundador de Deepseek, en el medio de comunicación chino 36kr.
Estados Unidos también ha tenido problemas para eliminar el contrabando de chips.
No hay evidencia de que Deepseek haya usado chips de contrabando. Pero muchas compañías chinas de IA tienen. Alexandr Wang, director ejecutivo de la AI Giant Scale AI, AI, le dijo al New York Times Que las compañías chinas tenían muchas más chips de alta gama que las restricciones estadounidenses permitidas, y que Deepseek probablemente tenía alrededor de 50,000 procesadores H100 avanzados de Nvidia, «de los cuales obviamente no pueden hablar».
Tanto Nvidia como el gobierno de los Estados Unidos han argumentado que la escala de contrabando era limitada. Pero The Times el año pasado informó un comercio activo en China en tecnología de IA restringida. En un mercado bullicioso en Shenzhen, en el sur de China, los vendedores de chips informaron que participaron en ventas que involucraron cientos o miles de chips restringidos.
Representantes de 11 compañías dijeron que vendieron o transportaron chips Nvidia prohibidos, incluidos A100 y H100, el más avanzado de la compañía en ese momento, y el Times encontró a docenas más de negocios que los ofrecían en línea. Un proveedor en Shenzhen mostró una captura de pantalla de reportero que organizaba entregas de servidores que contienen más de 2,000 de los chips más avanzados de Nvidia, una transacción por un total de $ 103 millones.
Desde entonces, más informes han surgido documentar el contrabando a gran escala, particularmente a través de otros países de Asia.
La administración Biden lanzó una regulación radical Este mes, eso tiene como objetivo lidiar con el problema de contrabando, estableciendo límites en la cantidad de chips que Nvidia puede vender a todos los países en todo el mundo.
Queda por ver lo que hará la administración Trump al respecto. Sin embargo, en una orden ejecutiva de comercio, el presidente Trump firmó su primer día en el cargo, ordenó a sus funcionarios que revisen el sistema de control de exportaciones de EE. UU., Incluyendo «cómo identificar y eliminar las lagunas en los controles de exportación existentes».
Los controles estadounidenses parecen haber alentado el ingenio chino, pero también han retrasado el desarrollo de IA de China.
Las restricciones tecnológicas estadounidenses parecen haber acelerado los esfuerzos de los investigadores chinos para tratar de hacer más con menos.
Lo más notable del modelo de Deepseek es que, según la compañía, se desarrolló con solo una fracción de los chips de alto precio que las compañías occidentales han utilizado para hacer tecnología similar. Los ingenieros de Deepseek dijeron que usaron solo alrededor de 2,000 chips Nvidia, mientras que la mayoría de las principales compañías han entrenado chatbots usando 16,000 chips o más. Las acciones de Nvidia hundido bruscamente El lunes, teme que las empresas de tecnología puedan hacer IA de vanguardia en el futuro mientras pagan a Nvidia mucho menos.
Jeffrey Ding, profesor de la Universidad George Washington que estudia tecnologías emergentes, dijo que la mayoría de las empresas globales han estado utilizando cantidades cada vez más principales de potencia informática y datos para mejorar el rendimiento de la IA. Pero Deepseek y otras empresas chinas habían sido «obligados a seguir esta vía para averiguar si podemos obtener un rendimiento lo suficientemente bueno con costos de capacitación más bajos y menos calcular», dijo.
Las implicaciones de modelos más baratos como Deepseek's podrían ser profundos. Con Deepseek compartiendo abiertamente detalles sobre cómo construyó su modelo, las empresas en China y en todo el mundo podrán replicar su enfoque de bajo costo.
El medio «será mucho más barato y podría ser mucho menos intensivo en la energía para cualquiera para construir y ejecutar IA, desde hiperscalers estadounidenses hasta pequeñas empresas del medio oeste, piratas informáticos norcoreanos y el ejército de Rusia», dijo Martin Chorzempa, miembro del Instituto Peterson en el Instituto Peterson. para economía internacional.
Aún así, es probable que China esté mucho más adelante en la IA sin los controles de exportación. En las entrevistas, el fundador de Deepseek ha reconocido que la falta de acceso al poder informático era una limitación para la compañía.
A diferencia de las compañías de IA estadounidenses, Deepseek no podrá comprar legalmente la nueva generación de chips de IA que Nvidia está implementando en este momento, lo que multiplica la velocidad y el rendimiento de los chips anteriores.
«Cualquier persona preocupada por lo que Deepseek puede hacer hoy estaría más preocupado si lo hubiera hecho con acceso a los recursos informáticos muy superiores que tienen sus competidores estadounidenses», dijo Chorzempa.
El éxito de Deepseek sugiere que el liderazgo de Silicon Valley en AI se ha reducido, a pesar de los esfuerzos de Washington para limitar el acceso chino a las chips avanzados. Pero es notable que Deepseek todavía esté construyendo sus modelos en chips Nvidia, no en los chips de IA rivales que la firma de tecnología china Huawei está tratando de desarrollar.
Algunos ingenieros informáticos chinos han sugerido que sería posible ejecutar el último modelo Deepseek en un mayor número de chips menos avanzados, incluidos los hechos por Huawei, a pesar de que los chips AI de Huawei tienen mucho más rendimiento.
Pero ninguna empresa china aún puede hacer chips AI avanzados que rivalizan con Nvidia's, o fabriquen el tipo de maquinaria compleja necesaria para hacer esas chips. «La única ventaja que Estados Unidos todavía tiene sobre China en este momento es en el hardware», dijo Goodrich.
(Tagstotranslate) INTELIGENCIA ARTIFICAL (T) CHIPS DE COMPUTADOR (T) Deepseek inteligencia artificial Co Ltd
Source link