El gigante tecnológico chino ByteDance, reconocido por su plataforma TikTok, se encuentra en el ojo del huracán tras supuestamente infringir las condiciones de servicio establecidas por OpenAI y Microsoft.
En su afán por desarrollar un chatbot propio, ByteDance ha enfrentado duras críticas. La compañía asiática habría empleado tecnología de OpenAI de manera que contraviene las reglas fijadas por Sam Altman y su equipo. Esta información, revelada recientemente por The Verge, ya ha tenido repercusiones: OpenAI ha anunciado la suspensión de la cuenta de ByteDance mientras se investiga a fondo lo sucedido.
Esta situación se suma a la larga lista de episodios en la competencia desenfrenada en el campo de la inteligencia artificial.
ByteDance parece haber eludido los detalles. Según datos expuestos por Alex Heath en The Verge, la compañía china detrás de TikTok habría utilizado en secreto la tecnología de OpenAI para crear su propio modelo de lenguaje LLM (Large Language Model). El propósito principal de esta acción habría sido mantenerse a la vanguardia en el terreno de la inteligencia artificial, un ámbito en el que ByteDance ya demostró su capacidad a través del feed de TikTok.
La controversia en torno a ByteDance radica en la posible violación de las condiciones de servicio de OpenAI para el uso de su tecnología. La política de la firma liderada por Sam Altman, creadora de ChatGPT, prohíbe explícitamente utilizar los resultados de sus modelos “para desarrollar modelos de IA que compitan” con sus propios productos y servicios. Según The Verge, ByteDance accedió a OpenAI a través de Microsoft, quien aplica una política similar.
Las normativas de uso de OpenAI, detalladas en su sitio web para particulares y empresas, establecen claramente que no se permite “usar la salida (output) para entrenar cualquier modelo de IA que compita con nuestros productos y servicios”. Además, prohíben “cualquier método para extraer datos de los Servicios que no estén permitidos a través de las APIs”.
Alex Heath afirma haber obtenido acceso a documentos internos de ByteDance que muestran el uso de la API de OpenAI para el desarrollo de su propio LLM bajo el nombre en clave ‘Project Seed’, abarcando casi todas las etapas de creación del modelo, incluyendo entrenamiento y evaluación posterior. También se mencionan conversaciones en la plataforma interna de ByteDance, Lark, sobre la manipulación de pruebas mediante el manejo de datos.
En cuanto al chatbot Doubao de ByteDance, una vez obtuvo la aprobación de los reguladores para su uso en China, la empresa matriz de TikTok habría ordenado a sus empleados detener el uso de la API en ‘Project Seed’, aunque aparentemente se mantuvo su uso para evaluar el rendimiento del chatbot, según reporta The Verge.
La respuesta de OpenAI no se ha hecho esperar. La compañía, en medio de una compleja crisis de liderazgo, ha suspendido la cuenta de ByteDance debido al presunto uso inadecuado de GPT durante el entrenamiento de su propio modelo de IA. OpenAI afirma que todos los clientes de su API deben cumplir con las políticas de uso para garantizar un uso ético de su tecnología y han decidido suspender la cuenta de ByteDance mientras investigan a fondo el incidente.
ByteDance ha negado cualquier irregularidad. En declaraciones a Business Insider, la compañía china niega haber incumplido normativas y asegura contar con licencia de Microsoft para utilizar las API de GPT de OpenAI. Si bien admiten haber recurrido a GPT para mejorar productos fuera de China, resaltan el uso de su modelo de desarrollo propio para Doubao, una herramienta exclusiva del mercado chino.
Esta controversia en torno a ByteDance surge en un momento crucial, con empresas como Microsoft, Google, Amazon, Meta y otros avanzando en sus propias iniciativas en el campo de la IA. Recientemente, el diario South China Morning Post (SCMP) informó sobre el lanzamiento de ByteDance en la carrera de la IA generativa y su trabajo en una herramienta para la creación de chatbots, una “plataforma de desarrollo” que, según fuentes del periódico, tiene previsto su lanzamiento como versión beta pública antes de 2024.
Imagen de portada: ByteDance
Vía: The Verge