Inteligencia artificial de código abierto

concepto de apertura aplicado a la IA

La inteligencia artificial de código abierto es un sistema de IA que se puede usar, estudiar, modificar y compartir libremente. [1] Estos atributos se extienden a cada uno de los componentes del sistema, incluidos los conjuntos de datos, el código y los parámetros del modelo, lo que promueve un enfoque colaborativo y transparente para el desarrollo de la IA. [1] Las licencias de software libre y de código abierto (FOSS), como la Licencia Apache, la Licencia MIT y la Licencia Pública General de GNU, establecen los términos bajo los cuales se puede acceder, modificar y redistribuir la inteligencia artificial de código abierto. [2]

El modelo de código abierto proporciona un acceso más amplio a la tecnología de IA, permitiendo que más personas y organizaciones participen en la investigación y el desarrollo de IA. [3] En contraste, la inteligencia artificial de código cerrado es propietaria, lo que restringe el acceso al código fuente y a los componentes internos. [3] Las empresas suelen desarrollar productos cerrados para mantener una ventaja competitiva en el mercado. Sin embargo, algunos expertos sugieren que las herramientas de IA de código abierto podrían tener una ventaja en el desarrollo sobre los productos de código cerrado y el potencial de superarlos en el mercado.[4][5]

Entre las categorías populares de proyectos de inteligencia artificial de código abierto se incluyen los grandes modelos de lenguaje, las herramientas de traducción automática y los chatbots . [6] Para que los desarrolladores de software creen recursos de inteligencia artificial (IA) de código abierto, deben confiar en los diversos componentes de software de código abierto que utilizan en su desarrollo. [7]

Historia

editar

La historia de la inteligencia artificial de código abierto está intrínsecamente ligada tanto al desarrollo de las tecnologías de IA como al crecimiento del movimiento del software de código abierto. [8] La IA de código abierto ha evolucionado significativamente en las últimas décadas, gracias a las contribuciones de diversas instituciones académicas, laboratorios de investigación, empresas tecnológicas y desarrolladores independientes. [9] Esta sección explora los principales hitos en el desarrollo de la IA de código abierto, desde sus inicios hasta su estado actual.

Década de 1990: Primeros pasos en el desarrollo de la IA y el software de código abierto

editar

El concepto de IA se remonta a mediados del siglo XX, cuando informáticos como Alan Turing y John McCarthy sentaron las bases de las teorías y algoritmos modernos de IA. [10] Una forma temprana de IA, el programa ELIZA, encargado del procesamiento del lenguaje natural, fue reimplementado y compartido en 1977 por Jeff Shrager como un programa en BASIC, y pronto traducido a muchos otros lenguajes. Las primeras investigaciones en IA se centraron en el desarrollo de sistemas de razonamiento simbólico y sistemas expertos basados en reglas . [11]

Durante este periodo, la idea del software de código abierto comenzó a tomar forma, con pioneros como Richard Stallman abogando por el software libre como medio para promover la colaboración y la innovación en la programación. [12] La Free Software Foundation, fundada en 1985 por Stallman, fue una de las primeras organizaciones importantes en promover la idea de un software que pudiera usarse, modificarse y distribuirse libremente. Las ideas de este movimiento influyeron posteriormente en el desarrollo de la IA de código abierto, a medida que más desarrolladores comenzaron a ver los beneficios potenciales de la colaboración abierta en la creación de software, incluyendo modelos y algoritmos de IA. [13] [14]

En la década de 1990, el software de código abierto comenzó a ganar mayor popularidad[15] el auge del aprendizaje automático y los métodos estadísticos también impulsó el desarrollo de herramientas de IA más prácticas. En 1993, se creó el Repositorio de Inteligencia Artificial de la CMU, con una variedad de software compartido abiertamente.[16]

Década de 2000: Surgimiento de la IA de código abierto

editar

A principios de la década de 2000, la IA de código abierto comenzó a despegar, con el lanzamiento de bibliotecas y marcos fundamentales más fáciles de usar que estaban disponibles para que cualquiera los utilizara y contribuyera a ellos. [17]

OpenCV se lanzó en 2000 [18] con una variedad de algoritmos de IA tradicionales como árboles de decisión, k-vecinos más cercanos (kNN), Naive Bayes y máquinas de vectores de soporte (SVM). [19]

En 2007 se lanzó Scikit-learn . [20] Se convirtió en una de las bibliotecas más utilizadas para el aprendizaje automático de propósito general debido a su facilidad de uso y robusta funcionalidad, proporcionando implementaciones de algoritmos comunes como regresión, clasificación y agrupamiento. [21] [22] Theano también se lanzó ese mismo año. [23]

Auge de los marcos de IA de código abierto (década de 2010)

editar

Torch, un marco de aprendizaje profundo de código abierto, se lanzó en 2002 y se convirtió en software libre con Torch7 en 2011. Posteriormente, se amplió con PyTorch y TensorFlow . [24] [25] Estos marcos permitieron a investigadores y desarrolladores crear y entrenar redes neuronales para tareas como el reconocimiento de imágenes, el procesamiento del lenguaje natural (PLN) y la conducción autónoma. [26]

AlexNet se lanzó en 2012, [27] y Word2vec para el procesamiento del lenguaje natural por Google en 2013. [28] [29]

En 2014, GloVe, [30] un competidor de Word2vec, publicó su código fuente bajo una licencia Apache 2.0, documentó los conjuntos de datos con los que se entrenó y publicó los pesos del modelo bajo una Dedicación y Licencia de Dominio Público . [31]

Inteligencia artificial generativa de código abierto (2020-Actualidad)

editar

Tras el anuncio de GPT-2, OpenAI inicialmente planeó mantener el código fuente de sus modelos en privado, alegando preocupaciones sobre aplicaciones maliciosas. [32] Sin embargo, tras la reacción negativa del público, OpenAI publicó el código fuente de GPT-2 en GitHub tres meses después de su lanzamiento. [32] OpenAI no ha publicado el código fuente ni los pesos preentrenados de los modelos GPT-3 o GPT-4, aunque los desarrolladores pueden integrar sus funcionalidades mediante la API de OpenAI. [33] [34]

El auge de los grandes modelos de lenguaje (LLM) y la IA generativa, como GPT-3 de OpenAI (2020), impulsó aún más la demanda de marcos de IA de código abierto. [35] [36] Estos modelos se han utilizado en diversas aplicaciones, como chatbots, creación de contenido y generación de código, lo que demuestra las amplias capacidades de los sistemas de IA. [37] En el momento del lanzamiento de GPT-3, GPT-2 seguía siendo el modelo de lenguaje de código abierto más potente del mundo, lo que motivó a EleutherAI a entrenar y lanzar GPT-Neo [38] y GPT-J [38] [39] en 2021.

En febrero de 2022, EleutherAI lanzó GPT-NeoX-20B, recuperando el título de modelo de lenguaje de código abierto más potente del mundo, que ostentaba Meta, cuyo modelo FairSeq Dense 13B había superado a GPT-J a finales de 2021. [40] En 2022 también se produjo el surgimiento de modelos más grandes y potentes bajo diversas licencias no de código abierto, incluidos OPT de Meta [41] y Galactica, [42] [43] BLOOM del BigScience Research Workshop, [44] [45] y GLM de la Universidad de Tsinghua.

Durante las primeras negociaciones de 2021 y 2022 sobre la legislación de IA en Europa, se presentaron propuestas para evitar la sobrerregulación de la IA de código abierto. [46] Al observar que algunas organizaciones aplicaban erróneamente la etiqueta de "código abierto" a su trabajo, en 2022, la Open Source Initiative (OSI), creadora del estándar ampliamente aceptado para el software de código abierto en 1998, comenzó a trabajar con expertos en una definición de "código abierto" que se ajustara a las necesidades del software y los modelos de IA. El aspecto más controvertido se refiere al acceso a los datos, ya que algunos modelos se entrenan con datos sensibles que no pueden divulgarse. En 2024, finalizaron la Definición de IA de Código Abierto 1.0 (OSAID 1.0), con el respaldo de más de 20 organizaciones. [47] [48] Esta definición exige la divulgación completa del software para el procesamiento de datos, el entrenamiento del modelo y la obtención de inferencias a partir del mismo. Para los datos, solo se requiere "información suficientemente detallada sobre los datos utilizados para entrenar el sistema, de modo que una persona capacitada pueda construir un sistema sustancialmente equivalente". [48]

En 2023 se lanzaron Llama 1 y 2, MPT de MosaicML, [49] [50] y los modelos Mistral y Mixtral de Mistral AI .

En 2024, Meta lanzó una colección de grandes modelos de IA, incluyendo Llama 3.1 405B, comparable a los modelos de código cerrado más avanzados. [51] La empresa afirmó que su enfoque de la IA sería de código abierto, diferenciándose así de otras grandes empresas tecnológicas. [51] La Open Source Initiative y otras organizaciones declararon que Llama no es de código abierto, a pesar de que Meta lo describiera como tal, debido a que la licencia de software de Llama prohíbe su uso para ciertos fines. [52] [53] [54]

DeepSeek lanzó su LLM V3 en diciembre de 2024 y su modelo de razonamiento R1 el 20 de enero de 2025, ambos como modelos de pesos abiertos bajo la licencia MIT. [55] [56]

Desde el lanzamiento del modelo ChatGPT de OpenAI a finales de 2022, solo se han publicado unos pocos modelos de lenguaje grandes y totalmente abiertos (pesos, datos, código, etc.). Entre ellos se encuentra la serie de modelos OLMo [57] [58] publicada por el Allen Institute for AI . En septiembre de 2025, un consorcio suizo amplió esta lista con el lanzamiento de Apertus, un modelo totalmente abierto [59] [60] disponible en dos tamaños: uno de 8 mil millones de bytes y otro de 70 mil millones de bytes.[61] Latam-GPT, un modelo abierto de origen chileno con colaboradores de otros países hispanoamericanos, es otro ejemplo de iniciativa regional en curso en este ámbito .

Marcos de trabajo

editar

La Fundación LF AI & Data, un proyecto de la Fundación Linux, ha influido significativamente en el panorama de la IA de código abierto al fomentar la colaboración y la innovación, y al apoyar proyectos de código abierto. [62] Al proporcionar una plataforma neutral, LF AI & Data reúne a desarrolladores, investigadores y organizaciones para crear soluciones de IA y datos de vanguardia, abordando desafíos técnicos críticos y promoviendo el desarrollo ético de la IA. [63]

En octubre de 2024, la fundación contaba con 77 empresas miembro de Norteamérica, Europa y Asia, y albergaba 67 proyectos de software de código abierto (OSS) aportados por una amplia gama de organizaciones, incluyendo gigantes de Silicon Valley como Nvidia, Amazon, Intel y Microsoft . [64] Otros grandes conglomerados como Alibaba, TikTok, AT&T e IBM también han contribuido. [64] Organizaciones de investigación como la Universidad de Nueva York (NYU), los laboratorios de IA de la Universidad de Michigan, la Universidad de Columbia y la Universidad Estatal de Pensilvania también son miembros asociados de la Fundación LF AI & Data. [64]

En 2024, mientras OSAID estaba en desarrollo, la Fundación Linux también elaboraba una rúbrica de componentes para un sistema de IA y publicó un borrador del Marco de Apertura de Modelos (MOF). [65] El MOF es un sistema para evaluar y clasificar la integridad y la apertura de los modelos de aprendizaje automático. Incluía tres clases de apertura, de mayor a menor: Clase I: Modelo de Ciencia Abierta; Clase II: Modelo de Herramientas Abiertas; y Clase III: Modelo Abierto. [65] [66] La Fundación Linux participó en el desarrollo de OSAID, y OSAID adoptó la misma rúbrica de componentes. [67]

En septiembre de 2022, se creó la Fundación PyTorch para supervisar el ampliamente utilizado marco de aprendizaje profundo PyTorch, donado por Meta. [68] La misión de la fundación es impulsar la adopción de herramientas de IA mediante el fomento y el mantenimiento de un ecosistema de proyectos de código abierto e independientes del proveedor, integrados con PyTorch, y democratizar el acceso a herramientas, bibliotecas y otros componentes de vanguardia, haciendo que estas innovaciones sean accesibles para todos. [69]

La Fundación PyTorch también separa la gobernanza empresarial de la técnica. El proyecto PyTorch mantiene su estructura de gobernanza técnica, mientras que la fundación gestiona la financiación, los gastos de alojamiento, los eventos y la administración de activos como el sitio web del proyecto, el repositorio de GitHub y las cuentas en redes sociales, garantizando así una gobernanza comunitaria abierta. [69] En sus inicios, la fundación formó un consejo de gobierno integrado por representantes de sus miembros fundadores: AMD, Amazon Web Services, Google Cloud, Hugging Face, IBM, Intel, Meta, Microsoft y NVIDIA. [69]

Ética

editar
Un vídeo sobre la importancia de la transparencia de la IA en la medicina.

Paralelamente al desarrollo de modelos de IA, ha crecido el interés por garantizar estándares éticos en dicho desarrollo. [70] [71] Esto incluye abordar preocupaciones como los sesgos, la privacidad y el potencial de mal uso de los sistemas de IA. [70] [71] En consecuencia, los marcos para el desarrollo responsable de la IA y la creación de directrices para documentar consideraciones éticas, como el concepto de Tarjeta de Modelo introducido por Google, [72] han ganado popularidad, si bien los estudios demuestran la necesidad continua de su adopción para evitar consecuencias negativas no deseadas. [73]

Debates

editar

Se ha especulado que el software de IA de código abierto presenta un riesgo potencialmente mayor en comparación con la IA de código cerrado, ya que los ciberdelincuentes podrían eliminar los protocolos de seguridad de los modelos públicos a su antojo. De manera similar, también se ha especulado que la IA de código cerrado presenta un mayor riesgo en comparación con la IA de código abierto debido a problemas de dependencia, privacidad, algoritmos opacos, control corporativo y disponibilidad limitada, lo que podría ralentizar la innovación beneficiosa. [74] [75] [76]

También existe un debate sobre la apertura de los sistemas de IA, ya que el concepto de apertura se diferencia.[77] Un artículo en Nature sugiere que algunos sistemas presentados como abiertos, como Llama 3 de Meta, «ofrecen poco más que una API o la posibilidad de descargar un modelo sujeto a restricciones de uso claramente no abiertas». Este tipo de software ha sido criticado por « lavado de imagen de apertura » [78] refiriéndose a sistemas que se entienden mejor como cerrados [75] Existen trabajos y marcos que evalúan la apertura de los sistemas de IA [77] así como una nueva definición de la Open Source Initiative sobre qué constituye la IA de código abierto.[79][80][81] Algunos modelos de lenguaje de gran tamaño se publican con pesos abiertos, lo que significa que sus parámetros entrenados están disponibles públicamente, aunque el código de entrenamiento y los datos no lo estén.[82][83]

Marcos para la mejora

editar

Los esfuerzos para contrarrestar estos desafíos han dado como resultado la creación de marcos de documentación estructurados que guían el desarrollo y la implementación ética de la IA:

  • Fichas de modelo : Presentadas en un artículo de investigación de Google, estas fichas ofrecen transparencia sobre el uso previsto, las limitaciones y las métricas de rendimiento de un modelo de IA en diferentes grupos demográficos. [84] [72] Sirven como herramienta estandarizada para destacar consideraciones éticas y facilitar un uso informado. [84] [72] Aunque aún es relativamente nuevo, Google cree que este marco desempeñará un papel crucial para aumentar la transparencia de la IA. [72]
  • Modelado de medición: Este método combina enfoques cualitativos y cuantitativos desde una perspectiva de las ciencias sociales, proporcionando un marco que ayuda a los desarrolladores a verificar si un sistema de IA mide con precisión lo que afirma medir. El marco se centra en dos conceptos clave: la fiabilidad test-retest (fiabilidad de constructo) y la validez de constructo (si un modelo mide lo que pretende modelar). Mediante estos conceptos, este modelo permite a los desarrolladores desglosar ideas abstractas que no se pueden medir directamente (como el estatus socioeconómico) en componentes específicos y medibles, a la vez que detecta errores o discrepancias que podrían generar sesgos. Al clarificar estos supuestos, este marco contribuye a crear sistemas de IA más justos y fiables. [85]
  • Hojas de datos para conjuntos de datos : Este marco de trabajo hace hincapié en la documentación de la motivación, la composición, el proceso de recopilación y los casos de uso recomendados de los conjuntos de datos. Al detallar el ciclo de vida del conjunto de datos, las hojas de datos permiten a los usuarios evaluar su idoneidad y limitaciones.[86]
  • Apertura de ChatGPT: seguimiento de la apertura de los LLM ajustados a las instrucciones : un recurso público impulsado por la comunidad que evalúa la apertura de los modelos de generación de texto. [87]
  • Marco de apertura de modelos : Este enfoque emergente incluye principios para el desarrollo transparente de la IA, centrándose en la accesibilidad tanto de los modelos como de los conjuntos de datos para permitir la auditoría y la rendición de cuentas.[88]
  • Índice Europeo de IA de Código Abierto : Este índice recopila información sobre la apertura de modelos, las licencias y la regulación de la UE de los sistemas y proveedores de IA generativa. Es un recurso público sin ánimo de lucro alojado en la Universidad Radboud de Nimega, Países Bajos . [89]

A medida que crece el uso de la IA, la mayor transparencia y la reducción de los sesgos en los modelos se han convertido en una preocupación cada vez más importante. [90] Estos marcos pueden ayudar a capacitar a los desarrolladores y a las partes interesadas para identificar y mitigar los sesgos, fomentando la equidad y la inclusión en los sistemas de IA. [85] [90]

Véase también

editar

Referencias

editar
  1. 1 2 «The Open Source AI Definition – 1.0». Open Source Initiative (en inglés estadounidense). Archivado desde el original el 31 de marzo de 2025. Consultado el 14 de noviembre de 2024.
  2. «Licenses». Open Source Initiative (en inglés estadounidense). Archivado desde el original el 10 de febrero de 2018. Consultado el 14 de noviembre de 2024.
  3. 1 2 Hassri, Myftahuddin Hazmi; Man, Mustafa (7 de diciembre de 2023). «The Impact of Open-Source Software on Artificial Intelligence». Journal of Mathematical Sciences and Informatics (en inglés) 3 (2). ISSN 2948-3697. doi:10.46754/jmsi.2023.12.006.
  4. Solaiman, Irene. «Generative AI Systems Aren't Just Open or Closed Source». Wired (en inglés estadounidense). ISSN 1059-1028. Consultado el 13 de noviembre de 2025.
  5. Eiras, Francisco; Petrov, Aleksandar; Vidgen, Bertie; Schroeder, Christian; Pizzati, Fabio; Elkins, Katherine; Mukhopadhyay, Supratik; Bibi, Adel (30 de mayo de 2024), Risks and Opportunities of Open-Source Generative AI, doi:10.48550/arXiv.2405.08597, consultado el 13 de noviembre de 2025.
  6. Castelvecchi, Davide (29 de junio de 2023). «Open-source AI chatbots are booming — what does this mean for researchers?». Nature 618 (7967): 891-892. Bibcode:2023Natur.618..891C. PMID 37340135. doi:10.1038/d41586-023-01970-6.
  7. . 20th International Federation of Information Processing WG 6.11 Conference on e-Business, e-Services and e-Society, Galway, Ireland, September 1–3, 2021 12896. Springer. 2021. pp. 629-640. ISBN 978-3-030-85446-1. doi:10.1007/978-3-030-85447-8_52.
  8. «The Evolution of Open Source: From Software to AI: Argano». argano.com. Consultado el 24 de noviembre de 2024.
  9. Staff, Kyle Daigle, GitHub (8 de noviembre de 2023). «Octoverse: The state of open source and rise of AI in 2023». The GitHub Blog (en inglés estadounidense). Consultado el 24 de noviembre de 2024.
  10. «Appendix I: A Short History of AI | One Hundred Year Study on Artificial Intelligence (AI100)». ai100.stanford.edu (en inglés). Consultado el 24 de noviembre de 2024.
  11. Kautz, Henry (31 de marzo de 2022). «The Third AI Summer: AAAI Robert S. Engelmore Memorial Lecture». AI Magazine (en inglés) 43 (1): 105-125. ISSN 2371-9621. doi:10.1002/aaai.12036.
  12. «Why Software Should Be Free - GNU Project - Free Software Foundation». www.gnu.org. Archivado desde el original el 1 de diciembre de 2024. Consultado el 24 de noviembre de 2024.
  13. «The Power of Collaboration: How Open-Source Projects are Advancing AI».
  14. Staff, Kyle Daigle, GitHub (8 de noviembre de 2023). «Octoverse: The state of open source and rise of AI in 2023». The GitHub Blog (en inglés estadounidense). Consultado el 24 de noviembre de 2024.
  15. Code, Linux (3 de noviembre de 2024). «A Brief History of Open Source – TheLinuxCode». TheLinuxCode (en inglés estadounidense). Archivado desde el original el 22 de junio de 2025. Consultado el 13 de noviembre de 2025.
  16. «Topic: (/)». www.cs.cmu.edu. Consultado el 11 de septiembre de 2025.
  17. Priya (28 de marzo de 2024). «The Evolution of Open Source AI Libraries: From Basement Brawls to AI All-Stars». TheGen.AI (en inglés). Consultado el 24 de noviembre de 2024.
  18. Pulli, Kari; Baksheev, Anatoly; Kornyakov, Kirill; Eruhimov, Victor (1 de abril de 2012). «Realtime Computer Vision with OpenCV». ACM Queue 10 (4): 40:40-40:56. doi:10.1145/2181796.2206309.
  19. Adrian Kaehler; Gary Bradski (14 de diciembre de 2016). Learning OpenCV 3: Computer Vision in C++ with the OpenCV Library. O'Reilly Media. pp. 26ff. ISBN 978-1-4919-3800-3.
  20. «About us». scikit-learn (en inglés). Archivado desde el original el 6 de noviembre de 2020. Consultado el 24 de noviembre de 2024.
  21. «Testimonials». scikit-learn (en inglés). Archivado desde el original el 6 de mayo de 2020. Consultado el 24 de noviembre de 2024.
  22. Makkar, Akashdeep (9 de junio de 2021). «What Is Scikit-learn and why use it for machine learning?». Data Courses (en inglés estadounidense). Consultado el 24 de noviembre de 2024.
  23. Bergstra, J.; O. Breuleux; F. Bastien; P. Lamblin; R. Pascanu; G. Desjardins; J. Turian; D. Warde-Farley et al. (30 de junio de 2010). «Theano: A CPU and GPU Math Expression Compiler». Proceedings of the Python for Scientific Computing Conference (SciPy) 2010.
  24. Mewawalla, Rahul (31 de octubre de 2024). «The democratization of AI: Shaping our collective future». Fast Company.
  25. Costa, Carlos J.; Aparicio, Manuela; Aparicio, Sofia; Aparicio, Joao Tiago (January 2024). «The Democratization of Artificial Intelligence: Theoretical Framework». Applied Sciences (en inglés) 14 (18): 8236. ISSN 2076-3417. doi:10.3390/app14188236.
  26. Sushumna, Aparna (10 de junio de 2024). «Deep Learning in NLP and Image Recognition». 5DataInc (en inglés estadounidense). Consultado el 25 de noviembre de 2024.
  27. Lee, Timothy B. (11 de noviembre de 2024). «How a stubborn computer scientist accidentally launched the deep learning boom». Ars Technica (en inglés). Consultado el 11 de septiembre de 2025.
  28. Mikolov, Tomas; Chen, Kai; Corrado, Greg; Dean, Jeffrey (10 de septiembre de 2013), Efficient Estimation of Word Representations in Vector Space, doi:10.48550/arXiv.1301.3781, consultado el 13 de noviembre de 2025.
  29. . Advances in Neural Information Processing Systems. 2013.
  30. Pennington, Jeffrey; Socher, Richard; Manning, Christopher (2014). Glove: Global Vectors for Word Representation (en inglés). Association for Computational Linguistics. pp. 1532-1543. doi:10.3115/v1/D14-1162.
  31. Implementation of the GloVe model for learning word representations, Stanford NLP, 24 de julio de 2025, consultado el 24 de julio de 2025.
  32. 1 2 Xiang, Chloe (28 de febrero de 2023). «OpenAI Is Now Everything It Promised Not to Be: Corporate, Closed-Source, and For-Profit». VICE (en inglés estadounidense). Consultado el 14 de noviembre de 2024.
  33. «OpenAI is giving Microsoft exclusive access to its GPT-3 language model». MIT Technology Review (en inglés). Archivado desde el original el 5 de febrero de 2021. Consultado el 8 de diciembre de 2024.
  34. «API platform». openai.com (en inglés estadounidense). Consultado el 8 de diciembre de 2024.
  35. Daigle, Kyle (8 de noviembre de 2023). «Octoverse: The state of open source and rise of AI in 2023». The GitHub Blog (en inglés estadounidense). Archivado desde el original el 21 de enero de 2025. Consultado el 24 de noviembre de 2024.
  36. «GPT-3 powers the next generation of apps». 29 de marzo de 2024.
  37. «Generative AI vs. Large Language Models (LLMs): What's the Difference?». appian.com (en inglés). Consultado el 25 de noviembre de 2024.
  38. 1 2 «GPT-3's free alternative GPT-Neo is something to be excited about». VentureBeat (en inglés estadounidense). 15 de mayo de 2021. Archivado desde el original el 9 de marzo de 2023. Consultado el 14 de abril de 2023.
  39. «Why Release a Large Language Model?». EleutherAI (en inglés estadounidense). 2 de junio de 2021.
  40. «EleutherAI: When OpenAI Isn't Open Enough». IEEE Spectrum (en inglés estadounidense). 2 de junio de 2021.
  41. Heaven, Will (3 de mayo de 2022). «Meta has built a massive new language AI—and it's giving it away for free». MIT Technology Review. Consultado el 26 de diciembre de 2023.
  42. Heaven, Will (18 de noviembre de 2022). «Why Meta's latest large language model survived only three days online». MIT Technology Review. Consultado el 26 de diciembre de 2023.
  43. Goldman, Sharon (18 de noviembre de 2022). [venturebeat.com/ai/what-meta-learned-from-galactica-the-doomed-model-launched-two-weeks-before-chatgpt/ «What Meta learned from Galactica, the doomed model launched two weeks before ChatGPT»] |url= incorrecta (ayuda). VentureBeat. Consultado el 21 de julio de 2025.
  44. Heikkilä, Melissa (12 de julio de 2022). «BLOOM: Inside the radical new project to democratize AI». MIT Technology Review. Consultado el 26 de diciembre de 2023.
  45. «Release of largest trained open-science multilingual language model ever». French National Centre for Scientific Research. 12 de julio de 2022. Consultado el 26 de diciembre de 2023.
  46. «AI Act and Open Source». Open Future (en inglés estadounidense). Consultado el 24 de julio de 2025.
  47. Vaughan-Nichols, Steven (24 de octubre de 2024). «We have an official open-source AI definition now, but the fight is far from over». ZDNET (en inglés). Consultado el 24 de julio de 2025.
  48. 1 2 «The Open Source AI Definition – 1.0». Open Source Initiative (en inglés estadounidense). Consultado el 24 de julio de 2025.
  49. Nunez, Michael (22 de junio de 2023). «MosaicML challenges OpenAI with its new open-source language model». VentureBeat. Consultado el 21 de julio de 2025.
  50. Chen, Joanne (19 de julio de 2023). «MosaicML launches MPT-7B-8K, a 7B-parameter open-source LLM with 8k context length». VentureBeat. Consultado el 21 de julio de 2025.
  51. 1 2 Mirjalili, Seyedali (1 de agosto de 2024). «Meta just launched the largest 'open' AI model in history. Here's why it matters». The Conversation (en inglés estadounidense). Consultado el 14 de noviembre de 2024.
  52. Waters, Richard (17 de octubre de 2024). «Meta under fire for 'polluting' open-source». Financial Times. Consultado el 14 de noviembre de 2024.
  53. Edwards, Benj (18 de julio de 2023). «Meta launches Llama 2, a source-available AI model that allows commercial applications». Ars Technica. Archivado desde el original el 7 de noviembre de 2023. Consultado el 14 de diciembre de 2024.
  54. «Meta offers Llama AI to US government for national security». CIO. 5 de noviembre de 2024. Archivado desde el original el 14 de diciembre de 2024. Consultado el 14 de diciembre de 2024.
  55. «How a top Chinese AI model overcame US sanctions». Archivado desde el original el 25 de enero de 2025. Consultado el 3 de febrero de 2025.
  56. Guo, Daya et al. (18 de septiembre de 2025). «DeepSeek-R1 incentivizes reasoning in LLMs through reinforcement learning». Nature 645 (8081): 633-638. Bibcode:2025Natur.645..633G. PMC 12443585. PMID 40962978. doi:10.1038/s41586-025-09422-z.
  57. Groeneveld, Dirk; Beltagy, Iz; Walsh, Pete; Bhagia, Akshita; Kinney, Rodney; Tafjord, Oyvind; Jha, Ananya Harsh; Ivison, Hamish (7 de junio de 2024), OLMo: Accelerating the Science of Language Models.
  58. OLMo, Team; Walsh, Pete; Soldaini, Luca; Groeneveld, Dirk; Lo, Kyle; Arora, Shane; Bhagia, Akshita; Gu, Yuling (15 de enero de 2025), 2 OLMo 2 Furious.
  59. Welle, Elissa (3 de septiembre de 2025). «Switzerland releases an open-weight AI model». The Verge (en inglés estadounidense). Consultado el 8 de octubre de 2025.
  60. Allen, Matthew (2 de septiembre de 2025). «Switzerland launches transparent ChatGPT alternative». SWI swissinfo.ch (en inglés). Consultado el 8 de octubre de 2025.
  61. Hernández-Cano, Alejandro; Hägele, Alexander; Huang, Allen Hao; Romanou, Angelika; Solergibert, Antoni-Joan; Pasztor, Barna; Messmer, Bettina; Garbaya, Dhia (17 de septiembre de 2025), Apertus: Democratizing Open and Compliant LLMs for Global Language Environments.
  62. «Projects – LFAI & Data». lfaidata.foundation (en inglés estadounidense). Consultado el 8 de diciembre de 2024.
  63. «LFAI & Data – Linux Foundation Project». lfaidata.foundation (en inglés estadounidense). Archivado desde el original el 29 de octubre de 2023. Consultado el 8 de diciembre de 2024.
  64. 1 2 3 «LF AI & Data Landscape». LF AI & Data Landscape (en inglés). Consultado el 14 de noviembre de 2024.
  65. 1 2 «ZDNet: "We're a big step closer to defining open source AI - but not everyone is happy"». CNCF (en inglés estadounidense). 23 de agosto de 2024. Consultado el 24 de julio de 2025.
  66. «Introducing the Model Openness Framework: Promoting Completeness and Openness for Reproducibility, Transparency and Usability in AI – LFAI & Data». lfaidata.foundation (en inglés estadounidense). Consultado el 24 de julio de 2025.
  67. «Cailean Osborne: voices of the Open Source AI Definition». Open Source Initiative (en inglés estadounidense). 18 de julio de 2024. Consultado el 24 de julio de 2025.
  68. «Announcing the PyTorch Foundation to Accelerate Progress in AI Research». Meta (en inglés estadounidense). 12 de septiembre de 2022. Consultado el 14 de noviembre de 2024.
  69. 1 2 3 «PyTorch Foundation». PyTorch (en inglés). Consultado el 14 de noviembre de 2024.
  70. 1 2 Gujar, Praveen. «Council Post: Building Trust In AI: Overcoming Bias, Privacy And Transparency Challenges». Forbes (en inglés). Consultado el 25 de noviembre de 2024.
  71. 1 2 «Ethical Issues in Open-Source Intelligence | Restackio». www.restack.io (en inglés). Archivado desde el original el 1 de diciembre de 2024. Consultado el 25 de noviembre de 2024.
  72. 1 2 3 4 «Google Model Cards». modelcards.withgoogle.com. Consultado el 25 de noviembre de 2024.
  73. Mitchell, Margaret; Wu, Simone; Zaldivar, Andrew; Barnes, Parker; Vasserman, Lucy; Hutchinson, Ben; Spitzer, Elena; Raji, Inioluwa Deborah et al. (5 de octubre de 2018). Model Cards for Model Reporting (en inglés). pp. 220-229. ISBN 978-1-4503-6125-5. doi:10.1145/3287560.3287596.
  74. Toma, Augustin; Senkaiahliyan, Senthujan; Lawler, Patrick R.; Rubin, Barry; Wang, Bo (December 2023). «Generative AI could revolutionize health care — but not if control is ceded to big tech». Nature (en inglés) 624 (7990): 36-38. Bibcode:2023Natur.624...36T. PMID 38036861. doi:10.1038/d41586-023-03803-y.
  75. 1 2 Widder, David Gray; Whittaker, Meredith; West, Sarah Myers (November 2024). «Why 'open' AI systems are actually closed, and why this matters». Nature (en inglés) 635 (8040): 827-833. Bibcode:2024Natur.635..827W. ISSN 1476-4687. PMID 39604616. doi:10.1038/s41586-024-08141-1.
  76. «What is open source AI and why is profit so important to the debate?». euronews (en inglés). 20 de febrero de 2024. Consultado el 28 de noviembre de 2024.
  77. 1 2 Liesenfeld, Andreas; Lopez, Alianda; Dingemanse, Mark (19 de julio de 2023). «Opening up ChatGPT: Tracking openness, transparency, and accountability in instruction-tuned text generators». Proceedings of the 5th International Conference on Conversational User Interfaces. Association for Computing Machinery. pp. 1-6. ISBN 979-8-4007-0014-9. doi:10.1145/3571884.3604316.
  78. Liesenfeld, Andreas; Dingemanse, Mark (5 de junio de 2024). «Rethinking open source generative AI: Open washing and the EU AI Act». The 2024 ACM Conference on Fairness, Accountability, and Transparency. Association for Computing Machinery. pp. 1774-1787. ISBN 979-8-4007-0450-5. doi:10.1145/3630106.3659005.
  79. «The Open Source AI Definition — by The Open Source Initiative». opensource.org. Consultado el 28 de noviembre de 2024.
  80. «We finally have a definition for open-source AI». MIT Technology Review (en inglés). Consultado el 28 de noviembre de 2024.
  81. Robison, Kylie (28 de octubre de 2024). «Open-source AI must reveal its training data, per new OSI definition». The Verge (en inglés). Consultado el 28 de noviembre de 2024.
  82. «Open Weights: not quite what you've been told». Open Source Initiative (en inglés estadounidense). Consultado el 23 de septiembre de 2025.
  83. «OpenAI releases lower-cost models to rival Meta, Mistral and DeepSeek». CNBC (en inglés). 5 de agosto de 2025. Consultado el 23 de septiembre de 2025.
  84. 1 2 Mitchell, Margaret; Wu, Simone; Zaldivar, Andrew; Barnes, Parker; Vasserman, Lucy; Hutchinson, Ben; Spitzer, Elena; Raji, Inioluwa Deborah et al. (5 de octubre de 2018). Model Cards for Model Reporting (en inglés). pp. 220-229. ISBN 978-1-4503-6125-5. doi:10.1145/3287560.3287596.
  85. 1 2 Jacobs, Abigail Z.; Wallach, Hanna (12 de marzo de 2021), «Measurement and Fairness», Proceedings of the 2021 ACM Conference on Fairness, Accountability, and Transparency, pp. 375-385, ISBN 978-1-4503-8309-7, doi:10.1145/3442188.3445901.
  86. Gebru, Timnit (23 de marzo de 2018). «Datasheets for Datasets». arXiv.org (en inglés). Consultado el 13 de noviembre de 2025.
  87. Liesenfeld, Andreas; Lopez, Alianda; Dingemanse, Mark (2023). Opening up ChatGPT: Tracking openness, transparency, and accountability in instruction-tuned text generators. ACM Digital Library. pp. 1-6. ISBN 979-8-4007-0014-9. doi:10.1145/3571884.3604316. Consultado el 19 de febrero de 2023.
  88. White, Matt (20 de marzo de 2024). «The Model Openness Framework: Promoting Completeness and Openness for Reproducibility, Transparency, and Usability in Artificial Intelligence». arXiv.org (en inglés). Consultado el 13 de noviembre de 2025.
  89. «About European open source AI Index». www.osai-index.eu. OSAI Index. Archivado desde el original el 20 de febrero de 2025. Consultado el 19 de febrero de 2025.
  90. 1 2 Gujar, Praveen. «Council Post: Building Trust In AI: Overcoming Bias, Privacy And Transparency Challenges». Forbes (en inglés). Consultado el 27 de noviembre de 2024.

Enlaces externos

editar