Resumen:
Lugares de conexión creativa como los teatros, las pinacotecas o los museos han sido y son espacios que ayudan a preservar nuestra cultura e historia, además de generadores de experiencias individuales y colectivas. En las últimas décadas, la oferta de ocio digital, la normalización del uso de grandes pantallas en los hogares, la calidad de sonido de los altavoces, la realidad virtual y aumentada, la expansión de los videojuegos colaborativos e hiperrealistas, la velocidad y latencia del 5G, el Internet de las Cosas (IoT) y los nuevos dispositivos denominados ‘smart’ han hecho que el consumo de ocio se diversifique y predomine aquello que no requiere de un desplazamiento (Fernández, 2022). Quizás estamos ante el predominio de una sociedad que cuenta con la posibilidad tecnológica de disfrutar en casa de las emociones necesarias que cubran sus depósitos de neurotransmisores (Morales García, 2022). 2022 añade a esta oferta la posibilidad global de producir obras simplemente con la palabra. ¿Cómo es esto? La Inteligencia Artificial (IA) ha hecho acto de presencia a gran escala. Como detalle, ha recibido el título de palabra del año por La Fundación del Español Urgente (FundéuRAE, 2022), promovida por la Agencia EFE y la Real Academia Española; como referencia, podemos comentar que en los dos últimos años las palabras elegidas fueron “confinamiento” (2020) y “vacuna” (2021). Y es que la IA es ya una herramienta clave para la creación de obras, tanto es así que la mayoría de las grandes plataformas digitales cuentan con alguna forma de IA para ayudarlas y ayudarnos a generar contenido, desde la creación automática de textos hasta la producción de obras visuales y de audio. En un primer término, los sistemas de IA se utilizan para generar contenido textual como artículos de noticias, artículos académicos y descripciones de productos. Así mismo, usan modelos de lenguaje entrenados para generar documentación automáticamente a partir de una base de datos o de un conjunto específico de palabras clave, además de poder emplear material previamente generado y reescribirlo para así crear contenido único. Algunos ejemplos serían: Copy.ai, Playground o ChatGPT. Los sistemas de IA también se están utilizando para crear contenido visual. Así, los sistemas de deep learning pueden generar imágenes realistas a partir de descripciones textuales, como la representación de imágenes de personas a partir de descripciones de su apariencia, por lo que pueden utilizarse para crear gráficos y animaciones. Algunos ejemplos serían: Dall-E, Stable Diffusion, Craiyon, Mid journey, o Revive en el plano audiovisual. Por último, los sistemas de IA también se pueden utilizar para crear contenido de audio. Por ejemplo, los sistemas de reconocimiento de voz se emplean para convertir la voz en texto, mientras que los sistemas de síntesis de habla se utilizan para convertir texto en voz, como Speechify, Uberduck o Fakeyou. Por ende, se pueden usar para generar música, efectos de sonido y otros contenidos de audio. Uno de los campos en los que la IA está teniendo un impacto notable es la música, facilitando la creación de canciones, componiendo partituras y mezclando sonidos. Recientemente, con la apertura del lenguaje GPT-3 de OpenAI, se ha empezado a utilizar para crear canciones y composiciones musicales. GPT-3 es una red neuronal profunda basada en el procesamiento del lenguaje natural, que puede generar contenido en base a una entrada o prompt. Así, puede ser entrenado para producir melodías y letras de canciones. Una vez entrenado, el sistema puede generar contenido musical a partir de nuestra consulta. La creación musical con la IA no se limita a este lenguaje; existe una variedad de herramientas y sistemas mediante los cuales se puede crear música. Por ejemplo, el sistema de IA de Google, Magenta, puede ser utilizado para generar melodías, ritmos y armonías. O Adobe Podcast, que usa la IA para mejorar instantáneamente una mala grabación de sonido. Otro sistema es Flow Machines (2020), que permite crear patrones rítmicos y melodías a partir de una base de datos de canciones. Algunas experiencias desarrolladas serían: ‒ Una de las más conocidas es la canción generada por GPT-3, llamada “Daddy’s Car”. Ésta fue creada a partir de un prompt y fue posteriormente mezclada por un equipo de músicos. Una vez mezclada, la canción fue lanzada como un single y alcanzó un gran éxito (Sony CLS, 2016). ‒ Otro proyecto destacado de creación musical con IA fue el de la banda Aiva. Esta banda utiliza una red neuronal para componer y mezclar canciones. (Aiva, 2022). ‒ Otra experiencia interesante fue el proyecto AI Duet (2018), desarrollado por el equipo de IA de Google. Se trata de una aplicación que permite a los usuarios componer canciones con la ayuda de una red neuronal entrenada. La red neuronal está entrenada para responder a las entradas musicales del usuario y generar una melodía a partir de ellas (Yotam, 2017). La popularización y expansión de herramientas musicales que usan la IA, trajo consigo una experiencia nueva que comenzó en el año 2020. Se trata del AI Song Contest, festival musical que va por su tercera edición, y fue ideado desde Países Bajos bajo la supervisión de la Unión Europea de Radiodifusión (UER). Este Festival será nuestro objeto de estudio, del cuál analizaremos la edición de 2022, que ha congregado a 46 equipos participantes y donde un jurado de 29 miembros ha evaluado estas creaciones; entre los mismos figuran catedráticos, profesores universitarios de musicología computacional, de arte y de diseño, científicos de datos, productoras discográficas, desarrolladores de software, ingenieros de Google o directivos de Sony, entre otros. Se trata de un concurso de canciones creadas en su totalidad por IA. El objetivo es reunir a los mejores artistas del mundo para descubrir nuevas formas de crear música. Además de participantes de todo el mundo, desde los Estados Unidos hasta Japón, pasando por Australia y el Reino Unido. El concurso contó con artistas de la vanguardia de la tecnología de IA de la industria de la música, así como con artistas que estaban interesados en experimentar con nuevas formas de crear música. “Ai-lalelo, la canción gallega creada con inteligencia artificial, se hizo con el segundo puesto del AI Song Contest, en la ciudad belga de Liège. Con una puntuación compuesta en un 50% por el televoto y otro 50% por la opinión del jurado, el grupo gallego PAMP! fue el favorito del público y el tercer mejor según el jurado” (López, 2022). Ésta “compitió contra otros 14 temas finalistas de distintos países. Demons & Gods, del grupo Yaboi Hanói (Tailandia), resultó la ganadora de esta edición del certamen” (López, 2022). Durante la gala final, “enmarcada en el Día Internacional de la inteligencia artificial, los 15 finalistas compartieron su experiencia y proceso creativo. El acto se celebró en el espacio tecnológico y de emprendimiento Le Grand Post de Liège y fue retransmitido internacionalmente por el canal oficial del festival” (López, 2022). Hasta llegar a este 2022, donde han emergido para el gran público aplicaciones como Dall-E, ChatGPT, Playground y demás iniciativas de Open.ai y proyectos de IA, han acontecido diversos hitos que han supuesto grandes pasos hacia el presente, siendo uno de los primeros el acaecido ya hace 25 años, cuando Deep Blue venció al campeón mundial de ajedrez, Gary Kasparov. Hoy día, el excampeón ha declarado que si bien la de “1997 fue una experiencia desagradable, eso le ayudó a comprender el futuro de la colaboración hombre-máquina” (Money Review, 2022), El ex campeón, y uno de los seres humanos con mayor coeficiente intelectual, 190 (Europa Press, 2013), destacaba la paradoja del austriaco Hans Moravec, un investigador en robótica que formuló en colaboración con Rodney Brooks y Marvin Minsky, la paradoja que ahora lleva su nombre: “es relativamente fácil conseguir que los ordenadores muestren capacidades similares a las de un humano adulto en un test de inteligencia o a la hora de jugar a las damas, y muy difícil lograr que adquieran las habilidades perceptivas y motoras de un bebé de un año” (Moravec, 1988). “El argumento de Moravec a la hora de formular su paradoja es sencillo: cuando desarrollamos inteligencia artificial, no hacemos sino aplicar ingeniería inversa sobre nuestra propia inteligencia. Y el esfuerzo necesario para copiar cada habilidad humana es proporcional a la antigüedad con que ésta apareció en nuestro árbol genealógico” (Merino, 2019). Aunque estamos ahora mismo en pleno alumbramiento global, si miramos estos hechos con retrospectiva, podemos contemplar la gran evolución que ha tenido esta tecnología. En especial, al menos para el gran público, es en esta década del siglo XXI cuando la Inteligencia Artificial se ha integrado en la vida cotidiana, desde la automatización industrial hasta la producción de contenido multimedia. Además de la literatura mencionada con anterioridad, y en cuanto al estado de la cuestión de este trabajo en su conjunto, debemos resaltar algunas obras que han servido de sustento al mismo: El libro “¿Hacia una nueva Ilustración? Una década trascendente”, nos ayuda a comprender hacia dónde nos están llevando los grandes avances científicos y tecnológicos de la última década y su impacto sobre las condiciones de vida de la Humanidad. Se estudia lo que se ha venido en llamar ‘una nueva Ilustración’, es decir, “un amplio diálogo para establecer unas nuevas bases filosóficas y éticas que sustenten una economía, una sociedad, una cultura y una regulación adaptadas al nuevo entorno científico-tecnológico con el objetivo de maximizar el crecimiento y el bienestar y al mismo tiempo promover el desarrollo de iniciativas comunes para afrontar el cambio climático” (VVAA, 2019). Radford, Wu, Child, Luan, Amodei y Sutskever, a través de su obra “Improving language understanding by generating synthetic training data” (2017), nos han permitido conocer cómo se han desarrollado los algoritmos más potentes a través de Open.ai. Se destaca el desarrollo de las tecnologías GPT, GPT-2 y GPT-3 como motores que tratan el big data y como coautores del constructo o producto final, además de aplicaciones de IA como Dall-E y AlphaGo, que fue capaz de derrotar al campeón mundial de Go, un juego de estrategia asiático, en 2016 (Silver, et al., 2017). Martín-Ramallal, Merchán-Murillo y Ruiz-Mondaza (2022) analizan el uso de la inteligencia artificial en la formación universitaria y el grado de aceptación entre los estudiantes. Otros autores que han realizado importantes contribuciones en estos campos y de los que hemos hecho lectura han sido Bonner (2019), Bryson (2019), Ferreira (2022) y Franganillo (2022).
Abstract:
Creative connection places such as theaters, gallows or museums have been and are spaces that help preserve our culture and history, as well as generators of individual and collective experiences. In recent decades, the supply of digital leisure, the normalization of the use of large screens in homes, the sound quality of the speakers, the virtual and augmented reality, the expansion of collaborative and hyperrealistic video games, the speed and latency of the 5G, the Internet of Things (IoT) and the new devices called ‘Smart’ have caused leisure consumption to diversify and predominate what does not require a displacement (Fernández, 2022). Perhaps we are facing the predominance of a society that has the technological possibility of enjoying the necessary emotions that cover their neurotransmitter deposits (Morales García, 2022). 2022 add to this offer the global possibility of producing works simply with the word. How is this? Artificial intelligence (AI) has made an appearance on a large scale. As a detail, he has received the title of the year of the year by the Foundation of Urgent Spanish (Fundéurae, 2022), promoted by the EFE Agency and the Royal Spanish Academy; As a reference, we can comment that in the last two years the words chosen were «confinement» (2020) and «vaccine» (2021). And it is that AI is already a key tool for the creation of works, so much so that most of the great digital platforms have some form of AI to help them and help us generate content, from the automatic creation of texts to production to production of visual and audio works. In a first term, AI systems are used to generate textual content such as news articles, academic items and product descriptions. Likewise, they use trained language models to generate documentation automatically from a database or a specific set of keywords, in addition to being able to use previously generated material and rewrite it in order to create unique content. Some examples would be: copy.ai, playground or chatgpt. AI systems are also being used to create visual content. Thus, Deep Learning systems can generate realistic images from textual descriptions, such as the representation of images of people from descriptions of their appearance, so they can be used to create graphics and animations. Some examples would be: Dall-E, Stable Diffusion, Craiyon, Mid Journey, or revives in the audiovisual plane. Finally, AI systems can also be used to create audio content. For example, voice recognition systems are used to convert voice into text, while speech synthesis systems are used to convert text into a voice, such as Speechify, Uberduk or Fakeyou. Therefore, they can be used to generate music, sound effects and other audio contents. One of the fields in which AI is having a remarkable impact is music, facilitating song creation, composing scores and mixing sounds. Recently, with the opening of the OpenAI GPT-3 language, it has begun to use to create musical songs and compositions. GPT-3 is a deep neuronal network based on natural language processing, which can generate content based on an entry or prompt. Thus, it can be trained to produce melodies and song lyrics. Once trained, the system can generate musical content from our consultation. Musical creation with AI is not limited to this language; There is a variety of tools and systems through which you can create music. For example, Google’s system, Magenta, can be used to generate melodies, rhythms and harmonies. Or adobe podcast, which uses AI to instantly improve a bad sound recording. Another system is Flow Machines (2020), which allows you to create rhythmic patterns and melodies from a song database. Some experienced experiences would be:-One of the best known is the song generated by GPT-3, called «Daddy’s Car». This was created from a prompt and was subsequently mixed by a team of musicians. Once mixed, the song was released as a single and reached great success (Sony Cls, 2016). – Another prominent musical creation project with AI was that of the AIVA band. This band uses a neuronal network to compose and mix songs. (AIVA, 2022). – Another interesting experience was the AI Duet project (2018), developed by Google’s team. It is an application that allows users to compose songs with the help of a trained neuronal network. The neuronal network is trained to respond to the user’s musical entries and generate a melody from them (Yotam, 2017). Herrami’s popularization and expansion
Título | Polo-Serrano, D., Bertola-Garbellini, A., & Martín-Ramallal, P. (2023). Análisis del Festival de la Canción de las Inteligencias Artificiales “Ai Song Contest 2022” e impacto mediático. Juan C. Figuereo Benítez. LA COMUNICACIÓN EN UN CONTEXTO CONVULSO. 442-459. Dykinson |
---|---|
Autor/s | Martín Ramallal, P. – https://investigacion.centrosanisidoro.es/pablo-nicolas-martin-ramallal/ |
Año | 2023 |
DOI |
Para mayor precisión en la búsqueda, ponga el nombre y al menos un apellido del docente.