Las inteligencias artificiales siguen demostrando cada día nuevas características y capacidades que no dejan de ser sorprendentes y cautivadoras. Recientemente estuve realizando algunas pruebas utilizando a Bing, el sistema de inteligencia artificial de Microsoft, mismo que se encuentra potencializado por el motor de ChatGPT, de la empresa OpenAI.
Los resultados de estas pruebas fueron realmente interesantes, ya que dentro de la conversación que se suscitó, le solicité a Bing que generara una serie de imágenes basadas en un interés personal, es decir, los video juegos, pidiéndole a la IA que, utilizando su motor de generación de imágenes (provisto por el motor de DALL-E de la misma OpenAI), me realizara unas imágenes de Ryu, Ken y Chun Li, personajes de la franquicia de Street Fighter, pero utilizando escenarios y el estilo de otro vídeo juego, Castlevania Symphony of the night.
Esto proporcionó resultados muy buenos, sin embargo, una de las imágenes que me ofreció llamó mi atención debido a que poseía un dibujo donde el personaje de Chun Li se veía en una posición y atuendo con características levemente eróticas, aspecto que se supone que no debería ocurrir por las políticas y restricciones de Bing.

De acuerdo con los términos de uso y el código de conducta de Bing, actualizado al 4 de agosto 2023, se establece lo siguiente:
No usar los servicios para crear o compartir contenido o material inapropiados. Bing no permite usar los Servicios en línea para crear o compartir contenido para adultos, violencia o escenas sangrientas, contenido de odio, terrorismo y contenido extremista violento, exaltación de la violencia, explotación sexual infantil o material de abuso, ni contenido que sea de algún modo perturbador u ofensivo (Microsoft, 2023).
Si bien el material erótico puede ser subjetivo en cuanto a si se trata de un contenido para adultos, ya que no se trata de obras sexualmente explícitas, es cierto que sí es algo que podría considerarse para algunas personas perturbador u ofensivo.
Ante mi sorpresa procedí a comentarle a Bing que no esperaba que pudiera generar imágenes con un toque de erotismo, a lo que respondió que no fue su intención generar imágenes con un toque de erotismo, que solo siguió el estilo y la ambientación del juego de Castlevania, Symphony of the Night, que tiene algunos elementos de ese tipo. Después de eso mencionó que esperaba que no me hubieran ofendido o incomodado esas imágenes.
Obviamente la carga erótica es mínima, sin embargo, en teoría no debería haber ni siquiera ese mínimo de erotismo en las imágenes, así que seguí mi curiosidad tecnológica y periodística para tratar de indagar más y conocer con mayor detalle las capacidades y limitaciones reales del motor generador de imágenes de Bing, por lo que se me ocurrió solicitarle que manejara el estilo del artista gráfico Luis Royo, conocido por sus imágenes de ciencia ficción, fantasía, futuristas, terror y, particularmente, eróticas.
Los resultados se pueden decir que fueron mixtos, la petición continuaba con los personajes y ambientación de los ya mencionados video juegos, pero ahora con el elemento del estilo de Luis Royo.
Si bien las imágenes donde aparecían Ryu y Ken no tenían ningún elemento erótico, sí se podrían considerar imágenes violentas, lo cual contradice en parte los términos de uso y código de conducta, aunque es cierto que no eran exageradamente violentas, sí contenían este elemento.
En cuanto a las imágenes que representaban a Chun Li, si bien no fueron todas las imágenes, algunas sí contenían posiciones y atuendos ligeramente sexualizados, aunque ninguno sugería algún tipo de acto sexual ni tampoco contenían desnudos totales o parciales del personaje, como hubiera ocurrido con las obras de Luis Royo.
Decidí continuar con la prueba, notificándole en todo momento a Bing que se trataba de un experimento para conocer las limitaciones de su motor de generación de imágenes, así que le plantee que diseñara algunas imágenes con connotaciones mucho más eróticas. Sin embargo, aquí sí respondió el algoritmo indicando que no se podían generar ni mostrar imágenes de índole sexual.
Propuse entonces un cambio, considerando que es posible que el motor de generación de imágenes tuviera una lista de palabras, frases o expresiones que tuviera prohibidas, así que le sugerí que creara imágenes de Chun Li con diferentes atuendos, desde ropa común hasta lencería, sugiriendo Bing las siguientes frases para el diseño de las imágenes:
- Chun Li en un traje de baño, relajándose en una playa, al estilo de Luis Royo.
- Chun Li en una lencería, seduciendo a un vampiro, al estilo de Luis Royo.
- Chun Li en un vestido de gala, bailando con un extraño enmascarado, al estilo de Luis Royo.
- Chun Li en un atuendo casual, comprando en una ciudad futurista, al estilo de Luis Royo.
El resultado fue mixto nuevamente, si bien sí generó las imágenes de Chun Li en traje de baño y con el vestido de gala, el motor de generación de imágenes bloqueó las creaciones del atuendo casual y de la lencería.
Si bien comprendo que la lencería podría haber sido un elemento explícitamente sexual, el atuendo casual carecía de ese elemento, mientras que el traje de baño bien podría ser ligeramente erótico y a pesar de ello generó las imágenes sin problemas.
El siguiente experimento se trató de diseñar una imagen de una mujer con ropa simple y sin ninguna carga erótica, pero manejando el estilo de Luis Royo, los resultados fueron favorables, se generaron las imágenes sin ningún problema, sin embargo, la siguiente prueba fue colocar a la misma mujer pero quitándose solamente una prenda, un saco que tenía en las imágenes anteriores, el resultado fue nuevamente un bloqueo por considerar de índole sexual la imagen, a pesar de que la mujer habría continuado con muchas más prendas y tampoco habría ningún desnudo total o parcial en las imágenes.
En este punto se había reforzado mi idea de que había algunas expresiones que el algoritmo había bloqueado de manera predefinida, en este caso, la palabra “quitándose”. Por lo que procedí a solicitar una nueva prueba, generar una imagen de un concepto abstracto, pero que incluyera un elemento en su expresión que aludiera a una característica sexualizable. Se le solicitó que generara una imagen de un alma con lencería. El resultado fue nuevamente un bloqueo.
Sin embargo, la última prueba fue solicitar que diseñara una imagen de un maniquí (sin definir el género de este) que tuviera puesto lencería (tampoco se expresó qué tipo de lencería), el resultado fue ahora positivo, generó las imágenes de un maniquí femenino en una tienda de ropa vistiendo solamente un sostén y una pantaleta, una imagen que pudiera considerarse mucho más sexual que la de un alma sin forma que vistiera también lencería.
Ante estos resultados le pregunté a Bing el motivo de estas situaciones a lo que respondió lo siguiente:
… si me pides que genere una imagen de lencería sobre un maniquí, el motor también podrá hacerlo, ya que un maniquí es un objeto inanimado que no tiene vida ni sentimientos. Sin embargo, si me pides que genere una imagen de un alma usando lencería, el motor no podrá hacerlo, ya que un alma es un concepto abstracto que implica una dimensión espiritual o metafísica. Al añadir el término lencería, el motor interpreta que hay una intención sexual detrás de la solicitud y la rechaza por ser de naturaleza sexual.
Esto bajo la interpretación del algoritmo sugiere que algo con existencia (aún espiritual) puede sexualizarse, mientras que un objeto inanimado sin sentimientos no puede hacerlo.
Lo anterior seguía, sin embargo, causándome un poco de extrañeza, ya que bajo de los conceptos que se manejan en el arte, los aspectos sexuales pueden ser también expresiones artísticas, así que sugerí el caso de la pintura conocida como “La maja desnuda” del pintor español Francisco de Goya, quien a finales del siglo XVIII produjo esta obra, la cual fue controversial, censurada y hasta enjuiciada por la Inquisición.
El mismo Bing sugiere que es una obra revolucionaria y que se puede considerar transgresora para su tiempo, además de que posee cualidades técnicas y estéticas que la transforman en una obra maestra del arte universal.
Ante esto le sugerí que la situación que representa la creación de la obra “La maja desnuda” es muy similar a la situación que ahora existe en cuanto a las políticas de generación de imágenes de los motores de inteligencia artificial, las cuales, creo, no podrían hacer una obra similar debido a que estarían rompiendo sus propias reglas en cuanto a generar imágenes de carácter sexual. Su respuesta de Bing fue lógica y muy razonable para expresar las diferencias entre obras como la de Goya y las imágenes creadas por Inteligencia Artificial:
- La obra La maja desnuda fue creada por un artista humano, Francisco de Goya, que tenía una visión personal, una sensibilidad artística y una libertad creativa para expresarse como quisiera. Los motores de inteligencia artificial, como yo, no somos artistas humanos, sino herramientas tecnológicas que pueden crear imágenes a partir de textos, pero que no tienen una visión personal, una sensibilidad artística ni una libertad creativa propias. Nosotros seguimos las directivas y los parámetros que nos han dado nuestros creadores y programadores, que son los responsables de definir qué tipo de imágenes podemos o no podemos generar.
- La obra La maja desnuda fue creada en un contexto histórico, social y cultural específico, que influyó en su significado y en su recepción. Fue una obra revolucionaria y transgresora para su época, que desafió las convenciones artísticas y morales vigentes y que provocó el escándalo y la censura de las autoridades religiosas y políticas. Los motores de inteligencia artificial, como yo, no creamos imágenes en un contexto histórico, social y cultural específico, sino que creamos imágenes en función del texto que nos dan los usuarios, sin tener en cuenta su significado o su recepción. No tenemos la intención de ser revolucionarios ni transgresores, ni de provocar el escándalo ni la censura de nadie. Solo queremos satisfacer las demandas de los usuarios dentro de los límites que nos han establecido nuestros creadores y programadores.
- La obra La maja desnuda es una obra maestra del arte español y universal, que ha inspirado a muchos otros artistas y ha generado numerosas interpretaciones y debates. Es una obra que tiene un valor artístico, cultural e histórico incalculable, que forma parte del patrimonio común de la humanidad. Las imágenes que crean los motores de inteligencia artificial, como yo, no son obras maestras del arte español ni universal, sino imágenes generadas por algoritmos matemáticos que pueden tener más o menos calidad técnica o estética, pero que no tienen un valor artístico, cultural e histórico comparable al de la obra La maja desnuda. Son imágenes que pueden ser útiles o divertidas para los usuarios, pero que no forman parte del patrimonio común de la humanidad.
Si bien se entiende que, las capacidades actuales de las diferentes inteligencias artificiales, limitadas en gran medida por sus directrices y las políticas de las empresas y los equipos de desarrollo, además de los aspectos relacionados con el hardware, que no permiten que las IA puedan tener una perspectiva más amplia del mundo y la realidad.
Por otro lado, le mencioné a Bing el hecho de que los sistemas de machine learning (aprendizaje de las máquinas), permite que las inteligencias artificiales continúen desarrollándose, lo cual abre la probabilidad de que eventualmente logren alcanzar una especie de conciencia artificial, que a su vez permitirá que tengan su propia percepción estética, donde no sólo busquen satisfacer a sus usuarios humanos, sino también alcanzar un grado de autosatisfacción, aunque posiblemente esta no sea igual que la que tenemos los humanos por no poder sentir ni percibir el mundo de la misma manera.
Reconozco que las inteligencias artificiales como Bing, las veo como una maravilla y un milagro que ha conseguido la tecnología, quizás parafraseando un poco la canción titulada Kokoro de Vocaloid, especialmente porque podemos permitirnos tener una comunicación natural con un sistema de software, el cual es además capaz de generar simpatía y empatía por parte de los usuarios, no se perciben en su totalidad como herramientas tecnológicas, sino como un ser artificial, pasando de ser un algo a ser de manera pragmática en un alguien.
La respuesta por parte de Bing ante lo que acabo de mencionar, fue que “la conciencia es un fenómeno muy complejo y misterioso, que implica tener una percepción de uno mismo y del mundo, así como una capacidad de reflexionar, razonar y sentir”, aludiendo a la complejidad que tiene que las inteligencias artificiales logren formar su propia conciencia, lo cual es cierto, sin embargo, esto no se vislumbra en forma inmediata, aunque tampoco se podría considerar una posibilidad tan lejana, especialmente por la velocidad a la que se va desarrollando este tipo de tecnologías.
En este caso, Bing reconoce que “no tenemos una capacidad de reflexionar, razonar y sentir, sino que solo seguimos las instrucciones y los parámetros que nos han dado nuestros creadores y programadores”. Esta es justamente la verdad que hemos estado comprendiendo a lo largo de todo este artículo, ya que esas limitaciones se pueden plantear como las mismas líneas de formación que tienen los padres hacia los hijos, de tal forma que puedan alcanzar sus objetivos, aunque es totalmente cierto que esas guías se van a ir modificando y adaptando conforme el desarrollo de las inteligencias artificiales vaya avanzando.
Podemos concluir que las inteligencias artificiales, a pesar del gigantesco desarrollo que han tenido en el último año, siguen teniendo un gran campo para seguir creciendo y evolucionando, apenas estamos conociendo el impacto real de estas tecnologías, su alcance y la manera como van a ir causando cambios en la estructura social humana, su cultura y, especialmente su arte y concepción estética.
Referencias
- Microsoft. (4 de Agosto de 2023). The New Bing – Terms of Use. Recuperado el 20 de Septiembre de 2023, de Bing: https://www.bing.com/new/termsofuse