Google Whisk: La revolución de la IA que utiliza instrucciones de imagen en lugar de palabras

La última herramienta de IA de Google, “Whisk”, permite a los usuarios subir fotografías para obtener una imagen fusionada generada por IA sin tener que escribir una sola palabra.

Annunci

Antes de que Whisk mezcle fotografías, los usuarios pueden proporcionar imágenes de sujetos, escenarios y estilos.

En una entrada de blog, Google llamó a Whisk una “herramienta creativa” para una inspiración rápida, no un “editor de imágenes tradicional”. Whisk está destinado a ser una función de IA divertida, no una herramienta profesional.

Grandes empresas tecnológicas como Google y OpenAI se apresuran a ofrecer productos de consumo que demuestren la nueva y emocionante tecnología, incluso mientras los detractores advierten que el crecimiento de la IA sin límites es peligroso para la humanidad.

Desde que OpenAI presentó Dall-E, una herramienta de producción de texto a imagen, en 2021, el arte generado por IA ha invadido las redes sociales y ha permeado los artículos de consumo. Google Whisk es un generador de imagen a imagen que se basa en generadores de texto a imagen.

Los usuarios de Whisk pueden alterar sus entradas y combinar categorías para crear peluches, pines de esmalte y pegatinas. Los usuarios pueden dirigir detalles utilizando palabras, pero no es esencial una imagen.

“Whisk está diseñado para permitir a los usuarios remezclar un sujeto, escena y estilo de nuevas y creativas maneras, ofreciendo exploración visual rápida en lugar de ediciones perfectas de píxeles”, afirmó Thomas Iljic, director de gestión de productos de Google Labs.

Google adquirió DeepMind en 2014 y utilizó su IA generativa para construir Whisk.

Whisk utiliza el servicio de IA principal de Google, Gemini, introducido en diciembre de 2023, e Imagen 3, el generador de texto a imagen más reciente de DeepMind.

Imagen 3 recibe subtítulos de Gemini cuando los usuarios publican fotografías. Para remezclar la imagen final, la técnica captura la “esencia” del tema en lugar de una reproducción exacta, lo que puede desviarse de la sugerencia.

Google afirmó en una entrada de blog que la imagen creada puede diferir de las fotos sugeridas en altura, corte de pelo y tono de piel.

Google recibió críticas en febrero cuando lanzó el convertidor de texto a imagen de Gemini porque creó imágenes históricamente incorrectas.

Whisk, un sitio web de Google Labs solo disponible en EE. UU., se encuentra en una fase inicial de desarrollo, según afirmó la empresa.

OpenAI presentó Sora, un generador de texto a video, mostrando competitividad en productos de consumo.

Dan Ives, director gerente y analista senior de títulos de Wedbush Securities, le dijo a CNN que Whisk es otro “momento de flexión de músculos” para Google en IA y tecnología.

Los productos de IA forman parte del “cofre del tesoro” de nuevos productos de Google para 2025, que incluye un nuevo sistema operativo Android desarrollado con Samsung y Qualcomm. “DeepMind es un activo clave para Google”, afirmó Ives.

Giulia Bianchi
Giulia Bianchi

Editrice presso InfoNTC dal 2024.

DISCLAIMER:

In nessun caso vi sarà richiesto di pagare per accedere a qualsiasi prodotto, inclusi carte di credito, prestiti o altre offerte. Se ciò accade, vi preghiamo di contattarci immediatamente. Assicuratevi sempre di leggere i termini e le condizioni del fornitore di servizi che contattate. Generiamo entrate tramite pubblicità e riferimenti per alcuni, ma non tutti, i prodotti presentati su questo sito web. Tutto ciò che viene pubblicato qui si basa su ricerche quantitative e qualitative, e il nostro team si impegna a essere il più equo possibile nel confronto delle opzioni concorrenti.

DIVULGAZIONE DELL'INSERZIONISTA:

Siamo un sito editoriale indipendente, obiettivo e finanziato dalla pubblicità. Per sostenere la nostra capacità di fornire contenuti gratuiti ai nostri utenti, le raccomandazioni che appaiono sul nostro sito possono provenire da aziende da cui riceviamo una compensazione in quanto affiliati. Questa compensazione può influenzare il modo, il luogo e l’ordine in cui le offerte appaiono sul nostro sito. Altri fattori, come i nostri algoritmi proprietari e i dati di prima parte, possono anche influenzare il modo e il luogo in cui i prodotti/offerte sono posizionati. Non elenchiamo sul nostro sito web tutte le offerte finanziarie o di credito attualmente disponibili sul mercato.

NOTA EDITORIALE:

Le opinioni espresse qui sono esclusivamente quelle dell’autore e non rappresentano una banca, un emittente di carte di credito, un hotel, una compagnia aerea o qualsiasi altra entità. Questo contenuto non è stato esaminato, approvato o sostenuto da nessuna delle entità menzionate nel messaggio. Detto ciò, il compenso che riceviamo dai nostri partner affiliati non influenza le raccomandazioni o i consigli forniti dal nostro team di redattori nei nostri articoli, né influisce in alcun modo sul contenuto di questo sito web. Sebbene lavoriamo duramente per fornire informazioni accurate e aggiornate che riteniamo rilevanti per i nostri utenti, non possiamo garantire che tutte le informazioni fornite siano complete e non facciamo dichiarazioni o garanzie riguardo alla loro accuratezza o applicabilità.