2024-08-23 07:55:51

Google lanza Gemini 1.5 para desafiar a Open AI


Durante décadas, Google ha liderado el camino en el desarrollo de redes neuronales y aprendizaje automático, dos componentes esenciales de la inteligencia artificial (IA). Con el lanzamiento de Gemini, Google está introduciendo un nuevo y emocionante capítulo en la competencia por establecer el estándar global en IA.

El éxito de Open AI con ChatGPT y, más recientemente, con Sora, ha sido innegable. Estas arquitecturas de IA no solo han destacado por su excelencia técnica, sino también por su impacto mediático. Ante este panorama, Google se ve presionada a responder rápidamente a la competencia que le plantea Microsoft, aliada con Open AI.

Gemini 1.5 representa un avance significativo en esta carrera tecnológica. Esta actualización amplía la gama de productos de Google, que ahora incluye Gemini Nano, Pro, Ultra y Advanced. Estas soluciones ofrecen una amplia gama de servicios en la nube y aplicaciones móviles, diseñadas para proporcionar experiencias tanto de IA generativa como empresarial.

La versión 1.5 de Gemini, actualmente en fase de prueba cerrada con desarrolladores, utiliza redes MoE (Mixture-of-Experts). Esta innovación divide el modelo en pequeñas unidades que se activan según el tipo de información proporcionada, lo que resulta en una reducción de la latencia y una mejora en la capacidad de procesamiento. Clientes de Google ya están explorando estas capacidades a través de plataformas como AI Studio y Vertex AI, dirigidas al desarrollo e implementación de IA en entornos empresariales.

Mientras tanto, Open AI continúa impulsando la innovación con Sora, una IA generativa capaz de crear videos hiperrealistas a partir de simples instrucciones en texto. Aunque aún no está disponible para el público en general, los primeros avances han generado asombro por la calidad y realismo de los contenidos generados.

Este panorama competitivo está llevando la IA a nuevos niveles de sofisticación y utilidad, ofreciendo oportunidades emocionantes para la creatividad, la investigación y el desarrollo empresarial. En el uso de estas inteligencias artificiales, tanto ChatGPT como Gemini ofrecen opciones gratuitas para generar respuestas relevantes sobre una amplia gama de temas y en varios idiomas, utilizando diversos tipos de información como entrada.

Desde nuestra experiencia, notamos que ChatGPT tiende a tener una interacción más natural con el usuario, mientras que Gemini proporciona enlaces contextuales de donde obtiene la información para generar sus respuestas.

Para aplicaciones cotidianas o tareas simples en el trabajo, estudio o la vida diaria, ambas opciones son bastante útiles, aunque se debe tener en cuenta que ocasionalmente pueden generar respuestas inexactas o datos erróneos.

Se pueden realizar una variedad de actividades con estas IA gratuitas, como resumir textos, convertirlos a diferentes formatos o estilos narrativos, realizar traducciones, crear recetas, obtener recomendaciones sobre diferentes temas, o incluso actuar como experto en algún campo para explicar conceptos o crear documentos.

Para usos más profesionales que requieren capacidades de procesamiento mejoradas y una variedad de servicios adicionales, están disponibles opciones de pago como Gemini Advanced y ChatGPT Plus, por una tarifa mensual.

Gemini Advanced, por ejemplo, incluye servicios como Google One con 2 terabytes de almacenamiento en la nube y la integración con Workspace en inglés, mientras que ChatGPT Plus de Open AI ofrece acceso a ChatGPT-4 y DALL-E, con capacidades avanzadas en comprensión de imágenes y generación de contenido visual a partir de texto.

Además, opciones como Copilot Pro integran estas IA con el software de productividad de Microsoft 365, permitiendo su uso directo en aplicaciones como Excel, Word, Outlook y PowerPoint, a través de una suscripción anual o mensual. En resumen, estas IA ofrecen una amplia gama de aplicaciones para usuarios tanto en el ámbito personal como profesional, con opciones gratuitas y de pago adaptadas a diferentes necesidades y niveles de exigencia.

¿Qué videos puede crear? Cualquiera. Lo que se le ocurra, real, futurista, inventado, lo que sea, con una realidad y calidad visual, de máxima resolución, pasmosas.

¿Ya se puede usar? Todavía no está abierta al público. Open AI la prueba a puerta cerrada. La semana pasada mostró videos ya creados, y se volvieron virales.

¿Cuál es su novedad? Además de la calidad impresionante y realidad de los videos, es su poder de entendimiento de lenguaje natural para producir el contenido. Mientras mejor y más claramente, con muchos detalles, le pidamos el video, lo producirá con extrema calidad.

¿Para qué se usará? Sora tiene una amplia versatilidad en su uso para industrias creativas, investigación, desarrollo de contenidos, educación, comunicación, etc.

¿Cuándo estará disponible? Aún no hay una fecha exacta de salida al público, pero Open AI señaló que pronto estará disponible de manera abierta.

¿Qué tipo de videos puede crear Sora? La respuesta es prácticamente cualquier cosa que puedas imaginar: desde escenarios reales hasta futuristas, pasando por invenciones totalmente inventadas. La calidad visual de estos videos es sorprendente, con una resolución máxima que deja boquiabiertos a quienes los ven.

¿Ya se puede utilizar esta tecnología? Por el momento, Sora aún no está disponible para el público en general. Open AI está llevando a cabo pruebas internas para perfeccionarla antes de su lanzamiento. Sin embargo, algunos videos creados con esta IA ya han comenzado a circular en internet y se han vuelto virales.

¿Qué la hace tan especial? Más allá de la calidad impresionante de los videos, lo que realmente destaca en Sora es su capacidad para comprender el lenguaje natural y generar contenido en base a ello. Cuanto más detalladamente y claramente se le pida el video, mayor será la calidad y realismo del resultado final.

¿Para qué se utilizará Sora? Su versatilidad la hace adecuada para una amplia gama de aplicaciones, incluyendo industrias creativas, investigación, desarrollo de contenidos, educación, comunicación y mucho más.

¿Cuándo estará disponible para el público en general? Aunque aún no hay una fecha exacta de lanzamiento, Open AI ha anunciado que Sora estará disponible para todos en un futuro cercano.