Samsung transforma la búsqueda de fotos y la edición de videos

La serie Galaxy S25 incorpora tecnología AI, basada en visión y comprensión del lenguaje natural para resolver estos desafíos

2025-05-05

AGENCIAS

Samsung-Mobile-Galaxy-S-25-series-Gallery-Experience-Gallery-Search-Auto-Trim-Interview_main2.jpg

Encontrar una foto específica en una galería de un smartphone puede tomar más tiempo del esperado. Editar varios videos de forma individual también puede volverse una tarea tediosa y repetitiva. 

La serie Galaxy S25 incorpora tecnología AI, basada en visión y comprensión del lenguaje natural para resolver estos desafíos y ofrecer una experiencia móvil más intuitiva en el día a día. Al buscar una foto en la galería, los usuarios pueden escribir palabras clave relacionadas con la escena, como la fecha, el lugar, objetos presentes o acciones realizadas, y Galaxy AI se encargará de analizarlas para mostrar las imágenes que coincidan. Además, esta serie insignia incluye Auto Trim, una nueva función que identifica automáticamente los momentos clave en varios videos y los edita en un solo clip de forma independiente. 

Estas innovaciones son fruto de una investigación avanzada en tecnología visual y de una estrecha colaboración entre equipos. Samsung Newsroom conversó con desarrolladores del Equipo de Tecnología Visual de Samsung Research y del Equipo de Soluciones Visuales de Mobile eXperience (MX) Business de Samsung Electronics para conocer cómo la compañía ha logrado crear experiencias fotográficas y de video aún más inteligentes para los usuarios Galaxy.  

Etiquetado de todos los elementos de una foto con clasificación basada en AI  

Los smartphones almacenan una enorme cantidad de fotos, lo que hace cada vez más difícil encontrar una imagen específica de inmediato. En la serie Galaxy S25, la app de Galería clasifica y etiqueta automáticamente elementos clave como objetos, personas y lugares, lo que permite a los usuarios localizar sus fotos con mayor rapidez y precisión. Esta función resulta especialmente útil para quienes desean revivir recuerdos o acceder rápidamente a información importante. 

Dado que una búsqueda eficaz depende de una buena clasificación, los desarrolladores triplicaron la cantidad de tipos de etiquetas en comparación con la serie Galaxy anterior, mejorando la capacidad de la serie Galaxy S25 para reconocer sujetos en las fotos y etiquetarlos con mayor precisión. También ampliaron el alcance del ‘clustering’, una técnica que agrupa datos para optimizar el reconocimiento de personas 

“Al desarrollar un motor de análisis de imágenes y aplicar la tecnología zero-shot, mejoramos el rendimiento para que la serie Galaxy S25 pueda reconocer por primera vez los datos de los objetos que detecta”, explica Hongpyo Lee, del Equipo de Tecnología Visual de Samsung Research. “En el caso de las personas, ampliamos el análisis más allá de los rasgos faciales, incorporando elementos como la ropa, la hora y la ubicación, lo que facilita agrupar fotos de una misma persona”. 

Encontrar fotos con lenguaje conversacional y natural a través de Gallery Search

Samsung también se enfocó en optimizar el rendimiento de la búsqueda en lenguaje natural dentro de la Galería. Para lograrlo, desarrolló un modelo de búsqueda que toma en cuenta las frases más comunes y los distintos contextos de uso, permitiendo a los usuarios encontrar las fotos que buscan mediante expresiones naturales y conversacionales, en lugar de depender únicamente de palabras clave.  

“Aprovechamos un modelo de visión del lenguaje que aprende asociando imágenes con texto, y utilizamos AI generativa para crear automáticamente una variedad de frases que los usuarios podrían ingresar”, compartió Lee. “Además, optimizamos y comprimimos el modelo de búsqueda para garantizar que se ejecute de manera rápida directamente en el dispositivo”. 

“Basándonos en nuestras investigaciones previas, hemos aplicado con éxito las capacidades de procesamiento de lenguaje natural a nuestros productos, incluyendo un motor de análisis de imágenes sensible al contexto y un modelo de lenguaje amplio (LLM)”, afirmó Inho Choi, del Equipo de Soluciones Visuales de Samsung Electronics MX Business. 

Los desarrolladores también se centraron en ofrecer resultados de búsqueda más imparciales y precisos. “Queríamos anticiparnos a las diversas situaciones de uso e identificar posibles problemas para evitar que las consultas malintencionadas generaran resultados inexactos”, explicó Choi. “Crear una base de datos que incluyera palabras negativas, blasfemias y neologismos, y luego realizar pruebas con los usuarios para mejorar la precisión de las búsquedas, fue la parte más desafiante y gratificante del proceso”.

Editar varios videos a la vez con Auto Trim 

La edición de video también se está convirtiendo en una parte cada vez más importante de la experiencia de la galería. Aunque el video es una forma popular de consumo de medios, tener herramientas de edición de video fácilmente disponibles y usarlas con facilidad a menudo no es tan simple como parece. Para resolver esto, la serie Galaxy S25 presenta una función que hace que la edición sea mucho más rápida y cómoda gracias al análisis de vídeo mejorado basado en AI. La función Auto Trim extrae escenas clave de varios videos elegidos por el usuario para crear un nuevo video de formato corto.   

Para Auto Trim, era fundamental analizar con rapidez videos de hasta 90 minutos, generar una versión editada y ajustar la duración del nuevo clip. Los desarrolladores lo lograron gracias a una estrecha colaboración, que integró de forma eficiente el conocimiento tecnológico avanzado de Samsung Research con la experiencia en optimización móvil del equipo MX Business. 

“Las tecnologías de análisis de video existentes presentan limitaciones, como el tamaño excesivo de los modelos, la lentitud en el procesamiento y la selección poco precisa de segmentos clave”, explicó Seonghwan Kim, del Equipo de Soluciones Visuales de MX Business. “Optimizamos el rendimiento de procesamiento de video en la serie Galaxy S25 al probar y validar múltiples soluciones, con el objetivo de ofrecer una experiencia de edición rápida y sencilla con AI directamente en el dispositivo”. 

“Incorporamos una función que permite a los usuarios identificar fácilmente los momentos clave de sus videos, los cuales requieren un procesamiento de datos mucho mayor que las fotos y ajustar la duración de los segmentos editados según sus preferencias”, explicó Wonwoo Lee, del Equipo de Tecnología Visual de Samsung Research. 

“Lograr que Galaxy AI identificara los momentos destacados en los videos con una sensibilidad similar a la del ojo humano fue un verdadero desafío. Sin embargo, al establecer estándares en conjunto, Samsung Research y MX Business lograron mejorar significativamente la funcionalidad general”. 

Del análisis a la generación: La AI de visión y sus infinitas posibilidades  

Samsung Electronics está explorando un amplio espectro de tecnologías de AI visual, que abarca desde herramientas de filmación y edición para smartphones hasta soluciones de interacción multimodal aplicadas en entornos de realidad aumentada (RA) y realidad virtual (RV). En el núcleo de esta investigación está la capacidad de analizar de manera rápida y precisa a sujetos como personas o animales, así como su entorno, directamente en el dispositivo, y de identificar los momentos significativos en los videos. Con estas tecnologías, Samsung no solo busca optimizar funciones tradicionales como la captura y reproducción de imágenes, sino también abrir nuevas posibilidades en la forma en que se crean y consumen contenidos. 

“Estamos aprovechando activamente la AI para ofrecer una edición de video más rápida, sencilla y con resultados de alta calidad”, comentó Kim. “El enfoque de Samsung está en seguir perfeccionando esta tecnología para que la AI comprenda mejor el contexto del contenido, ayudando a los usuarios a reducir el tiempo de edición y a generar videos que reflejen fielmente su intención, sin necesidad de tener experiencia profesional en edición”.  

“Con el avance constante en el análisis de video, nuestro objetivo es desarrollar funciones aún más innovadoras que aprovechen la capacidad de comprender el contenido visual, como la búsqueda inteligente, la edición con efectos automáticos y mucho más”, señaló Wonwoo Lee. “Samsung continuará trabajando para crear tecnología de AI visual de vanguardia, adaptable a una amplia variedad de escenarios de uso”.  

Funciones como Gallery Search y Auto Trim muestran cómo Galaxy AI transforma la vida diaria. A medida que los desarrolladores avanzan en la tecnología de análisis de imágenes y video, Samsung Electronics ofrece una gama cada vez más amplia de experiencias que permiten a los usuarios encontrar y capturar con mayor facilidad los momentos clave de su vida.

Derechos Reservados © La Capital
twittear