¿Puede Ai decirnos si esas llamadas de zoom fluyen sin problemas? Un nuevo estudio dice que sí

Crédito: dominio público Unsplash/CC0
Desde el inicio de la pandemia Covid-19, los trabajadores han pasado innumerables horas en videoconferencias, ahora un accesorio de la vida de la oficina. A medida que más personas trabajan y viven de forma remota, las plataformas de videoconferencia como Zoom, MS equipos, FaceTime, Slack y Discord también son una gran parte de la socialización entre familiares y amigos.
Algunos intercambios son más agradables y fluyen mejor que otros, planteando preguntas sobre cómo se podría mejorar el medio de las reuniones en línea para aumentar la eficiencia y la satisfacción laboral.
Un equipo de científicos de la Universidad de Nueva York ha desarrollado un modelo de IA que puede identificar aspectos del comportamiento humano en videoconferencias, como la toma de turnos y las acciones faciales conversacionales, y predecir, en en tiempo realya sea que las reuniones se consideren agradables y fluidas, comunes y fluidas en lugar de incómodas y marcadas por la toma de turnos forzadas, basada en estos comportamientos.
“Nuestro modelo de aprendizaje automático revela la intrincada dinámica de alto nivel interacción social Al decodificar patrones sutiles dentro de las señales básicas de audio y video de videoconferencias “, dice Andrew Chang, miembro postdoctoral en el Departamento de Psicología de NYU y el autor principal del documento, que aparece en la publicación de la conferencia Conferencia Internacional IEEE sobre acústica, habla y procesamiento de señales (ICASSP).
“Este avance representa un paso importante para mejorar dinámicamente las experiencias de videoconferencia al mostrar cómo evitar los descarrilamientos de conversación antes de que ocurran”.
Para desarrollar este modelo de aprendizaje automático, los investigadores lo capacitaron en más de 100 horas de grabaciones de zoom, con el modelo tomando como voz de entrada, expresiones facialesy movimientos corporales para identificar momentos disruptivos en que las conversaciones se volvieron poco fluidas o no agradables. Más específicamente, los científicos entrenaron el modelo para diferenciar entre momentos no fluidos que interrumpieron un virtual reunión y más intercambios fluidos.
En particular, el modelo calificó las conversaciones con brechas inusualmente largas en la toma de turnos como menos fluidas y agradables que aquellas en las que los participantes hablaron uno sobre el otro. Dicho de otra manera, se descubrió que los “silencios incómodos” son más perjudiciales que la dinámica caótica y entusiasta de un acalorado debate.
Para confirmar la precisión de las evaluaciones del modelo, un equipo independiente de más de 300 jueces humanos vio muestras de las mismas Videoconferencia imágenes, calificación de la fluidez de las conversaciones y cuánto pensaron que los participantes de la reunión disfrutaron de los intercambios. En general, los evaluadores humanos coincidieron estrechamente con el modelo de aprendizaje automáticoevaluaciones.
“La videoconferencia ahora es una característica destacada en nuestras vidas, por lo que comprender y abordar sus momentos negativos es vital no solo para fomentar una mejor comunicación interpersonal y conexión, sino también para mejorar la eficiencia de las reuniones y los empleados satisfacción laboral“, dice Dustin Freeman, un erudito visitante en el Departamento de Psicología de NYU y el autor principal del artículo.
“Al predecir los momentos de desglose conversacional, este trabajo puede allanar el camino para que los sistemas de videoconferencia mitigen estas averías y suavizan el flujo de conversaciones mediante la manipulación implícita de retrasos de señal para acomodar o proporcionar señales explícitamente a los usuarios, con las que actualmente estamos experimentando”.
Más información:
A. Chang, et al. El aprendizaje automático multimodal puede predecir la fluidez y el disfrute de la videoconferencia, Conferencia internacional IEEE sobre acústica, procesamiento de habla y señales (ICASSP), Doi: 10.1109/icasp49660.2025.10889480
Proporcionado por
Universidad de Nueva York
Citación: ¿Puede AI decirnos si esas llamadas de zoom fluyen sin problemas? Un nuevo estudio dice que sí (2025, 10 de marzo) recuperado el 10 de marzo de 2025 de https://techxplore.com/news/2025-03-ai-smoothly.html
Este documento está sujeto a derechos de autor. Además de cualquier trato justo con el propósito de estudio o investigación privada, no se puede reproducir ninguna parte sin el permiso por escrito. El contenido se proporciona solo para fines de información.