Când calitatea unui apel video se înrăutățește, avem tendința să gesticulăm mai mult și să ridicăm tonul vocii pentru a ne face interlocutorul să ne înțeleagă mai bine. Dar este util?

Odată cu pandemia, ne-am obișnuit să participăm la întâlniri de afaceri pe Zoom și să ne vedem colegii pe jumătate. Cu ce mai trebuie să ne obișnuim, însă, este să folosim tonul corect al vocii: în timpul unui apel video, de fapt, mulți dintre noi țipă și gesticulăm de parcă tocmai ar fi fost înțepați de o viespe.

Dar de ce o facem? Potrivit unui studiu publicat în Royal Society Open Science, vina ar fi conexiunea slabă: atunci când calitatea imaginii scade, avem tendința de a ne ridica tonul vocii și de a gesticula mai mult în încercarea de a ne face înțeleși.

Pentru a ajunge la aceste concluzii, cercetătorii au analizat apelurile video a douăzeci de perechi de participanți, timp în care calitatea video a fost schimbată în zece pași de la excelent la slab, potrivit Focus.

De îndată ce calitatea imaginii a început să se deterioreze, gesturile interlocutorilor au devenit mai ample și mai dese; totuși, când agravarea a continuat și videoclipul a returnat o imagine neclară a partenerului, gesturile s-au diminuat în intensitate, probabil pentru că nu mai erau considerate necesare comunicării.

Pe măsură ce comunicarea s-a înrăutățit, s-a schimbat și tonul vocii: participanții au crescut volumul cu 5 decibeli, o cantitate care se află la jumătatea distanței dintre sunetul unei pene care cade (0 decibeli) și respirația noastră (10 decibeli). Tonul, în schimb, a rămas la același nivel chiar și atunci când gesticulația a scăzut.

”Înainte de a efectua analizele, am adnotat toate gesturile manuale în date. Acest lucru a fost realizat folosind aplicația SPUDNIG care procesează videoclipurile în OpenPose.

OpenPose este un algoritm de urmărire a mișcării offline, bazat pe video, care furnizează coordonatele x, y a 25 de puncte cheie de-a lungul corpului, incluzând, de exemplu, umerii, coatele și încheieturile mâinii.

Punctele cheie sunt detectate automat în fiecare cadru al videoclipului folosind un algoritm de viziune computerizată, furnizând date de coordonate cadru cu cadru, furnizate în pixeli, pentru fiecare dintre punctele cheie. SPUDNIG folosește aceste date OpenPose pentru a detecta toate mișcările produse de fiecare participant. Aceste mișcări au fost apoi verificate manual și mișcările non-gestuale au fost eliminate”, se relatează în studiul publicat pe Royal Society.

Aceste rezultate au demonstrat că nu se face comunicarea doar prin limbajul verbal, ci este integrată de un sistem de semnale vizuale și auditive care lucrează împreună pentru a transmite un mesaj.

”Pentru a compensa calitatea scăzută a videoclipului, oamenii își exagerează ”gesturile, permițând astfel interlocutorului să înțeleagă sensul a ceea ce vor să spună chiar dacă nu sunt văzuți bine”, explică James Trujillo, coordonatorul studiului, care subliniază totuși că ridicarea vocii probabil că nu ajută prea mult.

Google News icon Fiți la curent cu ultimele noutăți. Urmăriți DCNews și pe Google News