
Tot conținutul iLive este revizuit din punct de vedere medical sau verificat pentru a vă asigura cât mai multă precizie de fapt.
Avem linii directoare de aprovizionare stricte și legătura numai cu site-uri cu reputație media, instituții de cercetare academică și, ori de câte ori este posibil, studii medicale revizuite de experți. Rețineți că numerele din paranteze ([1], [2], etc.) sunt link-uri clickabile la aceste studii.
Dacă considerați că oricare dintre conținuturile noastre este inexactă, depășită sau îndoielnică, selectați-o și apăsați pe Ctrl + Enter.
Vocea ca analiză: Semnale precoce ale cancerului și leziunilor benigne
Ultima examinare: 18.08.2025

Cercetătorii de la Universitatea de Sănătate și Știință din Oregon au analizat înregistrări vocale din noul set de date Bridge2AI-Voice, disponibil publicului, și au descoperit o caracteristică acustică simplă care poate dezvălui patologia corzilor vocale. Vorbim despre raportul armonice-zgomot (HNR) - raportul dintre „armonicele muzicale” și zgomot. Nivelul și variabilitatea acestuia au diferențiat vocile persoanelor cu cancer laringian și leziuni benigne de cele sănătoase și de alte tulburări vocale. Efectul a fost evident în special la bărbații cisgender; semnificația statistică nu a fost suficientă pentru femei - autorii dau vina pe dimensiunea mică a eșantionului și solicită o extindere a datelor. Lucrarea a fost publicată ca un raport scurt în Frontiers in Digital Health.
Contextul studiului
- De ce să cauți „markeri vocali”? Răgușeala este o afecțiune frecventă. Cauzele sunt variate: de la răceli și reflux la noduli/polipi și cancer laringian. În prezent, calea către diagnostic este o vizită la un specialist ORL și o endoscopie (o cameră în nas/gât). Este precisă, dar nu este întotdeauna disponibilă rapid și nu este potrivită pentru automonitorizarea la domiciliu. Este nevoie de o pre-screening: o modalitate simplă de a înțelege cine ar trebui să consulte primul un medic.
- Ce este un biomarker vocal? Vorbirea este un semnal care poate fi ușor înregistrat pe un telefon. „Modelul” său poate fi folosit pentru a evalua modul în care vibrează corzile vocale. Leziunile fac ca vibrațiile să fie neuniforme: mai mult „zgomot” și mai puțină „muzică”.
- De ce sunt importante noile seturi de date. Anterior, astfel de lucrări se bazau pe eșantioane mici, „făcute acasă” - modelele erau fragile. Bridge2AI-Voice este un set mare, multicentric, colectat etic, de înregistrări audio legate de diagnostice. A fost creat ca un „teren comun de testare” pentru a antrena și testa în sfârșit algoritmi pe date mari și eterogene.
- Unde sunt principalele dificultăți?
- Vocea se schimbă din cauza microfonului, zgomotului din cameră, frigului, fumatului, limbajului, sexului și vârstei.
- În mod tradițional, există mai puține date despre femei, iar vocea feminină are o frecvență mai mare - valorile metrice se comportă diferit.
- Niciun test „la domiciliu” nu poate înlocui un examen sau pune un diagnostic - cel mult, ajută la deciderea: „este necesar să consultați urgent un specialist ORL?”
- De ce au nevoie clinica și pacienții de acest lucru? Dacă persoanele cu risc crescut de ganglioni/tumori pot fi selectate pentru o programare prioritară printr-o programare scurtă, acest lucru va accelera diagnosticul, va reduce trimiterile inutile și va oferi un instrument de automonitorizare între vizite (după operație, în timpul terapiei).
- Unde ar trebui să conducă acest lucru: La aplicații/module de telemedicină validate care:
- scrie un discurs conform standardului (frază + „aaa” prelungit),
- calcularea caracteristicilor de bază (HNR, jitter, sclipire, F0),
- emite o recomandare de a contacta un specialist dacă profilul este alarmant,
- menține dinamica după tratament.
Ideea e simplă: „dă telefonul la urechea unui medic ORL” – nu pentru diagnostic, ci pentru a nu-i rata pe cei care au nevoie de ajutor rapid, față în față.
Ce au făcut mai exact?
- Am lansat prima versiune a setului de date Bridge2AI-Voice, colectat etic și realizat în mai multe centre, un proiect emblematic al NIH, în care înregistrările vocale sunt legate de informații clinice (diagnostice, chestionare etc.).
- Au fost formate două probe analitice:
- „cancer laringian / ganglioni benigni / sănătoși”;
- „noduli canceroși sau benigni” versus disfonie spasmodică și paralizie a corzilor vocale (alte cauze frecvente ale răgușelii).
- Caracteristicile vocale de bază au fost identificate din fraze standardizate: tonul fundamental (F0), trepidația, strălucirea și HNR (tonul fundamental al vocii), iar grupurile au fost comparate folosind statistici neparametrice. Rezultat: cele mai stabile diferențe au fost în HNR și F0, HNR și variabilitatea sa separând cel mai bine leziunile benigne atât de cele normale, cât și de cele ale cancerului laringian. Aceste semnale au fost mai distincte la bărbați.
De ce este important acest lucru?
- Screening precoce fără sondă. În prezent, calea către diagnostic înseamnă adesea nazoendoscopie și, dacă se suspectează, biopsie. Dacă funcțiile acustice simple combinate cu inteligența artificială pot prioritiza persoanele care au nevoie de endoscopie, pacienții vor ajunge mai repede la un specialist ORL și se vor reduce trimiterile inutile. Acesta este un complement, nu un înlocuitor pentru medic.
- Big data pentru voce. Bridge2AI-Voice este un proiect rar în care vocea este colectată folosind protocoale uniforme și corelată cu diagnostice; datele sunt disponibile cercetătorilor prin intermediul PhysioNet / Health Data Nexus. Acest lucru accelerează dezvoltarea unor biomarkeri vocali fiabili în loc de „aplicații miraculoase” pe eșantioane mici.
Ce este HNR?
Când vorbim, corzile vocale vibrează și creează supratonuri (armonice). Dar vibrația nu este niciodată perfectă - există întotdeauna zgomot în semnal. HNR-ul reprezintă pur și simplu cât de multă „muzică” există în voce decât cât de „șuierat” este. Când corzile sunt deteriorate, vibrația devine mai puțin uniformă - există mai mult zgomot, HNR-ul scade, iar salturile (variabilitatea) sale cresc. Acesta este modelul pe care l-au surprins autorii.
Declinări de responsabilitate importante
- Aceasta este o analiză pilot, exploratorie: fără validare clinică, cu restricții asupra eșantionului de femei - prin urmare, efectele lor nu au fost semnificative. Sunt necesare date mai ample și mai diverse, precum și „prăjirea” modelelor în diferite clinici și în diferite limbi.
- Vocea este un lucru „cu mai multe valori”: este afectată de răceală, fumat, reflux, microfon, zgomotul din cameră. Orice „test la domiciliu” ar trebui să poată lua în considerare contextul - și totuși să servească drept filtru pentru o trimitere la un specialist ORL și nu pentru un diagnostic rapid.
Ce urmează?
- Extindeți setul de date (inclusiv pentru femei și vârste), standardizați sarcinile și acustica (citirea unei fraze, un „aaa” prelungit etc.), încercați modele multimodale (voce + simptome/factori de risc din chestionar).
- Conectați semnele acustice cu rezultatele examinărilor (endoscopie, stroboscopie) și dinamica după tratament - astfel încât profilul HNR să poată fi utilizat și pentru monitorizare.
- Continuați „știința deschisă”: Bridge2AI-Voice publică deja versiuni ale setului de date și ale instrumentelor - aceasta este o șansă de a ajunge rapid la proiecte pilot reale în clinici.
Concluzie
Este posibil să „auzim” problemele corzilor vocale din voce — și poate chiar să trimitem persoana respectivă la specialistul potrivit mai devreme. Deocamdată, este un indiciu destul de bun (hipersensibilitatea și variabilitatea acesteia), dar datorită volumelor mari de date deschise, biomarkerii vocali au în sfârșit șansa de a deveni un instrument de screening fiabil.
Sursa: Jenkins P. și colab. Vocea ca biomarker: Analiză exploratorie pentru leziunile benigne și maligne ale pliurilor vocale. Frontiers in Digital Health, 2025 (acceptat spre publicare). Date — Bridge2AI-Voice (NIH/PhysioNet).