Nothing Special   »   [go: up one dir, main page]

Mecânica de Produção e Controle Da Voz Humana - PMC

Fazer download em pdf ou txt
Fazer download em pdf ou txt
Você está na página 1de 39

Como biblioteca, o NLM fornece acesso à literatura científica.

A inclusão em um banco de dados NLM


não implica endosso ou concordância com o conteúdo do NLM ou dos Institutos Nacionais de Saúde.
Saiba mais: Isenção de responsabilidade do PMC | Aviso de direitos autorais do PMC

J Acústico Soc Am. Outubro de 2016; 140(4): 2614–2635. IDPM: PMC5412481


Publicado on-line em 14 de outubro de 2016. doi: 10.1121/1.4964509 PMID: 27794319

Mecânica de produção e controle da voz humana


ZhaoyanZhang a)

Abstrato

Como principal meio de comunicaçã o, a voz desempenha um papel importante na vida diá ria. A voz
també m transmite informaçõ es pessoais, como status social, características pessoais e o estado emocional
de quem fala. Mecanicamente, a produçã o da voz envolve uma complexa interaçã o fluido-estrutura dentro
da glote e seu controle pela ativaçã o dos mú sculos laríngeos. Um objetivo importante da pesquisa sobre
voz é estabelecer uma teoria causal ligando a fisiologia e a biomecâ nica da voz à forma como os falantes
usam e controlam a voz para comunicar significado e informaçõ es pessoais. O estabelecimento de tal teo‐
ria causal tem implicaçõ es importantes para o gerenciamento clínico da voz, o treinamento da voz e muitas
aplicaçõ es de tecnologia da fala. Este artigo fornece uma revisã o da fisiologia e biomecâ nica da voz, da
física da vibraçã o das pregas vocais e da produçã o sonora e do controle muscular laríngeo da frequê ncia
fundamental da voz, da intensidade vocal e da qualidade da voz. Os esforços atuais para desenvolver mod‐
elos mecâ nicos e computacionais de produçã o de voz també m sã o revisados ​criticamente. Finalmente, sã o
discutidas questõ es e desafios futuros no desenvolvimento de uma teoria causal da produçã o e percepçã o
da voz. Visualizar PDF

I. INTRODUÇÃ O

No sentido amplo, voz refere-se ao som que produzimos para comunicar significados, ideias, opiniõ es, etc.
No sentido estrito, voz, como nesta revisã o, refere-se a sons produzidos pela vibraçã o das pregas vocais,
ou sons sonoros. Isto contrasta com os sons surdos que sã o produzidos sem vibraçã o das pregas vocais,
por exemplo, fricativas que sã o produzidas pelo fluxo de ar atravé s de constriçõ es no trato vocal, plosivas
produzidas pela liberaçã o repentina de um fechamento completo do trato vocal, ou outros mecanismos de
produçã o de som, como como sussurrar. Para a produçã o de som sonoro, a vibraçã o das pregas vocais
modula o fluxo de ar atravé s da glote e produz som (a fonte da voz), que se propaga atravé s do trato vocal
e é amplificado ou atenuado seletivamente em diferentes frequê ncias. Esta modificaçã o seletiva do espec‐
tro da fonte de voz produz contrastes perceptíveis, que sã o usados ​para transmitir diferentes sons e signi‐
ficados linguísticos. Embora esta modificaçã o seletiva seja um componente importante da produçã o da
voz, esta revisã o enfoca a fonte da voz e seu controle dentro da laringe.

Para uma comunicaçã o eficaz de significado, a fonte de voz, como portadora da modificaçã o espectral sele‐
tiva pelo trato vocal, conté m energia harmô nica atravé s de uma ampla faixa de frequê ncias que abrange
pelo menos as primeiras ressonâ ncias acú sticas do trato vocal. Para ser ouvida acima do ruído, essa ener‐
gia harmó nica també m tem de estar razoavelmente acima do nível de ruído dentro desta gama de frequê n‐
cias, a menos que seja desejada uma qualidade de voz soprosa. A fonte de voz també m conté m informa‐ De volta ao to
çõ es importantes sobre altura, intensidade, prosó dia e qualidade da voz, que transmitem significado (ver
Kreiman e Sidtis, 2011 , capítulo 8 para uma revisã o), informaçõ es bioló gicas (por exemplo, tamanho) e in‐
formaçõ es paralinguísticas ( por exemplo , o status social do falante, características pessoais e estado
emocional; Sundberg, 1987 ; Por exemplo, a mesma vogal pode soar diferente quando falada por pessoas
diferentes. À s vezes, basta um simples “olá” para reconhecer uma voz familiar ao telefone. As pessoas ten‐
dem a usar vozes diferentes para locutores diferentes em ocasiõ es diferentes, e muitas vezes é possível sa‐
ber se algué m está feliz ou triste pelo tom de sua voz.

Um dos objetivos importantes da pesquisa em voz é compreender como o sistema vocal produz vozes de
diferentes características de origem e como as pessoas associam percepçõ es a essas características. Esta‐
belecer uma relaçã o de causa-efeito entre a fisiologia da voz e a acú stica e percepçã o da voz nos permitirá
responder a duas questõ es essenciais na ciê ncia da voz e no cuidado clínico eficaz ( Kreiman et al. , 2014 ):
quando a voz de saída muda, que alteraçã o fisioló gica causou essa mudança ; se ocorrer uma mudança na
fisiologia da voz, que mudança na qualidade vocal percebida pode ser esperada? Clinicamente, esse conhe‐
cimento levaria ao desenvolvimento de uma teoria de produçã o de voz com base física, capaz de prever
melhor os resultados vocais do manejo clínico dos distú rbios da voz, melhorando assim o diagnó stico e o
tratamento. De forma mais geral, uma compreensã o desta relaçã o poderia levar a uma melhor compreen‐
sã o dos ajustes laríngeos que usamos para alterar a qualidade da voz, adotar diferentes estilos de falar ou
cantar, ou transmitir informaçõ es pessoais, como status social e emoçã o. Tal compreensã o també m pode
levar ao desenvolvimento de programas de computador aprimorados para a síntese de fala de som natu‐
ral, específica do locutor, com percepçõ es emocionais variadas.

Compreender essa relaçã o causa-efeito entre a fisiologia e a produçã o da voz requer necessariamente um
esforço multidisciplinar. Embora a produçã o da voz resulte de um processo complexo de interaçã o fluido-
estrutura-acú stica, que novamente depende da geometria e das propriedades materiais dos pulmõ es, da
laringe e do trato vocal, o interesse final da voz é sua acú stica e percepçã o. Mudanças na fisiologia ou na
física da voz que nã o podem ser ouvidas nã o sã o tã o interessantes. Por outro lado, a fisiologia e a física
podem impor restriçõ es à s co-variaçõ es entre a frequê ncia fundamental (F0), a intensidade vocal e a qua‐
lidade da voz e, portanto, a forma como usamos e controlamos a nossa voz. Assim, compreender a produ‐
çã o e o controle da voz requer uma abordagem integrada, na qual a fisiologia, a vibraçã o das pregas vo‐
cais e a acú stica sejam consideradas como um todo, em vez de componentes desconectados. Tradicional‐
mente, a natureza multidisciplinar da produçã o da voz tem levado a uma divisã o clara entre as atividades
de investigaçã o na produçã o da voz, na perceçã o da voz e nas suas aplicaçõ es clínicas ou de fala, com pou‐
cos estudos que tentam ligá -las. Embora muito avanço tenha sido feito na compreensã o da físicaVisualizar
da fona‐ PDF
çã o, ainda existem alguns equívocos nos livros didá ticos de otorrinolaringologia e fonoaudiologia. Por
exemplo, o efeito Bernoulli, que demonstrou desempenhar um papel menor na fonaçã o, ainda é conside‐
rado um fator importante no início e na manutençã o da fonaçã o em muitos livros didá ticos e resenhas.
Tensã o e rigidez sã o frequentemente usadas de forma intercambiável, apesar de terem significados físicos
diferentes. O papel do mú sculo tireoaritenó ideo na regulaçã o da compressã o medial das pregas vocais
membranosas é frequentemente subestimado. Por outro lado, a investigaçã o sobre a produçã o de voz
centra-se frequentemente no fluxo gló tico e na vibraçã o das pregas vocais, mas pode beneficiar de uma
consideraçã o mais ampla da acú stica da voz produzida e das suas implicaçõ es para a comunicaçã o de voz.

Este artigo fornece uma revisã o sobre nossa compreensã o atual da relaçã o causa-efeito entre a fisiologia
da voz, a produçã o da voz e a percepçã o da voz, com a esperança de que ajude a unir melhor os esforços
de pesquisa em diferentes aspectos dos estudos da voz. Uma visã o geral da fisiologia das pregas vocais é
apresentada na Seç. II , com ê nfase na regulaçã o laríngea da geometria, propriedades mecâ nicas e posiçã o
das pregas vocais. Os mecanismos físicos de vibraçã o autossustentada das pregas vocais e geraçã o de som
sã o discutidos na Seçã o. III , com foco nas funçõ es de vá rios componentes e recursos físicos no início da
fonaçã o e na afetaçã o da acú stica produzida. Alguns equívocos sobre a física da produçã o de voz també m
sã o esclarecidos. A Seçã o IV discute o controle fisioló gico de F0, intensidade vocal e qualidade vocal. A Se‐
çã o V analisa os esforços passados ​e atuais no desenvolvimento de modelos mecâ nicos e computacionais
de produçã o de voz. Questõ es e desafios futuros no estabelecimento de uma teoria causal da produçã o e
percepçã o da voz sã o discutidos na Seç. VI .
II. FISIOLOGIA E BIOMECÂ NICA DA PREGA VOCAL

A. Anatomia e biomecânica das pregas vocais

O sistema vocal humano inclui os pulmõ es e as vias aé reas inferiores que funcionam para fornecer pres‐
sã o e fluxo de ar (uma revisã o da mecâ nica do sistema subgló tico pode ser encontrada em Hixon, 1987 ),
as pregas vocais cuja vibraçã o modula o fluxo de ar e produz a fonte de voz e o trato vocal que modifica a
fonte da voz e, assim, cria sons de saída específicos. As pregas vocais estã o localizadas na laringe e for‐
mam uma constriçã o nas vias aé reas [Fig.1(a)]. Cada prega vocal tem cerca de 11 a 15 mm de compri‐
mento em mulheres adultas e 17 a 21 mm em homens, e se estende pela laringe no sentido â ntero-poste‐
rior, fixando-se anteriormente à cartilagem tireó ide e posteriormente à superfície anterolateral das cartila‐
gens aritenó ides. Figo.1(c)]. Tanto a aritenó ide [Fig.1(d)] e tireó ide [Fig.1(e)] as cartilagens ficam no topo
da cartilagem cricó ide e interagem com ela atravé s da articulaçã o cricoaritenó idea e da articulaçã o cricoti‐
reó idea, respectivamente. O movimento relativo destas cartilagens proporciona assim um meio para ajus‐
tar a geometria, as propriedades mecâ nicas e a posiçã o das pregas vocais, conforme discutido abaixo. O
espaço aé reo tridimensional entre as duas pregas vocais opostas é a glote. A glote pode ser dividida em
uma porçã o membranosa, que inclui a porçã o anterior da glote e se estende da comissura anterior até o
processo vocal da aritenó ide, e uma porçã o cartilaginosa, que é o espaço posterior entre as cartilagens
aritenó ides.

Visualizar PDF

FIGO. 1.

(Cor online) (a) Vista coronal das pregas vocais e das vias aéreas; (b) estrutura histoló gica da lâmina pró pria da prega vocal
no plano coronal (imagem fornecida pela Dra. Jennifer Long da UCLA); (c) visão superior das pregas vocais, estrutura carti‐
laginosa e mú sculos laríngeos; (d) vista medial da articulação cricoaritenó idea formada entre as cartilagens aritenó idea e
cricó idea; (e) visão pó stero-lateral da articulação cricotireó idea formada pela tireoide e pelas cartilagens cricó ideas. As se‐
tas em (d) e (e) indicam a direção dos possíveis movimentos das cartilagens aritenó ide e cricó ide devido à ativação dos
mú sculos LCA e CT, respectivamente.

As pregas vocais sã o estruturas em camadas, consistindo de uma camada muscular interna (o mú sculo ti‐
reoaritenó ideo) com fibras musculares alinhadas principalmente ao longo da direçã o â ntero-posterior,
uma camada de tecido mole da lâ mina pró pria e uma camada externa de epité lio [Figs.1(a)e1(b)]. O mú s‐
culo tireoaritenó ideo (TA) à s vezes é dividido em um feixe medial e um feixe lateral, sendo cada feixe res‐
ponsável por uma determinada funçã o de postura das pregas vocais. Contudo, tal divisã o funcional ainda é
tema de debate ( Zemlin, 1997 ). A lâ mina pró pria consiste na matriz extracelular (MEC) e substâ ncias in‐
tersticiais. As duas proteínas primá rias da MEC sã o as fibras de colá geno e elastina, que estã o alinhadas
principalmente ao longo do comprimento das pregas vocais na direçã o â ntero-posterior ( Gray et al. ,
2000 ). Com base na densidade das fibras de colá geno e elastina [Fig.1(b)], a lâ mina pró pria pode ser divi‐
dida em uma camada superficial com fibras de elastina e colá geno limitadas e soltas, uma camada interme‐
diá ria de fibras predominantemente de elastina e uma camada profunda de fibras de colá geno em sua
maioria densas ( Hirano e Kakita, 1985 ; Kutty e Webb, 2009 ). Em comparaçã o, a lâ mina pró pria (cerca de
1 mm de espessura) é muito mais fina que o mú sculo TA.

Conceitualmente, a prega vocal é frequentemente simplificada em uma estrutura de cobertura corporal de


duas camadas ( Hirano, 1974 ; Hirano e Kakita, 1985 ). A camada corporal inclui a camada muscular e a
camada profunda da lâ mina pró pria, e a camada de cobertura inclui a lâ mina pró pria intermediá ria e su‐
perficial e a camada epitelial. Este conceito de cobertura corporal da estrutura das pregas vocais será ado‐
tado nas discussõ es abaixo. Outro esquema de agrupamento divide a prega vocal em trê s camadas. Alé m
de um corpo e uma camada de cobertura, as camadas intermediá ria e profunda da lâ mina pró pria sã o
agrupadas em uma camada de ligamento vocal ( Hirano, 1975 ). Supõ e-se que esta estrutura em camadas
desempenha um papel funcional na fonaçã o, com diferentes combinaçõ es de propriedades mecâ nicas em
diferentes camadas levando à produçã o de diferentes características de fonte de voz ( Hirano, 1974 ). No
entanto, devido à falta de dados sobre as propriedades mecâ nicas de cada camada da prega vocal e como
elas variam em diferentes condiçõ es de ativaçã o do mú sculo laríngeo, ainda falta uma compreensã o defini‐
tiva dos papé is funcionais de cada camada da prega vocal.

As propriedades mecâ nicas das pregas vocais foram quantificadas usando vá rios mé todos, incluindo tes‐
tes de traçã o ( Hirano e Kakita, 1985 ; Zhang et al. , 2006b ; Kelleher et al. , 2013a ), reometria de cisalha‐
mento ( Chan e Titze, 1999 ; Chan e Rodriguez, 2008 ; Miri et al. , 2012 ), recuo ( Haji et al. , 1992a , b ;
Tran et al. , 1993 ; Chhetri et al. , 2011 ) e um mé todo de onda de superfície ( Kazemirad et al. , 2014 ). ).
Esses estudos mostraram que as pregas vocais apresentam comportamento nã o linear, anisotró pico e vis‐
coelá stico. Uma curva típica de tensã o-deformaçã o das pregas vocais sob teste de traçã o â ntero-posterior
é mostrada na Fig.2. ​ A inclinaçã o da curva, ou rigidez, quantifica até que ponto as pregas vocais resistem à
deformaçã o em resposta a uma força aplicada. Em geral, apó s uma faixa linear inicial, a inclinaçã o da
curva tensã o-deformaçã o (rigidez) aumenta gradualmente com o aumento adicional da deformaçã o (Fig.2 ​
), presumivelmente devido ao envolvimento gradual das fibras de colá geno. Esse comportamento mecâ ‐
nico nã o linear fornece um meio de regular a rigidez e a tensã o das pregas vocais por meio do alonga‐
mento ou encurtamento das pregas vocais, o que desempenha um papel importante no controle da F0 ou
do tom da produçã o da voz. Normalmente, o estresse é maior durante a carga do que durante a descarga,
indicando um comportamento viscoso das pregas vocais. Devido à presença de colá geno, elastina e fibras
musculares alinhadas AP, as pregas vocais també m exibem propriedades mecâ nicas anisotró picas, mais rí‐PDF
Visualizar
gidas ao longo da direçã o AP do que no plano transversal. Experimentos ( Hirano e Kakita, 1985 ; Alipour
e Vigmostad, 2012 ; Miri et al. , 2012 ; Kelleher et al. , 2013a ) mostraram que o mó dulo de Young ao longo
da direçã o AP na camada de cobertura é mais de 10 vezes (tã o alto quanto 80 vezes em Kelleher et al. ,
2013a ) maior que no plano transversal. Foi demonstrado que a anisotropia de rigidez facilita o movi‐
mento mé dio-lateral das pregas vocais ( Zhang, 2014 ) e o fechamento gló tico completo durante a fonaçã o
( Xuan e Zhang, 2014 ).
FIGO. 2.

Curva tensão-deformação típica de tração da prega vocal ao longo da direção ântero-posterior durante carga e descarga a 1
Hz. A inclinação da linha tangente (linhas tracejadas) à curva tensão-deformação quantifica a rigidez tangente. O estresse é
normalmente maior durante o carregamento do que durante o descarregamento devido ao comportamento viscoso das pre‐
gas vocais. A curva foi obtida calculando a média dos dados ao longo de 30 ciclos apó s um pré-condicionamento de 10
ciclos.

A mediçã o precisa das propriedades mecâ nicas das pregas vocais em condiçõ es típicas de fonaçã o é um
desafio, devido ao pequeno tamanho das pregas vocais e à frequê ncia relativamente alta da fonaçã o. Em‐
bora os testes de traçã o e a reometria de cisalhamento permitam a mediçã o direta dos mó dulos de mate‐
rial, o pequeno tamanho da amostra muitas vezes leva a dificuldades na montagem de amostras de tecido
no equipamento de teste, criando assim preocupaçõ es de precisã o. Esses dois mé todos també m exigem a
dissecçã o de amostras de tecido das pregas vocais e da estrutura laríngea, impossibilitando a mediçã o in PDF
Visualizar
vivo . O mé todo de indentaçã o é ideal para mediçã o in vivo e, devido ao pequeno tamanho dos penetrado‐
res utilizados, permite a caracterizaçã o da variaçã o espacial das propriedades mecâ nicas das pregas vo‐
cais. No entanto, é limitado para mediçã o de propriedades mecâ nicas em condiçõ es de pequena deforma‐
çã o. Embora grandes profundidades de indentaçã o possam ser utilizadas, a interpretaçã o dos dados
torna-se difícil e, portanto, nã o é adequada para avaliaçã o das propriedades mecâ nicas nã o lineares das
pregas vocais.

Houve alguns trabalhos recentes para compreender a contribuiçã o dos componentes individuais da MEC
para as propriedades macromecâ nicas das pregas vocais e desenvolver um modelo constitutivo estrutu‐
ralmente baseado das pregas vocais (por exemplo, Chan et al. , 2001 ; Kelleher et al. , 2013b ;​​​A contribui‐
çã o do fluido intersticial para as propriedades viscoelá sticas das pregas vocais e o estresse das pregas vo‐
cais durante a vibraçã o e colisã o das pregas vocais també m foi investigada usando um modelo bifá sico das
pregas vocais no qual a prega vocal foi modelada como uma fase só lida interagindo com um intersticial.
fase fluida ( Zhang et al. , 2008 ; Tao et al. , 2009 , Tao et al. , 2010 ; Bhattacharya e Siegmund, 2013 ). Esta
abordagem estruturalmente baseada tem o potencial de prever as propriedades mecâ nicas das pregas vo‐
cais a partir da distribuiçã o de fibras de colá geno e elastina e fluidos intersticiais, o que pode fornecer no‐
vos insights sobre as propriedades mecâ nicas diferenciais entre as diferentes camadas das pregas vocais
em diferentes condiçõ es fisioló gicas.

B. Postura das pregas vocais


A comunicaçã o por voz requer controle preciso e ajuste de tom, volume e qualidade de voz. Fisiologica‐
mente, tais ajustes sã o feitos por meio da ativaçã o da musculatura laríngea, que enrijece, deforma ou repo‐
siciona as pregas vocais, controlando assim a geometria e as propriedades mecâ nicas das pregas vocais e
a configuraçã o gló tica.

Uma postura importante é a aduçã o/abduçã o das pregas vocais, que é alcançada principalmente atravé s
do movimento das cartilagens aritenó ides. Aná lises anatô micas e simulaçõ es numé ricas mostraram que a
articulaçã o cricoaritenó idea permite que as cartilagens aritenó ides deslizem e girem em torno do longo
eixo da cartilagem cricó ide, mas restringe a rotaçã o da aritenó ide em torno do eixo curto da cartilagem
cricó ide ( Selbie et al. , 1998 ; Hunter et al . , 2004 ; A ativaçã o dos mú sculos cricoaritenó ideos laterais
(LCA), que se fixam anteriormente à cartilagem cricó ide e posteriormente à s cartilagens aritenó ides, induz
principalmente um movimento de rotaçã o para dentro da aritenó ide em torno das cartilagens cricó ides no
plano coronal, e move a porçã o posterior da voz. dobra-se em direçã o à linha mé dia gló tica. A ativaçã o dos
mú sculos interaritenó ides (IA), que conectam as superfícies posteriores das duas aritenó ides, desliza e
aproxima as cartilagens aritenó ides [Fig.1(c)], fechando assim a glote cartilaginosa. Como ambos os mú s‐
culos atuam na porçã o posterior das pregas vocais, a açã o combinada dos dois mú sculos é capaz de fe‐
char completamente a porçã o posterior da glote, mas é menos eficaz no fechamento da glote mé dio-mem‐
branosa (Fig.3;​ Choi et al. , 1993 ; Chhetri et al. , 2012 ; Yin e Zhang, 2014 ). Devido a essa ineficiê ncia na
aproximaçã o mé dio-membranosa, a ativaçã o do mú sculo LCA/IA é incapaz de produzir compressã o me‐
dial entre as duas pregas vocais na porçã o membranosa, contrariando os entendimentos atuais ( Klatt e
Klatt, 1990 ; Hixon et al. , 2008 ). O fechamento completo e a compressã o medial da glote membranosa re‐
querem a ativaçã o do mú sculo TA ( Choi et al. , 1993 ; Chhetri et al. , 2012 ). O mú sculo TA forma a maior
parte das pregas vocais e se estende desde a proeminê ncia tireoidiana até a superfície anterolateral das
cartilagens aritenó ides (Fig.1).
​ A ativaçã o do mú sculo TA produz uma rotaçã o de todo o corpo das pregas
vocais no plano horizontal em torno do ponto de sua fixaçã o anterior à cartilagem tireó ide em direçã o à li‐
nha mé dia gló tica ( Yin e Zhang, 2014 ). Este movimento rotacional é capaz de fechar completamente a
glote membranosa, mas muitas vezes deixa uma lacuna posteriormente (Fig.3). ​ O fechamento completo da
glote membranosa e cartilaginosa requer, portanto, a ativaçã o combinada dos mú sculos LCA/IA e TA. Os
mú sculos cricoaritenó ideos posteriores (PCA) sã o os principais responsáveis ​pela abertura da glote, mas
també m podem desempenhar um papel na produçã o de voz em tons muito agudos, conforme discutido
abaixo.

Visualizar PDF
FIGO. 3.

A ativação dos mú sculos LCA/IA fecha completamente a glote posterior, mas deixa uma pequena lacuna na glote membra‐
nosa, enquanto a ativação do TA fecha completamente a glote anterior, mas deixa uma lacuna na glote posterior. A partir de
gravaçõ es estroboscó picas não publicadas de experimentos in vivo de laringe canina em Choi et al. (1993) .

A tensã o das pregas vocais é regulada pelo alongamento ou encurtamento das pregas vocais. Devido à s
propriedades nã o lineares do material das pregas vocais, a alteraçã o do comprimento das pregas vocais
també m leva a alteraçõ es na rigidez das pregas vocais, que de outra forma permaneceria constante para
materiais lineares. Os dois mú sculos laríngeos envolvidos na regulaçã o do comprimento das pregas vocais
sã o o mú sculo cricotireó ideo (CT) e o mú sculo TA. O mú sculo CT consiste em dois feixes. O feixe orientado
verticalmente, a pars recta, conecta a superfície anterior da cartilagem cricó ide e a borda inferior da lâ ‐
mina tireoidiana. Sua contraçã o aproxima as cartilagens tireó ide e cricó ide anteriormente atravé s de uma
rotaçã o em torno da articulaçã o cricotireó idea. O outro feixe, a pars oblíqua, está orientado para cima e
para trá s, conectando a superfície anterior da cartilagem cricó ide ao corno inferior da cartilagem tireó ide.
Visualizar
Sua contraçã o desloca as cartilagens cricó ide e aritenó ide para trá s ( Stone e Nuttall, 1974 ), embora a car‐PDF
tilagem tireó ide també m possa se mover ligeiramente para frente. A contraçã o de ambos os feixes alonga
assim as pregas vocais e aumenta a rigidez e a tensã o tanto no corpo quanto nas camadas de cobertura
das pregas vocais. Em contraste, a ativaçã o do mú sculo TA, que forma a camada corporal das pregas vo‐
cais, aumenta a rigidez e a tensã o na camada corporal. A ativaçã o do mú sculo TA, alé m de um efeito inicial
de aproximaçã o das pregas vocais membranosas, també m encurta as pregas vocais, o que diminui tanto a
rigidez quanto a tensã o na camada de cobertura ( Hirano e Kakita, 1985 ; Yin e Zhang, 2013 ) . Uma exce‐
çã o é quando a tensã o na cobertura das pregas vocais já é negativa (isto é , sob compressã o), caso em que
o encurtamento adicional das pregas vocais atravé s da ativaçã o do TA diminui a tensã o (isto é , aumenta a
força de compressã o), mas pode aumentar a rigidez na camada de cobertura. A ativaçã o dos mú sculos
LCA/IA geralmente nã o altera muito o comprimento das pregas vocais e, portanto, tem apenas um leve
efeito na rigidez e tensã o das pregas vocais ( Chhetri et al. , 2009 ; Yin e Zhang, 2014 ). No entanto, a ativa‐
çã o dos mú sculos LCA/IA (e també m dos mú sculos PCA) estabiliza a cartilagem aritenó ide e evita que ela
se mova para frente quando a cartilagem cricó ide é puxada para trá s devido ao efeito da ativaçã o do mú s‐
culo CT, facilitando assim o alongamento extremo das pregas vocais. particularmente para produçã o de
voz de alta frequê ncia. Como observado acima, devido à falta de mé todos de mediçã o confiáveis, nossa
compreensã o de como a rigidez e a tensã o das pregas vocais variam em diferentes condiçõ es de ativaçã o
muscular é limitada.
A ativaçã o dos mú sculos CT e TA també m altera o formato da superfície medial das pregas vocais e a geo‐
metria do canal gló tico. Especificamente, a ativaçã o do mú sculo TA faz com que a parte inferior da superfí‐
cie medial se projete em direçã o à linha mé dia gló tica ( Hirano e Kakita, 1985 ; Hirano, 1988 ; Vahabzadeh-
Hagh et al. , 2016 ), aumentando assim a espessura vertical da superfície medial . Em contraste, a ativaçã o
da TC reduz esta espessura vertical da superfície medial. Embora muitos estudos tenham investigado a
forma gló tica pré -fonató ria (convergente, reta ou divergente) na fonaçã o ( Titze, 1988a ; Titze et al. , 1995
), um estudo recente mostrou que a geometria do canal gló tico permanece amplamente reta na maioria
das condiçõ es do mú sculo laríngeo. ativaçã o ( Vahabzadeh-Hagh et al. , 2016 ).

III. FÍSICA DA PRODUÇÃ O DE VOZ

A. Fontes sonoras de produção de voz

O processo de fonaçã o inicia-se a partir da aduçã o das pregas vocais, que aproxima as pregas vocais para
reduzir ou fechar a glote. A contraçã o dos pulmõ es inicia o fluxo de ar e estabelece o aumento da pressã o
abaixo da glote. Quando a pressã o subgló tica excede um certo limite de pressã o, as pregas vocais sã o exci‐
tadas em uma vibraçã o autossustentada. A vibraçã o das pregas vocais, por sua vez, modula o fluxo de ar
gló tico em um fluxo de jato pulsante, que eventualmente se desenvolve em um fluxo turbulento no trato
vocal.

Em geral, trê s mecanismos principais de produçã o de som estã o envolvidos neste processo ( McGowan,
1988 ; Hofmans, 1998 ; Zhao et al. , 2002 ; Zhang et al. , 2002a ), incluindo uma fonte sonora monopolo
devido ao volume de ar deslocado pela voz vibraçã o de dobras, uma fonte sonora dipolo devido à força
flutuante aplicada pelas pregas vocais ao fluxo de ar e uma fonte sonora quadrupolo devido à turbulê ncia
desenvolvida imediatamente a jusante da saída gló tica. Quando as falsas pregas vocais estã o firmemente
aduzidas, uma fonte dipolo adicional pode surgir à medida que o jato gló tico colide com as falsas pregas
vocais ( Zhang et al. , 2002b ). A fonte sonora monopolo é geralmente pequena, considerando que as pre‐
gas vocais sã o quase incompressíveis e, portanto, o deslocamento líquido do fluxo de volume é pequeno. A
fonte dipolo é geralmente considerada a fonte sonora dominante e é responsável pelo componente
harmô nico do som produzido. A fonte sonora quadrupolo é geralmente muito mais fraca que a fonte di‐
polo em magnitude, mas é responsável pela produçã o de som de banda larga em altas frequê ncias.

Para o componente harmô nico da fonte de voz, uma fonte sonora monopolo equivalente pode ser definidaPDF
Visualizar
em um plano logo a jusante da regiã o das principais fontes sonoras, com a intensidade da fonte igual à
taxa de fluxo do volume glotal pulsante instantâ neo. Na teoria da fonaçã o fonte-filtro ( Fant, 1970 ), essa
fonte sonora monopolo é o sinal de entrada para o trato vocal, que atua como um filtro e molda o espec‐
tro da fonte sonora em diferentes sons antes de serem irradiados da boca para o ouvido. aberto como a
voz que ouvimos. Por causa da radiaçã o da boca, a fonte sonora é proporcional à derivada temporal do
fluxo gló tico. Assim, na literatura vocal, a derivada temporal do fluxo gló tico, em vez do fluxo gló tico, é con‐
siderada a fonte da voz.

O ciclo fonató rio é frequentemente dividido em uma fase aberta, na qual a glote abre (fase de abertura) e
fecha (fase de fechamento), e uma fase fechada, na qual a glote está fechada ou permanece uma á rea mí‐
nima de abertura quando o fechamento gló tico está incompleto. O fluxo gló tico aumenta e diminui na fase
aberta e permanece zero durante a fase fechada ou mínimo no fechamento gló tico incompleto (Fig.4). ​ Em
comparaçã o com a forma de onda da á rea gló tica, a forma de onda do fluxo gló tico atinge seu pico mais
tarde no ciclo, de modo que a forma de onda do fluxo gló tico fica mais inclinada para a direita. Essa distor‐
çã o na forma de onda do fluxo gló tico para a direita é devida à massa acú stica na glote e no trato vocal
(quando o F0 é menor do que uma frequê ncia de ressonâ ncia do trato vocal pró ximo), o que causa um
atraso no aumento do fluxo gló tico durante a fase de abertura e um declínio mais rá pido no fluxo gló tico
durante a fase de fechamento ( Rothenberg, 1981 ; Fant, 1982 ). Devido a esta forma de onda inclinada
para a direita, o pico negativo da derivada temporal do fluxo gló tico na fase de fechamento é muitas vezes
muito mais dominante do que o pico positivo na fase de abertura. O instante do pico mais negativo é , por‐
tanto, considerado o ponto de excitaçã o principal do trato vocal e o pico negativo correspondente, tam‐
bé m conhecido como taxa má xima de declinaçã o de fluxo (MFDR), é um dos principais determinantes da
amplitude do pico da voz produzida. . Apó s o pico negativo, a derivada temporal da forma de onda do
fluxo gló tico retorna a zero quando a fonaçã o entra na fase fechada.

FIGO. 4.

(Cor online) Forma de onda de fluxo gló tico típica e sua derivada de tempo (esquerda) e sua correspondência com as incli‐
naçõ es espectrais das porçõ es de baixa e alta frequência do espectro da fonte de voz (direita).

Muito trabalho foi feito para vincular diretamente as características da forma de onda do fluxo gló tico à
acú stica da voz e, potencialmente, à qualidade da voz (por exemplo, Fant, 1979 , 1982 ; Fant et al. , 1985 ;
Gobl e Chasaide, 2010 ). Estes estudos mostraram que a forma espectral de baixa frequê ncia (os primei‐
ros harmô nicos) da fonte de voz é determinada principalmente pela duraçã o relativa da fase aberta em re‐
laçã o ao período de oscilaçã o (To/T na Fig.4,
​ també m conhecido como quociente aberto). Uma fase aberta
mais longa geralmente leva a um primeiro harmô nico (H1) mais dominante na porçã o de baixa frequê ncia
do espectro da fonte de voz resultante. Para um determinado período de oscilaçã o, o encurtamento da
frase aberta faz com que a maior parte da mudança do fluxo gló tico ocorra dentro de uma duraçã o (To)
que é cada vez mais curta que o período T. Isso leva a um aumento de energia na porçã o de baixa frequê n‐
cia do espectro da fonte. que atinge o pico em torno de uma frequê ncia de 1/To. Para uma forma de onda
de fluxo gló tico de fase aberta muito curta, o segundo harmô nico (H2) ou mesmo o quarto harmô nico
(H4) pode se tornar o harmô nico mais dominante. A fonte de voz com H1 fraco em relaçã o a H2Visualizar
ou H4 é PDF
frequentemente associada a uma qualidade de voz pressionada.

A inclinaçã o espectral na faixa de alta frequê ncia está principalmente relacionada ao grau de descontinui‐
dade na derivada temporal da forma de onda do fluxo gló tico. Devido à distorçã o da forma de onda discu‐
tida anteriormente, a fonte mais dominante de descontinuidade geralmente ocorre em torno do instante
da excitaçã o principal, quando a derivada temporal da forma de onda do fluxo glotal retorna do pico nega‐
tivo para zero dentro de uma escala de tempo de Ta (Fig.4). Para um corte abrupto do fluxo gló tico ( Ta =
0), a derivada temporal da forma de onda do fluxo gló tico tem uma forte descontinuidade no ponto de ex‐
citaçã o principal, o que faz com que o espectro da fonte de voz decaia assintoticamente a uma taxa de roll-
off de -6 dB por oitava em direçã o à s altas frequê ncias. Aumentar Ta de zero leva a um retorno gradual do
pico negativo para zero. Quando aproximado por uma funçã o exponencial, esse retorno gradual funciona
como um filtro passa-baixa, com frequê ncia de corte em torno de 1/ Ta , e reduz a excitaçã o de harmô ni‐
cos acima da frequê ncia de corte 1/ Ta . Assim, na faixa de frequê ncia relativa à percepçã o da voz, o au‐
mento de Ta muitas vezes leva à reduçã o da excitaçã o harmô nica de ordem superior. No caso extremo,
quando há contato mínimo entre as pregas vocais, a derivada temporal da forma de onda do fluxo gló tico
é tã o suave que o espectro da fonte de voz possui apenas alguns harmô nicos de ordem inferior. Perceptu‐
almente, a forte excitaçã o de harmô nicos de ordem superior é frequentemente associada a uma qualidade
de som de saída brilhante, enquanto a fonte de voz com excitaçã o limitada de harmô nicos de ordem supe‐
rior é frequentemente percebida como fraca.
També m de importâ ncia perceptual é o ruído de turbulê ncia produzido imediatamente a jusante da glote.
Embora de pequena amplitude, o componente ruído desempenha um papel importante na percepçã o da
qualidade vocal, principalmente na voz feminina, na qual o ruído de aspiraçã o é mais persistente do que
na voz masculina. Embora o componente de ruído da voz seja frequentemente modelado como ruído
branco, seu espectro muitas vezes nã o é plano e pode exibir diferentes formas espectrais, dependendo da
abertura gló tica e da taxa de fluxo, bem como do formato do trato vocal. Demonstrou-se que a interaçã o
entre a forma espectral e os níveis relativos de energia harmô nica e sonora na fonte de voz influencia a
percepçã o da qualidade da voz ( Kreiman e Gerratt, 2012 ).

Vale a pena notar que muitos dos parâ metros de origem nã o sã o independentes uns dos outros e muitas
vezes covariam. Como eles co-variam em diferentes condiçõ es de voz, o que é essencial para a síntese na‐
tural da fala, continua a ser o foco de muitos estudos (por exemplo, Sundberg e Hogset, 2001 ; Gobl e Cha‐
saide, 2003 ; Patel et al. , 2011 ).

B. Mecanismos de vibração autossustentada das pregas vocais

Que a vibraçã o das pregas vocais resulta de uma interaçã o complexa entre o fluxo de ar e as pregas vocais
dentro da glote, em vez da estimulaçã o nervosa repetitiva da laringe, foi reconhecida pela primeira vez por
van den Berg (1958) . De acordo com sua teoria mioelá stico-aerodinâ mica de produçã o da voz, a fonaçã o
começa a partir da aduçã o completa das pregas vocais até o fechamento da glote, o que permite um au‐
mento da pressã o subgló tica. As pregas vocais permanecem fechadas até que a pressã o subgló tica seja su‐
ficientemente alta para separá -las, permitindo que o ar escape e produzindo uma pressã o intragló tica ne‐
gativa (em relaçã o à pressã o atmosfé rica) devido ao efeito Bernoulli. Essa pressã o negativa de Bernoulli e
o recuo elá stico puxam as pregas vocais para trá s e fecham a glote. O ciclo entã o se repete, o que leva à vi‐
braçã o sustentada das pregas vocais.

Embora a teoria mioelá stica-aerodinâ mica identifique corretamente a interaçã o entre as pregas vocais e o
fluxo de ar como o mecanismo subjacente da vibraçã o autossustentada das pregas vocais, ela nã o explica
como a energia é transferida do fluxo de ar para as pregas vocais para sustentar essa vibraçã o. Tradicio‐
nalmente, considera-se que a pressã o intragló tica negativa desempenha um papel importante no fecha‐
mento da glote e na sustentaçã o da vibraçã o das pregas vocais. No entanto, entende-se agora que uma
pressã o intragló tica negativa nã o é um requisito crítico para alcançar a vibraçã o auto-sustentada das pre‐
gas vocais. Da mesma forma, uma geometria do canal gló tico alternadamente convergente-divergente du‐
rante a fonaçã o tem sido considerada uma condiçã o necessá ria que leva à transferê ncia líquida Visualizar
de energiaPDF
do fluxo de ar para as pregas vocais. Mostraremos a seguir que uma geometria de canal gló tico alternada‐
mente convergente-divergente nem sempre garante transferê ncia de energia ou vibraçã o autossustentada
das pregas vocais.

Para condiçõ es de fluxo típicas da fonaçã o humana, o fluxo gló tico pode ser razoavelmente descrito pela
equaçã o de Bernoulli até o ponto em que o fluxo de ar se separa da parede gló tica, muitas vezes na saída
gló tica, na qual as vias aé reas se expandem repentinamente. De acordo com a equaçã o de Bernoulli, a
pressã o de fluxo p em um local dentro do canal glotal com uma á rea de seçã o transversal A variável no
tempo é

As e p2
p = Pe aí?+ (Pvocê -é​Pe aí?) ( 1 − ) , (1)
A2

onde P sub e P sup sã o a pressã o subgló tica e supragló tica, respectivamente, e A sep é a á rea gló tica variável
no tempo no local de separaçã o do fluxo. Para simplificar, assumimos que o fluxo se separa na margem su‐
perior da superfície medial. Para conseguir uma transferê ncia líquida de energia do fluxo de ar para as
pregas vocais ao longo de um ciclo, a pressã o do ar na superfície das pregas vocais deve estar pelo menos
parcialmente em fase com a velocidade das pregas vocais. Especificamente, a pressã o intragló tica precisa
ser maior na fase de abertura do que na fase de fechamento da vibraçã o das pregas vocais, para que o
fluxo de ar realize mais trabalho nas pregas vocais na fase de abertura do que o trabalho que as pregas
vocais realizam de volta ao fluxo de ar na fase de abertura. fase de fechamento.

A aná lise teó rica da transferê ncia de energia entre o fluxo de ar e as pregas vocais ( Ishizaka e Matsudaira,
1972 ; Titze, 1988a ) mostrou que essa assimetria de pressã o pode ser alcançada por uma diferença de
fase vertical no movimento da superfície das pregas vocais (també m conhecida como onda mucosa), isto é ,
diferentes porçõ es da superfície da prega vocal nã o se movem necessariamente para dentro e para fora
juntas como um todo. Este mecanismo é ilustrado na Fig.5, ​ cujo canto superior esquerdo mostra o for‐
mato da superfície da prega vocal no plano coronal por seis instantes consecutivos e igualmente espaça‐
dos durante um ciclo de vibraçã o na presença de uma diferença de fase vertical. Os instantes 2 e 3 em li‐
nhas só lidas estã o na fase de fechamento, enquanto os instantes 5 e 6 em linhas tracejadas estã o na fase
de abertura. Consideremos, por exemplo, a transferê ncia de energia na margem inferior da superfície me‐
dial. Devido à diferença de fase vertical, o canal gló tico tem um formato diferente na fase de abertura (li‐
nhas tracejadas 5 e 6) daquela na fase de fechamento (linhas só lidas 3 e 2) quando a margem inferior da
superfície medial cruza os mesmos locais. Particularmente, quando a margem inferior da superfície medial
lidera em fase a margem superior, o canal gló tico durante a abertura (por exemplo, instante 6) é sempre
mais convergente [portanto, um A sep / A menor na Eq. (1) ] ou menos divergente que no fechamento (ex.
instante 2) para o mesmo local da margem inferior, resultando em uma pressã o de ar [Eq. (1) ] que é
maior na fase de abertura do que na fase de fechamento (Fig.5, ​ linha superior). Como resultado, a energia
é transferida do fluxo de ar para as pregas vocais ao longo de um ciclo, como indicado por uma á rea dife‐
rente de zero delimitada pela curva força aerodinâ mica-deslocamento das pregas vocais na Fig.5(canto​ su‐
perior direito). A existê ncia de uma diferença de fase vertical no movimento da superfície das pregas vo‐
cais é geralmente considerada o principal mecanismo de início da fonaçã o.

Visualizar PDF

FIGO. 5.

Dois mecanismos de transferência de energia. Linha superior: a presença de uma diferença de fase vertical leva a diferentes
formatos de superfície medial entre a abertura gló tica (linhas tracejadas 5 e 6; painel superior esquerdo) e o fechamento (li‐
nhas só lidas 2 e 3) quando a margem inferior da superfície medial cruza a mesma locais, o que leva a uma pressão de ar
mais alta durante a abertura gló tica do que no fechamento e à transferência líquida de energia do fluxo de ar para as pregas
vocais na margem inferior da superfície medial. Linha do meio: sem uma diferença de fase vertical, a vibração das pregas
vocais produz uma geometria de canal gló tico alternadamente convergente-divergente, mas idêntica, entre a abertura e o fe‐
chamento da glote (painel inferior esquerdo), portanto, transferência de energia zero (linha do meio). Linha inferior: sem di‐
ferença de fase vertical, a assimetria da pressão do ar pode ser imposta por um mecanismo de amortecimento negativo.
Em contraste, sem diferença de fase vertical, a superfície da prega vocal durante a abertura (Fig.5, inferior
esquerdo; linhas tracejadas 5 e 6) e fechamento (linhas só lidas 3 e 2) seriam idê nticos quando a margem
inferior cruzasse as mesmas posiçõ es, para as quais a equaçã o de Bernoulli preveria pressã o de fluxo si‐
mé trica entre as fases de abertura e fechamento, e transferê ncia de energia líquida zero sobre um ciclo
(fig.5, linha do meio). Nessa condiçã o, a assimetria de pressã o entre as fases de abertura e fechamento
deve ser proporcionada por um mecanismo externo que imponha diretamente uma diferença de fase en‐
tre a pressã o intragló tica e o movimento das pregas vocais. Na presença de tal mecanismo externo, a pres‐
sã o intragló tica nã o é mais a mesma entre a abertura e o fechamento, mesmo quando o canal gló tico tem o
mesmo formato que a prega vocal cruza os mesmos locais, resultando em uma transferê ncia líquida de
energia ao longo de um ciclo do fluxo de ar. à s pregas vocais (Fig.5,
​ linha inferior). Este mecanismo de
transferê ncia de energia é frequentemente referido como amortecimento negativo, porque a pressã o in‐
tragló tica depende da velocidade das pregas vocais e aparece nas equaçõ es do sistema de movimento das
pregas vocais de uma forma semelhante a uma força de amortecimento, exceto que a energia é transferida
para as pregas vocais. de ser dissipado. O amortecimento negativo é o ú nico mecanismo de transferê ncia
de energia em um sistema com um ú nico grau de liberdade ou quando toda a superfície medial se move
em fase como um todo.

Em humanos, um amortecimento negativo pode ser fornecido por um trato vocal inertivo ( Flanagan e
Landgraf, 1968 ; Ishizaka e Matsudaira, 1972 ; Ishizaka e Flanagan, 1972 ) ou um sistema subgló tico com‐
placente ( Zhang et al. , 2006a ). Como o amortecimento negativo associado à carga acú stica é significativo
apenas para frequê ncias pró ximas a uma ressonâ ncia acú stica, a fonaçã o sustentada apenas por esse
amortecimento negativo sempre ocorre em uma frequê ncia pró xima a essa ressonâ ncia acú stica ( Flana‐
gan e Landgraf, 1968 ; Zhang et al. , 2006a ) . Embora nã o haja nenhuma evidê ncia direta de fonaçã o sus‐
tentada predominantemente por carga acú stica em humanos, instabilidades na produçã o da voz (ou que‐
bras de voz) tê m sido relatadas quando a frequê ncia fundamental da vibraçã o das pregas vocais se apro‐
xima de uma das ressonâ ncias do trato vocal (por exemplo, Titze et al. , 2008 ). Por outro lado, este arras‐
tamento da frequê ncia de fonaçã o para a ressonâ ncia acú stica limita o grau de controle independente da
fonte de voz e a modificaçã o espectral pelo trato vocal, e é menos desejável para uma comunicaçã o de fala
eficaz. Considerando que os humanos sã o capazes de produzir uma grande variedade de tipos de voz in‐
dependentemente do formato do trato vocal, o amortecimento negativo devido ao acoplamento acú stico à
acú stica sub ou supragló tica é improvável que seja o principal mecanismo de transferê ncia de energia na
produçã o de voz. Na verdade, laringes excisadas sã o capazes de vibrar sem trato vocal. Por outro lado, ex‐
perimentos mostraram que em humanos as pregas vocais vibram em uma frequê ncia pró xima a uma res‐
sonâ ncia de prega vocal in vacuo ( Kaneko et al. , 1986 ; Ishizaka, 1988 ; Svec et al. , 2000 ) em vez das res‐PDF
Visualizar
sonâ ncias acú sticas dos tratos sub e supragló ticos, sugerindo que a fonaçã o é essencialmente um fenô ‐
meno de ressonâ ncia das pregas vocais.

Um amortecimento negativo també m pode ser fornecido pela aerodinâ mica gló tica. Por exemplo, a acele‐
raçã o e desaceleraçã o do fluxo gló tico pode fazer com que o fluxo se separe em locais diferentes entre a
abertura e o fechamento, mesmo quando a glote tem geometria idê ntica. Este é particularmente o caso de
uma geometria divergente do canal gló tico, que muitas vezes resulta em separaçã o assimé trica do fluxo e
assimetria de pressã o entre as fases de abertura e fechamento da glote ( Park e Mongeau, 2007 ; Alipour e
Scherer, 2004 ). Espera-se que o efeito deste mecanismo de amortecimento negativo seja pequeno no iní‐
cio da fonaçã o, no qual a amplitude de vibraçã o das pregas vocais e, portanto, a instabilidade do fluxo sã o
pequenas e o canal gló tico tem menos probabilidade de ser divergente. No entanto, sua contribuiçã o para
a transferê ncia de energia pode aumentar com o aumento da amplitude de vibraçã o das pregas vocais e
da instabilidade do fluxo ( Howe e McGowan, 2010 ). É importante diferenciar esta separaçã o de fluxo as‐
simé trica entre a abertura e o fechamento da glote devido aos efeitos de fluxo instável de uma separaçã o
de fluxo assimé trica quase constante que é causada pela assimetria na geometria do canal glotal entre a
abertura e o fechamento. Neste ú ltimo caso, como a separaçã o do fluxo pode ocorrer em um local mais a
montante para um canal gló tico divergente do que para um canal gló tico convergente, uma geometria assi‐
mé trica do canal gló tico (por exemplo, uma glote abrindo convergente e fechando divergente) pode levar
à separaçã o assimé trica do fluxo entre o canal gló tico. abrindo e fechando. Em comparaçã o com condiçõ es
de separaçã o de fluxo fixa (isto é , o fluxo se separa no mesmo local durante todo o ciclo, como na Fig.5),

tal separaçã o de fluxo assimé trica induzida pela geometria na verdade reduz a assimetria de pressã o en‐
tre a abertura e o fechamento da glote [isso pode ser mostrado usando a Eq. (1) ] e, portanto, enfraquece
a transferê ncia líquida de energia. Na realidade, esses dois tipos de mecanismos assimé tricos de separa‐
çã o de fluxo (devido a efeitos instáveis ​o u mudanças na geometria do canal gló tico) interagem e podem re‐
sultar em padrõ es de separaçã o de fluxo muito complexos ( Alipour e Scherer, 2004 ; Sciamarella e Le
Quere, 2008 ; Sidlof et al . , 2011 ), o que pode ou nã o melhorar a transferê ncia de energia.

Da discussã o acima fica claro que uma pressã o negativa de Bernoulli nã o é um requisito crítico em ne‐
nhum dos dois mecanismos. Sendo proporcional ao deslocamento das pregas vocais, a pressã o negativa
de Bernoulli nã o é um amortecimento negativo e nã o fornece diretamente a assimetria de pressã o neces‐
sá ria entre a abertura e o fechamento da glote. Por outro lado, a existê ncia de uma diferença de fase verti‐
cal na vibraçã o das pregas vocais é determinada principalmente pelas propriedades das pregas vocais
(conforme discutido abaixo), e nã o pelo fato de a pressã o intragló tica ser positiva ou negativa durante
uma determinada fase do ciclo de oscilaçã o.

Embora uma diferença de fase vertical na vibraçã o das pregas vocais leve a uma geometria do canal gló ‐
tico variável no tempo, uma geometria do canal gló tico alternadamente convergente-divergente nã o ga‐
rante vibraçã o autossustentada das pregas vocais. Por exemplo, embora o movimento em fase das pregas
vocais na parte inferior esquerda da Fig.5(toda
​ a superfície medial se move para dentro e para fora jun‐
tas) leva a uma geometria gló tica alternadamente convergente-divergente, a geometria gló tica é idê ntica
entre a abertura e o fechamento da glote e, portanto, este movimento é incapaz de produzir transferê ncia
líquida de energia para as pregas vocais sem um amortecimento negativo mecanismo (fig.5, ​ linha do meio).
Em outras palavras, uma geometria gló tica alternadamente convergente-divergente é um efeito, e nã o uma
causa, da vibraçã o autossustentada das pregas vocais. Teoricamente, a glote pode manter uma forma con‐
vergente ou divergente durante todo o ciclo de oscilaçã o e ainda assim oscilar automaticamente, como ob‐
servado em experimentos usando modelos físicos de pregas vocais que tinham uma forma divergente du‐
rante a maior parte do ciclo de oscilaçã o ( Zhang et al. , 2006a ).

C. Sincronização de modo pró prio e dinâmica não linear

O que foi dito acima mostra que a transferê ncia líquida de energia do fluxo de ar para as pregas vocais é
possível na presença de uma diferença de fase vertical. Mas como é estabelecida essa diferença de fase
vertical e o que determina a diferença de fase vertical e o padrã o de vibraçã o das pregas vocais? Na pro‐
duçã o de voz, a vibraçã o das pregas vocais com diferença de fase vertical resulta de um processo Visualizar
de sin‐ PDF
cronizaçã o de modo pró prio, no qual dois ou mais modos pró prios in vacuo das pregas vocais sã o sincro‐
nizados para vibrar na mesma frequê ncia, mas com diferença de fase ( Ishizaka e Matsudaira, 1972 ; Ishi‐
zaka, 1981 ; Horacek e Svec, 2002 ; Zhang et al. ), da mesma forma que uma onda viajante formada pela
superposiçã o de duas ondas estacioná rias. Um modo pró prio ou ressonâ ncia é um padrã o de movimento
do sistema que é permitido ao sistema por leis físicas e restriçõ es de limite. Em geral, para cada modo, o
padrã o de vibraçã o é tal que todas as partes do sistema se movem em fase ou 180° fora de fase, seme‐
lhante a uma onda estacioná ria. Cada modo pró prio tem uma frequê ncia pró pria (ou frequê ncia de resso‐
nâ ncia) inerentemente distinta na qual o modo pró prio pode ser excitado ao má ximo. Um exemplo de mo‐
dos pró prios frequentemente encontrados na ciê ncia da fala sã o os formantes, que sã o picos nos espec‐
tros de voz de saída devido à excitaçã o de ressonâ ncias acú sticas do trato vocal, com a frequê ncia do for‐
mante dependente da geometria do trato vocal. Figura6mostra
​ trê s modos pró prios típicos da prega vocal
no plano coronal. Na Fig.6,​ a linha fina indica o formato da superfície da prega vocal em repouso, en‐
quanto as linhas só lidas e tracejadas indicam posiçõ es extremas da prega vocal ao vibrar no modo pró ‐
prio correspondente, espaçados de 180° em um ciclo vibrató rio. O primeiro modo pró prio mostra um mo‐
vimento para cima e para baixo na direçã o vertical, o que nã o modula muito o fluxo de ar gló tico. O se‐
gundo modo pró prio tem um movimento mé dio-lateral dominantemente em fase ao longo da superfície
medial, o que modula o fluxo de ar. O terceiro modo pró prio també m exibe movimento dominantemente
mé dio-lateral, mas a porçã o superior da superfície medial vibra 180° fora de fase com a porçã o inferior da
superfície medial. Tal movimento fora de fase, como no terceiro modo pró prio, é essencial para alcançar a
vibraçã o das pregas vocais com uma grande diferença de fase vertical, por exemplo, quando sincronizado
com um modo pró prio em fase, como na Fig.6(b).

FIGO. 6.

Modos pró prios típicos das pregas vocais exibindo (a) um movimento dominantemente superior-inferior, (b) um movi‐
mento em fase medial-lateral e (c) um movimento fora de fase medial-lateral ao longo da superfície medial.

Na ausê ncia de fluxo de ar, os modos pró prios das pregas vocais no vácuo sã o geralmente neutros ou
amortecidos, o que significa que, quando excitados, sua amplitude diminuirá gradualmente com o tempo.
Quando as pregas vocais estã o sujeitas ao fluxo de ar, no entanto, o acoplamento prega vocal-fluxo de ar
modifica os modos pró prios e, em algumas condiçõ es, sincroniza dois modos pró prios para a mesma
frequê ncia (Fig.7).
​ Embora a vibraçã o em cada modo pró prio por si só nã o produza transferê ncia líquida
de energia (Fig.5,
​ linha do meio), quando dois modos sã o sincronizados na mesma frequê ncia, mas com
uma diferença de fase no tempo, a velocidade de vibraçã o associada a um modo pró prio [por exemplo, o
modo pró prio na Fig.6(b)] estará pelo menos parcialmente em fase com a pressã o induzida pelo outro
modo pró prio [por exemplo, o modo pró prio na Fig.6(c)], e essa interaçã o pressã o-velocidade entre mo‐
delos produzirá transferê ncia líquida de energia para as pregas vocais ( Ishizaka e Matsudaira, 1972 ;
Zhang et al. , 2007 ).

Visualizar PDF
FIGO. 7.

Um padrão típico de sincronização de modo pró prio. A evolução dos três primeiros modos pró prios é mostrada em função
da pressão subgló tica. À medida que a pressão subgló tica aumenta, as frequências (topo) dos modos pró prios da segunda e
da terceira prega vocal gradualmente se aproximam e, em um limiar de pressão subgló tica, sincronizam-se com a mesma
frequência. Ao mesmo tempo, a taxa de crescimento (inferior) do segundo modo torna-se positiva, indicando que o Visualizar
sistema PDF
acoplado fluxo de ar-prega vocal torna-se linearmente instável e a fonação começa.

A pressã o subgló tica mínima necessá ria para sincronizar dois modos pró prios e iniciar a transferê ncia lí‐
quida de energia, ou a pressã o do limiar de fonaçã o, é proporcional ao espaçamento de frequê ncia entre
os dois modos pró prios sendo sincronizados e à força de acoplamento entre os dois modos pró prios (
Zhang, 2010 ):

ω0 , 22 - ω0 , 12
Pº​ = , (2)
β

onde ω 0,1 e ω 0,2 sã o as frequê ncias pró prias dos dois modos pró prios no vácuo que participam do pro‐
cesso de sincronizaçã o e β é a força de acoplamento entre os dois modos pró prios. Assim, quanto mais
pró ximos os dois modos pró prios estiverem entre si em frequê ncia ou mais fortemente acoplados, menos
pressã o será necessá ria para sincronizá -los. Este é particularmente o caso de um material anisotró pico,
como as pregas vocais, em que a rigidez AP é muito maior que a rigidez no plano transversal. Sob tais con‐
diçõ es de rigidez anisotró pica, as primeiras frequê ncias pró prias das pregas vocais no vácuo tendem a se
agrupar e sã o muito mais pró ximas umas das outras em comparaçã o com as condiçõ es de rigidez isotró ‐
pica ( Titze e Strong, 1975 ; Berry, 2001 ). Esse agrupamento de modos pró prios torna possível iniciar a
vibraçã o das pregas vocais em pressõ es subgló ticas muito baixas.

A força de acoplamento β entre os dois modos pró prios na Eq. (2) depende da abertura gló tica pré -fona‐
tó ria, com a força de acoplamento aumentando com a diminuiçã o da abertura gló tica (portanto, dimi‐
nuindo a pressã o do limiar de fonaçã o). Alé m disso, a força de acoplamento també m depende da seme‐
lhança espacial entre a distribuiçã o da pressã o do ar sobre a superfície da prega vocal induzida por um
modo pró prio e a velocidade superficial da prega vocal do outro modo pró prio ( Zhang, 2010 ). Em outras
palavras, a força de acoplamento β quantifica a eficiê ncia de transferê ncia de energia de modo cruzado en‐
tre os modos pró prios que estã o sendo sincronizados. Quanto maior o grau de similaridade pressã o-velo‐
cidade entre modos cruzados, melhor serã o os dois modos pró prios acoplados e menos pressã o subgló ‐
tica será necessá ria para sincronizá -los.

Na realidade, as pregas vocais possuem um nú mero infinito de modos pró prios. Quais modos pró prios
sã o sincronizados e eventualmente excitados dependem do espaçamento de frequê ncia e da força de aco‐
plamento relativa entre os diferentes modos pró prios. Como a vibraçã o das pregas vocais depende dos
modos pró prios que sã o eventualmente excitados, mudanças no padrã o de sincronizaçã o dos modos pró ‐
prios geralmente levam a mudanças na F0, no padrã o de vibraçã o das pregas vocais e na qualidade da voz
resultante. Estudos anteriores mostraram que uma ligeira mudança nas propriedades das pregas vocais,
como rigidez ou formato da superfície medial, pode fazer com que a fonaçã o ocorra em um modo pró prio
diferente, levando a um padrã o de vibraçã o das pregas vocais qualitativamente diferente e mudanças
abruptas na F0 ( Tokuda et al. , 2007 ; Zhang, 2009 ). A sincronizaçã o do modo pró prio també m nã o está
limitada a dois modos pró prios das pregas vocais. També m pode ocorrer entre um modo pró prio da
prega vocal e um modo pró prio do sistema subgló tico ou supragló tico. Nesse sentido, o amortecimento
negativo devido à carga acú stica subgló tica ou supragló tica pode ser visto como resultado da sincroniza‐
çã o entre um dos modos das pregas vocais e uma das ressonâ ncias acú sticas.

A sincronizaçã o de modo pró prio discutida acima corresponde a uma sincronizaçã o temporal 1:1 de dois
modos pró prios. Para uma determinada faixa de condiçõ es das pregas vocais, por exemplo, quando existe
assimetria (esquerda-direita ou â ntero-posterior) no sistema vocal ou quando as pregas vocais estã o for‐
temente acopladas à acú stica sub ou supragló tica, a sincronizaçã o pode ocorrer de modo que os dois mo‐
dos pró prios sã o sincronizados nã o na mesma frequê ncia, mas em uma proporçã o de frequê ncia de 1: 2,
1: 3, etc., levando a subharmô nicos ou bifonaçã o ( Ishizaka e Isshiki, 1976 ; Herzel, 1993 ; HerzelVisualizar
et al. , PDF
1994 ; Neubauer et al . , 2001 ;​​​A dessincronizaçã o temporal dos modos pró prios geralmente leva à vibra‐
çã o irregular ou caó tica das pregas vocais ( Herzel et al. , 1991 ; Berry et al. , 1994 ; Berry et al. , 2006 ;
Steinecke e Herzel, 1995 ). A transiçã o entre diferentes padrõ es de sincronizaçã o, ou bifurcaçã o, muitas
vezes leva a uma mudança repentina no padrã o de vibraçã o das pregas vocais e na qualidade da voz.

Esses estudos mostram que a interaçã o nã o linear entre os modos pró prios das pregas vocais é uma ca‐
racterística central do processo de fonaçã o, com diferentes padrõ es de sincronizaçã o ou dessincronizaçã o
produzindo uma grande variedade de tipos de voz. Assim, alterando as propriedades geomé tricas e bio‐
mecâ nicas das pregas vocais, seja por meio da ativaçã o da musculatura laríngea ou por modificaçã o mecâ ‐
nica como na fonocirurgia, podemos selecionar modos pró prios e padrã o de sincronizaçã o de modos pró ‐
prios para controlar ou modificar nossa voz, da mesma forma que controlamos os formantes da fala. mo‐
vendo articuladores no trato vocal para modificar as ressonâ ncias acú sticas do trato vocal.

O conceito de modo pró prio e sincronizaçã o de modo pró prio també m é ú til para modelagem de fonaçã o,
porque os modos pró prios podem ser usados ​como blocos de construçã o para construir movimentos
mais complexos do sistema. Freqü entemente, apenas os primeiros modos pró prios sã o necessá rios para a
reconstruçã o adequada de vibraçõ es complexas das pregas vocais (regulares e irregulares; Herzel et al. ,
1994 ; Berry et al. , 1994 ; Berry et al. , 2006 ), o que reduziria significativamente o graus de liberdade exi‐
gidos em modelos computacionais de fonaçã o.
D. Requisitos biomecânicos do fechamento gló tico durante a fonação

Uma característica importante da fonaçã o normal é o fechamento completo da glote membranosa durante
a vibraçã o, essencial para a produçã o de harmô nicos de alta frequê ncia. O fechamento incompleto da glote
membranosa, como frequentemente observado em condiçõ es patoló gicas, muitas vezes leva à produçã o
de voz com qualidade fraca e/ou soprosa.

Geralmente é assumido que a aproximaçã o das pregas vocais atravé s da aduçã o das aritenó ides é sufici‐
ente para alcançar o fechamento gló tico durante a fonaçã o, com a duraçã o do fechamento gló tico ou o
quociente de fechamento aumentando com o aumento do grau de aproximaçã o das pregas vocais. Embora
um certo grau de aproximaçã o das pregas vocais seja obviamente necessá rio para o fechamento gló tico,
há evidê ncias que sugerem que outros fatores també m estã o em jogo. Por exemplo, experimentos com la‐
ringe excisada mostraram que algumas laringes vibrariam com fechamento gló tico incompleto, apesar de
as aritenó ides estarem firmemente suturadas ( Isshiki, 1989 ; Zhang, 2011 ). Fechamento gló tico incom‐
pleto semelhante també m é observado em experimentos usando modelos físicos de pregas vocais com
propriedades de material isotró pico ( Thomson et al. , 2005 ; Zhang et al. , 2006a ). Nestes experimentos, o
aumento da pressã o subgló tica aumentou a amplitude de vibraçã o das pregas vocais, mas muitas vezes
nã o levou à melhora no padrã o de fechamento gló tico ( Xuan e Zhang, 2014 ). Esses estudos mostram que
sã o necessá rias condiçõ es adicionais de rigidez ou geometria para obter o fechamento gló tico membra‐
noso completo.

Estudos recentes começaram a fornecer alguns insights sobre essas condiçõ es biomecâ nicas adicionais.
Xuan e Zhang (2014) mostraram que a incorporaçã o de fibras ao longo da direçã o â ntero-posterior em
modelos isotró picos é capaz de melhorar o fechamento gló tico ( Xuan e Zhang, 2014 ). Com uma camada
externa fina e mais rígida adicional simulando o epité lio, esses modelos físicos sã o capazes de vibrar com
um período fechado consideravelmente longo. É interessante que esta melhoria no padrã o de fechamento
gló tico ocorreu apenas quando as fibras foram incorporadas em um local pró ximo à superfície da prega
vocal na camada de cobertura. A incorporaçã o de fibras na camada do corpo nã o melhorou em nada o pa‐
drã o de fechamento. Isto sugere um possível papel funcional das fibras de colá geno e elastina nas cama‐
das intermediá rias e profundas da lâ mina pró pria na facilitaçã o do fechamento gló tico durante a vibraçã o.

A diferença no padrã o de fechamento gló tico entre pregas vocais isotró picas e anisotró picas pode ser de‐
vida a vá rios motivos. Em comparaçã o com as pregas vocais isotró picas, as pregas vocais anisotró picas
(ou modelos incorporados em fibras) sã o mais capazes de manter sua posiçã o adutora contra aVisualizar
pressã o PDF
subgló tica e tê m menos probabilidade de serem afastadas pela pressã o do ar ( Zhang, 2011 ). Alé m disso,
a incorporaçã o de fibras ao longo da direçã o AP també m pode melhorar o movimento mé dio-lateral, facili‐
tando ainda mais o fechamento gló tico. Zhang (2014) mostrou que os primeiros modos pró prios in vacuo
de pregas vocais isotró picas exibem movimentos semelhantes em fase, para cima e para baixo, semelhan‐
tes a balanços, com os movimentos medial-lateral e superior-inferior travados em uma relaçã o de fase se‐
melhante. A sincronizaçã o de modos de padrõ es de vibraçã o semelhantes leva necessariamente a padrõ es
de vibraçã o qualitativamente iguais, neste caso um movimento semelhante a um balanço para cima e para
baixo, com a vibraçã o das pregas vocais dominantemente ao longo da direçã o superior-inferior, como ob‐
servado em experimentos recentes de modelos físicos. Thomson et al. , 2005 ; Zhang et al. , 2006a ). Em
contraste, para pregas vocais com rigidez AP muito maior que a rigidez transversal, os primeiros modos
no vácuo exibem padrõ es de vibraçã o qualitativamente distintos, e o movimento mé dio-lateral e o movi‐
mento superior-inferior nã o estã o mais travados em uma fase semelhante em os primeiros modos pró ‐
prios no vácuo . Isto torna possível excitar fortemente o grande movimento mé dio-lateral sem excitaçã o
proporcional do movimento superior-inferior. Como resultado, os modelos anisotró picos exibem grande
movimento mé dio-lateral com uma diferença de fase vertical ao longo da superfície medial. A capacidade
aprimorada de manter a posiçã o adutora contra a pressã o subgló tica e de vibrar com grande movimento
mé dio-lateral pode contribuir para o padrã o melhorado de fechamento gló tico observado no experimento
de Xuan e Zhang (2014) .
Geometricamente, foi demonstrado que uma prega vocal fina é facilmente afastada pela pressã o subgló tica
( Zhang, 2016a ). Embora uma prega vocal anisotró pica fina vibre com um movimento predominante‐
mente mé dio-lateral, isso é insuficiente para superar sua incapacidade de manter a posiçã o contra a pres‐
sã o subgló tica. Como resultado, a glote nunca fecha completamente durante a vibraçã o, o que leva a uma
forma de onda de fluxo gló tico relativamente suave e a uma excitaçã o fraca de harmô nicos de ordem su‐
perior no espectro de voz de saída irradiada ( van den Berg, 1968 ; Zhang, 2016a ). O aumento da espes‐
sura vertical da superfície medial permite que a prega vocal resista melhor ao efeito de abertura da glote
da pressã o subgló tica, mantendo assim a posiçã o adutora e conseguindo o fechamento gló tico completo.

Uma vez que essas condiçõ es geomé tricas e de rigidez adicionais (ou seja, certo grau de anisotropia de ri‐
gidez e espessura vertical nã o muito pequena das pregas vocais) sejam atendidas, a duraçã o do fecha‐
mento gló tico pode ser regulada variando a diferença de fase vertical no movimento das pregas vocais ao
longo do medial. superfície. Uma diferença de fase vertical diferente de zero significa que, quando as mar‐
gens inferiores das superfícies mediais começarem a abrir, a glote continuaria fechada até que as margens
superiores começassem a abrir. Um parâ metro importante que afeta a diferença de fase vertical é a espes‐
sura vertical da superfície medial ou o grau de abaulamento medial na porçã o inferior da superfície me‐
dial. Dada a mesma condiçã o de rigidez e aproximaçã o das pregas vocais, a diferença de fase vertical du‐
rante a vibraçã o das pregas vocais aumenta com o aumento da espessura da superfície medial vertical
(Fig.8). Assim, quanto mais espessa for a superfície medial, maior será a diferença de fase vertical e mais
longa será a fase fechada (Fig.8;
​ van den Berg, 1968 ; Alipour e Scherer, 2000 ; Zhang, 2016a ). Da mesma
forma, a diferença de fase vertical e, portanto, a duraçã o do fechamento gló tico també m podem ser au‐
mentadas reduzindo a velocidade da onda da superfície elá stica na direçã o superior-inferior ( Ishizaka e
Flanagan, 1972 ; Story e Titze, 1995 ), que depende principalmente da rigidez no plano transversal e em
menor grau na rigidez AP, ou aumentando a relaçã o de rigidez corpo-cobertura ( Story e Titze, 1995 ;
Zhang, 2009 ).

Visualizar PDF
FIGO. 8.

(Cor online) O quociente fechado CQ e a diferença de fase vertical VPD em função da espessura da superfície medial, da rigi‐
Visualizar PDF
dez AP (G ap ) e do ângulo gló tico de repouso ( α ). Reimpresso com permissão da ASA de Zhang (2016a) .

Teoricamente, a duraçã o do fechamento gló tico pode ser controlada alterando a relaçã o entre a posiçã o
de equilíbrio das pregas vocais (ou a abertura gló tica mé dia) e a amplitude de vibraçã o das pregas vocais.
Tanto o enrijecimento das pregas vocais quanto o estreitamento da aproximaçã o das pregas vocais sã o ca‐
pazes de mover a posiçã o de equilíbrio das pregas vocais em direçã o à linha mé dia gló tica. No entanto, tais
manipulaçõ es muitas vezes reduzem simultaneamente a amplitude da vibraçã o. Como resultado, o efeito
global na duraçã o do fechamento gló tico nã o é claro. Zhang (2016a) mostrou que o enrijecimento das
pregas vocais ou o aumento da aproximaçã o das pregas vocais nã o tiveram muito efeito na duraçã o do fe‐
chamento gló tico, exceto no início, quando essas manipulaçõ es levaram a uma melhora significativa no
contato das pregas vocais.

E. Papel das instabilidades de fluxo

Embora uma descriçã o de fluxo baseada em Bernoulli seja frequentemente usada para modelos de fona‐
çã o, o fluxo gló tico realista é altamente tridimensional e muito mais complexo. A distribuiçã o da pressã o
intragló tica mostra-se afetada pela tridimensionalidade da geometria do canal gló tico ( Scherer et al. ,
2001 ; Scherer et al. , 2010 ; Mihaescu et al. , 2010 ; Li et al. , 2012 ). À medida que o fluxo de ar se separa
da parede glotal ao sair da glote, um jato se forma a jusante do ponto de separaçã o do fluxo, o que leva ao
desenvolvimento de instabilidades da camada de cisalhamento, enrolamento de vó rtices e, eventualmente,
liberaçã o de vó rtices do jato e transiçã o para turbulê ncia . As estruturas de vó rtice, por sua vez, induzi‐
riam distú rbios a montante, o que pode levar à oscilaçã o do ponto de separaçã o do fluxo, à fixaçã o do jato
em um lado da parede gló tica em vez de seguir em linha reta e, possivelmente, à oscilaçã o alternada do
jato ( Pelorson et al. , 1994 ; Shinwari et al. , 2003 ; Triep et al . , 2007 ;​​​Experimentos e simulaçõ es recen‐
tes també m mostraram que, para uma glote altamente divergente, o fluxo de ar pode se separar dentro da
glote, o que leva à formaçã o e convecçã o de vó rtices intragló ticos ( Mihaescu et al. , 2010 ; Khosla et al. ,
2014 ; Oren et al. , 2014 ).

Algumas dessas características de fluxo foram incorporadas em modelos de fonaçã o (por exemplo, Liljen‐
crants, 1991 ; Pelorson et al. , 1994 ; Kaburagi e Tanabe, 2009 ; Erath et al. , 2011 ; Howe e McGowan,
2013 ). A resoluçã o de outras características, particularmente a instabilidade do jato, os vó rtices e a turbu‐
lê ncia a jusante da glote, exige custos computacionais significativamente maiores, de modo que a simula‐
çã o de alguns ciclos de vibraçã o das pregas vocais geralmente leva dias ou meses. Por outro lado, a rele‐
vâ ncia acú stica e perceptual destas estruturas de fluxo intragló tica e supragló tica nã o foi estabelecida. Do
ponto de vista da produçã o sonora, essas estruturas de fluxo complexas no campo de fluxo gló tico a ju‐
sante sã o fontes sonoras do tipo quadrupolo (tipo dipolo quando há obstá culos presentes no caminho do
fluxo de ar, por exemplo, falsas pregas vocais fortemente aduzidas). Devido à s pequenas escalas de com‐
primento associadas à s estruturas de fluxo, estas fontes sonoras sã o de natureza de banda larga e princi‐
palmente em altas frequê ncias (geralmente acima de 2 kHz), com uma amplitude muito menor que a com‐
ponente harmô nica da fonte de voz. Portanto, se o componente de alta frequê ncia da voz for de interesse,
essas características de fluxo deverã o ser modeladas com precisã o, embora o grau de precisã o necessá rio
para atingir a suficiê ncia perceptual ainda nã o tenha sido determinado.

Foi postulado que as estruturas vó rtices podem afetar diretamente a interaçã o fluido-estrutura gló tica de
campo pró ximo e, portanto, a vibraçã o das pregas vocais e o componente harmô nico da fonte de voz. Uma
vez separado das paredes das pregas vocais, o jato gló tico começa a desenvolver instabilidades de jato e,
portanto, é suscetível a distú rbios a jusante, especialmente quando a glote assume uma forma divergente.
Desta forma, as estruturas de fluxo supragló ticas instáveis ​podem interagir com a camada limite na saída
gló tica e afetar o ponto de separaçã o do fluxo dentro do canal gló tico ( Hirschberg et al. , 1996 ). Da
mesma forma, foi levantada a hipó tese de que os vó rtices intragló ticos podem induzir uma pressã o nega‐
tiva local na superfície medial das pregas vocais, à medida que os vó rtices intragló ticos sã o convectados a
jusante e, portanto, podem facilitar o fechamento gló tico rá pido durante a produçã o da voz ( Khosla et al. ,PDF
Visualizar
2014 ; Oren et al., 2014 ; Oren et al. al. , 2014 ).

Embora nã o haja dú vida de que essas características complexas de fluxo afetam a vibraçã o das pregas vo‐
cais, permanece a questã o sobre quã o grande é a influê ncia que essas estruturas de vó rtice tê m na vibra‐
çã o das pregas vocais e na acú stica produzida. Para as condiçõ es de fluxo típicas da produçã o de voz, mui‐
tas das características ou instabilidades do fluxo tê m escalas de tempo muito diferentes daquelas da vibra‐
çã o das pregas vocais. Por exemplo, a liberaçã o de vó rtices em condiçõ es típicas de voz ocorre geralmente
em frequê ncias acima de 1000 Hz ( Zhang et al. , 2004 ; Kucinschi et al. , 2006 ). Considerando que a fona‐
çã o é essencialmente um fenô meno de ressonâ ncia das pregas vocais (Seçã o III B ) e a incompatibilidade
entre a ressonâ ncia das pregas vocais e as escalas de frequê ncia típicas das estruturas vó rtices, é questio‐
nável que, em comparaçã o com a iné rcia das pregas vocais e o recolhimento elá stico, as perturbaçõ es de
pressã o na superfície das pregas vocais devido a estruturas vorticais intragló ticas ou supragló ticas sã o
fortes o suficiente ou duram um período longo o suficiente para ter um efeito significativo na produçã o da
voz. Dado um mó dulo de cisalhamento longitudinal da prega vocal de cerca de 10 kPa e uma tensã o de ci‐
salhamento de 0,2, a tensã o de recuo elá stico da prega vocal é de aproximadamente 2.000 Pa. Espera-se
que as perturbaçõ es de pressã o induzidas por vó rtices intragló ticos ou supragló ticos sejam muito meno‐
res do que o pressã o subgló tica. Assumindo um limite superior de cerca de 20% da pressã o subgló tica
para as perturbaçõ es de pressã o (conforme induzidas por vó rtices intragló ticos, Oren et al. , 2014 ; na re‐
alidade, espera-se que esse nú mero seja muito menor em condiçõ es normais de volume e ainda menor
para vó rtices supragló ticos ) e uma pressã o subgló tica de 800 Pa (típica da produçã o normal da fala), a
perturbaçã o da pressã o na superfície das pregas vocais é de cerca de 160 Pa, que é muito menor que a
tensã o de recuo elá stico. Especificamente para os vó rtices intragló ticos, embora uma geometria gló tica al‐
tamente divergente seja necessá ria para criar vó rtices intragló ticos, a presença de vó rtices intragló ticos in‐
duz uma força de sucçã o negativa aplicada principalmente na porçã o superior da superfície medial e, se os
vó rtices forem fortes o suficiente, reduziriam a divergê ncia do canal gló tico. Em outras palavras, embora
os vó rtices intragló ticos sejam incapazes de criar as condiçõ es de divergê ncia necessá rias para sua cria‐
çã o, sua existê ncia tende a eliminar tais condiçõ es.

Houve alguns estudos recentes para quantificar o grau de influê ncia das estruturas vó rtices na fonaçã o.
Em um experimento de laringe excisada sem trato vocal, observou-se que o som produzido nã o muda
muito ao colocar o dedo muito pró ximo da saída gló tica, o que presumivelmente teria perturbado signifi‐
cativamente o campo de fluxo supragló tico. Um experimento mais rigoroso foi projetado em Zhang e Neu‐
bauer (2010), no qual eles colocaram um cilindro alinhado â ntero-posteriormente no campo de fluxo su‐
pragló tico e o percorreram na direçã o do fluxo em diferentes locais da esquerda para a direita e observa‐
ram as consequê ncias acú sticas. A hipó tese era que, se essas estruturas de fluxo supragló tica tivessem um
efeito significativo na vibraçã o e na acú stica das pregas vocais, a perturbaçã o dessas estruturas de fluxo
levaria a mudanças perceptíveis no som produzido. No entanto, a experiê ncia nã o encontrou alteraçõ es
significativas no som, exceto quando o cilindro foi posicionado dentro do canal gló tico.

O impacto potencial dos vó rtices intragló ticos na fonaçã o també m foi investigado numericamente ( Fa‐
rahani e Zhang, 2014 ; Kettlewell, 2015 ). Devido à dificuldade em remover vó rtices intragló ticos sem afe‐
tar outros aspectos do fluxo gló tico, o efeito dos vó rtices intragló ticos foi modelado como uma pressã o ne‐
gativa sobreposta à pressã o de fluxo prevista por um modelo bá sico de fluxo gló tico. Desta forma, o efeito
dos vó rtices intragló ticos pode ser ativado ou desativado seletivamente, independentemente do fluxo de
base, para que sua contribuiçã o para a fonaçã o possa ser investigada. Esses estudos mostraram que os
vó rtices intragló ticos tê m apenas pequenos efeitos na vibraçã o das pregas vocais e no fluxo gló tico. Ket‐
tlewell (2015) mostrou ainda que os vó rtices nã o sã o fortes o suficiente para induzir perturbaçõ es de
pressã o significativas nas superfícies das pregas vocais ou, se forem fortes o suficiente, os vó rtices se mo‐
vem rapidamente para a regiã o supragló tica e as perturbaçõ es de pressã o induzidas seriam muito breves
para terem qualquer impacto para superar a iné rcia do tecido das pregas vocais.

Embora modelos de fonaçã o que usam modelos de fluxo simplificados, negligenciando estruturas de vó rti‐
ces de fluxo, sejam amplamente utilizados e pareçam comparar-se qualitativamente bem com experimen‐
tos ( Pelorson et al. , 1994 ; Zhang et al. , 2002a ; Ruty et al. , 2007 ; Kaburagi e Tanabe, 2009 ) , investiga‐
Visualizar PDF
çõ es mais sistemá ticas sã o necessá rias para chegar a uma conclusã o definitiva sobre a importâ ncia rela‐
tiva dessas estruturas de fluxo para a fonaçã o e a percepçã o da voz. Isto pode ser conseguido atravé s da
realizaçã o de estudos paramé tricos numa ampla gama de condiçõ es sobre as quais se sabe que a força re‐
lativa destas estruturas de vó rtices varia significativamente e observando as suas consequê ncias na pro‐
duçã o de voz. Essa compreensã o melhorada facilitaria o desenvolvimento de modelos de fonaçã o de or‐
dem reduzida computacionalmente eficientes.

4. BIOMECÂ NICA DO CONTROLE DE VOZ

A. Frequência fundamental

Na discussã o do controle de F0, muitas vezes é feita uma analogia entre fonaçã o e vibraçã o em cordas na
literatura sobre voz (por exemplo, Colton et al. , 2011 ). A frequê ncia de vibraçã o de uma corda é determi‐
nada pelo seu comprimento, tensã o e massa. Por analogia, a F0 da produçã o da voz també m é determi‐
nada por sua extensã o, tensã o e massa, sendo a massa interpretada como a massa das pregas vocais que é
colocada em vibraçã o. Especificamente, F0 aumenta com o aumento da tensã o, diminuiçã o da massa e di‐
minuiçã o do comprimento das pregas vocais. Embora a analogia das cordas seja conceitualmente simples
e heuristicamente ú til, faltam algumas características importantes das pregas vocais. Alé m da definiçã o
vaga de massa efetiva, o modelo de cordas, que assume implicitamente uma dimensã o de seçã o transver‐
sal muito menor que o comprimento, negligencia completamente a contribuiçã o da rigidez das pregas vo‐
cais no controle de F0. Embora a rigidez e a tensã o muitas vezes nã o sejam diferenciadas na literatura so‐
bre voz, elas tê m significados físicos diferentes e representam dois mecanismos diferentes que resistem à
deformaçã o (Fig.2).
​ A rigidez é uma propriedade da prega vocal e representa a força de restauraçã o elá s‐
tica em resposta à deformaçã o, enquanto a tensã o ou estresse descreve o estado mecâ nico das pregas vo‐
cais. A analogia das cordas també m negligencia o efeito do contato das pregas vocais, o que introduz um
efeito adicional de enrijecimento.

Como a fonaçã o é essencialmente um fenô meno de ressonâ ncia das pregas vocais, a F0 é determinada
principalmente pela frequê ncia dos modos pró prios das pregas vocais que estã o excitados. Em geral, as
frequê ncias pró prias das pregas vocais dependem tanto da geometria das pregas vocais, incluindo com‐
primento, profundidade e espessura, quanto da rigidez e das condiçõ es de estresse das pregas vocais. Pre‐
gas vocais mais curtas tendem a ter frequê ncias pró prias altas. Assim, devido ao pequeno tamanho das
pregas vocais, as crianças tendem a ter a F0 mais elevada, seguidas pelo sexo feminino e depois pelo mas‐
culino. As frequê ncias pró prias das pregas vocais també m aumentam com o aumento da rigidez ou do es‐
tresse (tensã o), os quais fornecem uma força restauradora para resistir à deformaçã o das pregas vocais.
Assim, enrijecer ou tensionar as pregas vocais aumentaria a F0 da voz. Em geral, o efeito da rigidez nas
frequê ncias pró prias das pregas vocais é mais dominante do que a tensã o quando a prega vocal é ligeira‐
mente alongada ou encurtada, em que a tensã o é pequena ou mesmo negativa e o modelo de cordas su‐
bestimaria F0 ou nã o forneceria uma previsã o. À medida que a prega vocal se alonga ainda mais e a ten‐
sã o aumenta, a rigidez e a tensã o tornam-se igualmente importantes no impacto das frequê ncias pró prias
das pregas vocais ( Titze e Hunter, 2004 ; Yin e Zhang, 2013 ).

Quando o contato das pregas vocais ocorre durante a vibraçã o, a força de colisã o das pregas vocais apa‐
rece como uma força restauradora adicional ( Ishizaka e Flanagan, 1972 ). Dependendo da extensã o, pro‐
fundidade de influê ncia e duraçã o da colisã o das pregas vocais, esta força adicional pode aumentar signifi‐
cativamente a rigidez efetiva das pregas vocais e, portanto, F0. Como o padrã o de contato das pregas vo‐
cais depende do grau de aproximaçã o das pregas vocais, da pressã o subgló tica e da rigidez e geometria
das pregas vocais, alteraçõ es em qualquer um desses parâ metros podem afetar a F0, afetando o contato
das pregas vocais ( van den Berg e Tran, 1959). ; Zhang, 2016a ).

Em humanos, a F0 pode ser aumentada aumentando as frequê ncias pró prias das pregas vocais ou a ex‐
tensã o e duraçã o do contato das pregas vocais. O controle das frequê ncias pró prias das pregas vocais é
amplamente alcançado variando a rigidez e a tensã o ao longo da direçã o AP. Devido à s propriedades ma‐ PDF
Visualizar
teriais nã o lineares das pregas vocais, tanto a rigidez quanto a tensã o do AP podem ser controladas pelo
alongamento ou encurtamento das pregas vocais, por meio da ativaçã o do mú sculo CT. Embora o alonga‐
mento també m aumente o comprimento das pregas vocais, o que diminui a F0, o efeito do aumento da ri‐
gidez e da tensã o na F0 parece dominar o do aumento do comprimento.

O efeito da ativaçã o do mú sculo TA no controle da F0 é um pouco mais complexo. Alé m de encurtar o com‐
primento da prega vocal, a ativaçã o do TA tensiona e enrijece a camada corporal, diminui a tensã o na ca‐
mada de cobertura, mas pode diminuir ou aumentar a rigidez da cobertura ( Yin e Zhang, 2013 ). Titze et
al. (1988) mostraram que dependendo da profundidade da camada corporal envolvida na vibraçã o, o au‐
mento da ativaçã o do TA pode aumentar ou diminuir as frequê ncias pró prias das pregas vocais. Por outro
lado, Yin e Zhang (2013) mostraram que para uma prega vocal alongada, como é frequentemente o caso
na fonaçã o, o efeito geral da ativaçã o do TA é reduzir as frequê ncias pró prias das pregas vocais. Somente
para condiçõ es de pregas vocais ligeiramente alongadas ou encurtadas, a ativaçã o do TA pode aumentar
as frequê ncias pró prias das pregas vocais. Alé m do efeito nas frequê ncias pró prias das pregas vocais, a
ativaçã o do TA aumenta a espessura vertical das pregas vocais e produz compressã o medial entre as duas
pregas, o que aumenta a extensã o e a duraçã o do contato do trato vocal e levaria a um aumento de F0 (
Hirano et. al. , 1969 ). Devido a esses efeitos opostos nas frequê ncias pró prias das pregas vocais e no con‐
tato das pregas vocais, o efeito geral da ativaçã o do TA na F0 variaria dependendo das condiçõ es específi‐
cas das pregas vocais.
O aumento da pressã o subgló tica ou a ativaçã o dos mú sculos LCA/IA por si só nã o tê m muito efeito nas
frequê ncias pró prias das pregas vocais ( Hirano e Kakita, 1985 ; Chhetri et al. , 2009 ; Yin e Zhang, 2014 ).
No entanto, muitas vezes aumentam a extensã o e a duraçã o do contato das pregas vocais durante a vibra‐
çã o, particularmente com o aumento da pressã o subgló tica, e assim levam ao aumento da F0 ( Hirano et al.
, 1969 ; Ishizaka e Flanagan, 1972 ; Zhang, 2016a ). Devido à nã o linearidade nas propriedades do mate‐
rial das pregas vocais, o aumento da amplitude de vibraçã o em altas pressõ es subgló ticas pode levar ao
aumento da rigidez e tensã o efetivas, o que també m pode aumentar F0 ( van den Berg e Tan, 1959 ; Ishi‐
zaka e Flanagan, 1972 ; Titze, 1989 ). Ishizaka e Flanagan (1972) mostraram em seu modelo de duas mas‐
sas que o contato das pregas vocais e a nã o linearidade do material combinados podem levar a um au‐
mento de cerca de 40 Hz em F0 quando a pressã o subgló tica aumenta de cerca de 200 para 800 Pa. Zhang
(2016a) , que inclui o efeito do contato das pregas vocais, mas nã o a nã o linearidade do material das pre‐
gas vocais, o aumento da pressã o subgló tica por si só pode aumentar a F0 em até 20 Hz/kPa.

B. Intensidade vocal

Como a voz é produzida na glote, filtrada pelo trato vocal e irradiada pela boca, um aumento na intensi‐
dade vocal pode ser alcançado aumentando a intensidade da fonte ou aumentando a eficiê ncia da radia‐
çã o. A intensidade da fonte é controlada principalmente pela pressã o subgló tica, que aumenta a amplitude
de vibraçã o e o pico negativo ou MFDR da derivada temporal do fluxo gló tico. A pressã o subgló tica de‐
pende principalmente da pressã o alveolar nos pulmõ es, que é controlada pelos mú sculos respirató rios e
pelo volume pulmonar. Em geral, as condiçõ es do sistema laríngeo tê m pouco efeito no estabelecimento da
pressã o alveolar e da pressã o subgló tica ( Hixon, 1987 ; Finnegan et al. , 2000 ). No entanto, uma glote
aberta geralmente resulta em uma pequena resistê ncia gló tica e, portanto, em uma queda considerável de
pressã o nas vias aé reas inferiores e em uma pressã o subgló tica reduzida. Uma glote aberta també m leva a
uma grande taxa de fluxo gló tico e a um rá pido declínio no volume pulmonar, reduzindo assim a duraçã o
da fala entre as respiraçõ es e aumentando o esforço respirató rio necessá rio para manter uma pressã o
subgló tica alvo ( Zhang, 2016b ).

Na ausê ncia de um trato vocal, os ajustes laríngeos, que controlam a rigidez, a geometria e a posiçã o das
pregas vocais, nã o tê m muito efeito na intensidade da fonte, como mostrado em muitos estudos que utili‐
zam modelos laríngeos, físicos ou computacionais de fonaçã o ( Tanaka e Tanabe , 1986 ;​​No experimento
de Tanaka e Tanabe (1986) , para uma pressã o subgló tica constante, a estimulaçã o dos mú sculos CT e LCA
quase nã o teve efeito na intensidade vocal, enquanto a estimulaçã o do mú sculo TA diminuiu ligeiramente a
intensidade vocal. Em um experimento de laringe extirpada, Titze (1988b) nã o encontrou dependê Visualizar
ncia da PDF
intensidade vocal na largura gló tica. Efeitos secundá rios semelhantes de ajustes laríngeos també m foram
observados em um estudo computacional recente ( Zhang, 2016a ). Zhang (2016a) també m mostrou que
o efeito dos ajustes laríngeos pode ser importante em pressõ es subgló ticas ligeiramente acima do início,
caso em que um aumento na rigidez AP ou na aproximaçã o das pregas vocais pode levar a um melhor
contato das pregas vocais e ao fechamento gló tico, o que aumentou significativamente o MFDR e, portanto,
intensidade vocal. Poré m, esses efeitos tornaram-se menos eficientes com o aumento da intensidade vocal.

O efeito dos ajustes laríngeos na intensidade vocal torna-se um pouco mais complicado na presença do
trato vocal. A alteraçã o da forma do trato vocal por si só nã o amplifica a intensidade do som produzido
porque a propagaçã o do som no trato vocal é um processo passivo. No entanto, alteraçõ es na forma do
trato vocal podem proporcionar uma melhor correspondê ncia de impedâ ncia entre a glote e o espaço li‐
vre fora da boca e, assim, melhorar a eficiê ncia da radiaçã o sonora da boca ( Titze e Sundberg, 1992 ).
Este é particularmente o caso de harmô nicos pró ximos a um formante, que muitas vezes sã o amplificados
mais do que o primeiro harmô nico e podem se tornar o harmô nico mais energé tico no espectro da voz de
saída. Assim, a intensidade vocal pode ser aumentada atravé s de ajustes laríngeos que aumentem a excita‐
çã o de harmô nicos pró ximos ao primeiro formante do trato vocal ( Fant, 1982 ; Sundberg, 1987 ) ou ajus‐
tando a forma do trato vocal para combinar um dos formantes com um dos dominantes. harmô nicos no
espectro da fonte.
Em humanos, todas as trê s estraté gias (respirató ria, laríngea e articulató ria) sã o utilizadas para aumentar
a intensidade vocal. Quando solicitado a produzir uma varredura de intensidade da voz suave para a alta,
geralmente começa-se com uma voz levemente soprosa com uma glote relativamente aberta, que requer o
menor esforço laríngeo, mas é ineficiente na produçã o da voz. A partir desta posiçã o inicial, a intensidade
vocal pode ser aumentada atravé s do aumento da pressã o subgló tica, que aumenta a amplitude da vibra‐
çã o, ou da aduçã o das pregas vocais (aproximaçã o e/ou espessamento). Para uma voz suave com contato
mínimo das pregas vocais e excitaçã o harmô nica de ordem superior mínima, aumentar a aduçã o das pre‐
gas vocais é particularmente eficiente porque pode melhorar significativamente o contato das pregas vo‐
cais, tanto na extensã o espacial quanto na duraçã o, aumentando significativamente a excitaçã o de harmô ‐
nicos pró ximos ao primeiro formante. Em humanos, para condiçõ es de intensidade vocal baixa a mé dia, o
aumento da intensidade vocal é frequentemente acompanhado por aumentos simultâ neos na pressã o sub‐
gló tica e na resistê ncia gló tica ( Isshiki, 1964 ; Holmberg et al. , 1988 ; Stathopoulos e Sapienza, 1993 ).
Como o nível de altura nã o mudou muito nesses experimentos, o aumento na resistê ncia gló tica foi prova‐
velmente devido à maior aproximaçã o das pregas vocais atravé s da ativaçã o de LCA/IA. Observa-se fre‐
quentemente que a duraçã o da fase fechada aumenta com o aumento da intensidade vocal ( Henrich et al. ,
2005 ), indicando aumento do espessamento das pregas vocais ou compressã o medial, que sã o controla‐
dos principalmente pelo mú sculo TA. Assim, parece que tanto os mú sculos LCA/IA/TA quanto o aumento
da pressã o subgló tica desempenham um papel no aumento da intensidade vocal em condiçõ es de baixa a
mé dia intensidade. Para condiçõ es de alta intensidade vocal, quando o aumento adicional na aduçã o das
pregas vocais se torna menos eficaz ( Hirano et al. , 1969 ), o aumento da intensidade vocal parece depen‐
der predominantemente do aumento da pressã o subgló tica.

Do lado do trato vocal, Titze (2002) mostrou que a intensidade vocal pode ser aumentada combinando
uma epilaringe larga com menor resistê ncia gló tica ou uma epilaringe estreita com maior resistê ncia gló ‐
tica. Afinar o primeiro formante (por exemplo, abrindo mais a boca) para corresponder ao F0 é frequen‐
temente usado no canto soprano para maximizar a produçã o vocal ( Joliveau et al. , 2004 ). Como a efici‐
ê ncia da radiaçã o pode ser melhorada atravé s de ajustes nas pregas vocais ou no trato vocal, isto torna
possível melhorar a eficiê ncia da radiaçã o e ainda assim manter o tom ou a articulaçã o desejados, o que se
deseja alcançar.

C. Qualidade de voz

A qualidade da voz geralmente se refere a outros aspectos da voz alé m do tom e do volume. Devido à na‐
Visualizar
tureza subjetiva da percepçã o da qualidade vocal, muitas descriçõ es diferentes sã o utilizadas e os autores PDF
muitas vezes discordam dos significados dessas descriçõ es ( Gerratt e Kreiman, 2001 ; Kreiman e Sidtis,
2011 ). Essa falta de uma definiçã o clara e consistente da qualidade vocal dificulta os estudos da qualidade
vocal e a identificaçã o de seus correlatos e controles fisioló gicos. Acusticamente, a qualidade da voz está
associada à amplitude espectral e à forma dos componentes harmô nicos e de ruído da fonte de voz e à s
suas variaçõ es temporais. A seguir, nos concentramos em fatores fisioló gicos que sã o conhecidos por te‐
rem impacto nos espectros de voz e, portanto, sã o potencialmente importantes do ponto de vista
perceptual.

Uma das primeiras investigaçõ es sistemá ticas dos controles fisioló gicos da qualidade vocal foi conduzida
por Isshiki (1989 , 1998) utilizando laringes excisadas, nas quais regiõ es de qualidades vocais normais, so‐
prosas e á speras foram mapeadas no espaço de parâ metros tridimensionais do pressã o subgló tica, rigidez
das pregas vocais e á rea de abertura gló tica pré -fonató ria (fig.9).
​ Ele mostrou que, para uma determinada
rigidez das pregas vocais e á rea de abertura gló tica pré -fonató ria, o aumento da pressã o subgló tica levava
à produçã o de voz com qualidade á spera. Este efeito da pressã o subgló tica pode ser contrabalançado pelo
aumento da rigidez das pregas vocais, o que aumentou a regiã o da voz normal no espaço de parâ metros
da Fig.9. Infelizmente, os detalhes deste estudo, incluindo a definiçã o e manipulaçã o da rigidez das pregas
vocais e a avaliaçã o perceptiva de diferentes qualidades vocais, nã o estã o totalmente disponíveis. A impor‐
tâ ncia da coordenaçã o entre a pressã o subgló tica e as condiçõ es laríngeas també m foi demonstrada em
van den Berg e Tan (1959) , que mostraram que embora fossem observados diferentes registros vocais,
cada registro ocorria em uma determinada faixa de condiçõ es laríngeas e pressõ es subgló ticas. Por exem‐
plo, para condiçõ es de baixa tensã o longitudinal, uma fonaçã o semelhante à do tó rax só era possível para
pequenas taxas de fluxo aé reo. Com valores elevados de pressã o subgló tica, “era impossível obter uma
boa produçã o sonora. As pregas vocais estavam muito separadas…. A forma da glote tornou-se irregular‐
mente curva e esta curvatura foi propagada ao longo da glote.” Uma boa produçã o de voz em grandes ta‐
xas de fluxo só foi possível com a compressã o da cartilagem tireó idea, que imita o efeito da ativaçã o do
mú sculo TA. Vibraçã o irregular das pregas vocais em altas pressõ es subgló ticas també m foi observada em
experimentos com modelos físicos (por exemplo, Xuan e Zhang, 2014 ). Vibraçã o irregular ou caó tica das
pregas vocais em condiçõ es de incompatibilidade pressã o-rigidez també m foi relatada na simulaçã o numé ‐
rica de Berry et al. (1994) , que mostrou que enquanto a vibraçã o regular das pregas vocais foi observada
para condiçõ es típicas de rigidez das pregas vocais, a vibraçã o irregular das pregas vocais (por exemplo,
vibraçã o subharmô nica ou caó tica) foi observada quando a rigidez da camada de cobertura foi significati‐
vamente reduzida, mantendo a mesma pressã o subgló tica.

FIGO. 9.

Mapa tridimensional da fonação normal (N), soprosa (B) e áspera (R) no espaço de parâmetros da área gló tica pré-fonató ria
(Ag0), pressão subgló tica (Ps), rigidez das pregas vocais (k). Reimpresso com permissão de Springer de Isshiki (1989) .

Visualizar PDF
Os experimentos de van den Berg e Tan (1959) e Isshiki (1989) també m mostraram que pregas vocais fra‐
camente aduzidas (ativaçã o fraca de LCA/IA/TA) geralmente levam à vibraçã o das pregas vocais com fe‐
chamento gló tico incompleto durante a fonaçã o. Quando o fluxo de ar é suficientemente alto, o gap gló tico
persistente levaria ao aumento da produçã o de ruído turbulento e, portanto, à fonaçã o com qualidade so‐
prosa (Fig.9).
​ O fechamento gló tico incompleto pode ocorrer na porçã o membranosa ou cartilaginosa da
glote. Quando o fechamento gló tico incompleto é limitado à glote cartilaginosa, a voz resultante é soprosa,
mas ainda pode ter harmô nicos fortes em altas frequê ncias. Quando o fechamento gló tico incompleto
ocorre na glote membranosa, o contato reduzido ou lento das pregas vocais també m reduziria a excitaçã o
de harmô nicos de ordem superior, resultando em uma qualidade soprosa e fraca da voz produzida.
Quando as pregas vocais estã o suficientemente separadas, o acoplamento entre as duas pregas vocais
pode ser enfraquecido o suficiente para que cada prega vocal possa vibrar em um F0 diferente. Isso leva‐
ria à bifonaçã o ou voz contendo duas frequê ncias fundamentais distintas, resultando em uma percepçã o
semelhante à do fenô meno da frequê ncia de batimento.

Comparada a uma voz soprosa, uma voz pressionada é presumivelmente produzida com estreita aproxi‐
maçã o das pregas vocais ou mesmo algum grau de compressã o medial na porçã o membranosa entre as
duas pregas. Uma voz pressionada é frequentemente caracterizada por um segundo harmô nico que é
mais forte que o primeiro harmô nico, ou um H1-H2 negativo, com um longo período de fechamento gló ‐
tico durante a vibraçã o. Embora seja necessá rio um certo grau de aproximaçã o das pregas vocais e aniso‐
tropia de rigidez para alcançar o contato das pregas vocais durante a fonaçã o, a duraçã o do fechamento
gló tico demonstrou ser determinada principalmente pela espessura vertical da superfície medial da prega
vocal ( van den Berg, 1968 ; Zhang, 2016a ). Assim, embora seja geralmente assumido que uma voz pressi‐
onada pode ser produzida com aduçã o apertada da aritenó ide atravé s da ativaçã o do mú sculo LCA/IA, a
ativaçã o dos mú sculos LCA/IA por si só é incapaz de alcançar a compressã o medial pré -fonató ria na glote
membranosa ou alterar a espessura vertical da a superfície mediana. A ativaçã o do mú sculo TA parece ser
essencial na produçã o de uma mudança na voz, de uma qualidade de voz soprosa para uma qualidade de
voz pressionada. Um mú sculo TA enfraquecido, como no envelhecimento ou na atrofia muscular, levaria a
dificuldades na produçã o de uma voz pressionada ou mesmo no fechamento gló tico suficiente durante a
fonaçã o. Por outro lado, uma forte ativaçã o do mú sculo TA, como por exemplo, na disfonia espasmó dica,
pode levar a um fechamento muito apertado da glote e a uma qualidade de voz á spera ( Isshiki, 1989 ).

Em humanos, a rigidez das pregas vocais, a aproximaçã o das pregas vocais e a geometria sã o reguladas
pelo mesmo conjunto de mú sculos laríngeos e, portanto, muitas vezes co-variam, o que tem sido conside‐
rado há muito tempo como uma possível origem dos registros vocais e suas transiçõ es ( van den Berg,
1968 ). Especificamente, levantou-se a hipó tese de que as alteraçõ es na F0 sã o frequentemente acompa‐
nhadas por alteraçõ es na espessura vertical da superfície medial das pregas vocais, o que leva a alteraçõ es
nas características espectrais da voz produzida. A espessura da superfície medial é controlada principal‐
mente pelos mú sculos CT e TA, que també m regulam a rigidez e a aproximaçã o das pregas vocais. A ativa‐
çã o do mú sculo CT reduz a espessura da superfície medial, mas també m aumenta a rigidez e a tensã o das
pregas vocais e, em algumas condiçõ es, aumenta a abertura gló tica em repouso ( van den Berg e Tan, 1959
; van den Berg, 1968 ; Hirano e Kakita, 1985 ) . Como os mú sculos LCA/IA/TA sã o inervados pelo mesmo
nervo e frequentemente ativados em conjunto, um aumento na espessura da superfície medial atravé s da
ativaçã o do mú sculo TA é frequentemente acompanhado por maior aproximaçã o das pregas vocais ( Hi‐
rano e Kakita, 1985 ) e contato. Assim, se tentarmos aumentar F0 principalmente pela ativaçã o dos mú scu‐
los LCA/IA/TA, as pregas vocais provavelmente terã o uma grande espessura da superfície medial e prova‐
velmente baixa rigidez AP, o que levará a uma produçã o de voz semelhante à do peito, com grande dife‐
rença de fase vertical ao longo da superfície medial, longo fechamento da glote, pequena vazã o e forte ex‐
citaçã o harmô nica. No caso extremo de forte ativaçã o do TA e ativaçã o mínima do CT e pressã o subgló tica
muito baixa, a glote pode permanecer fechada durante a maior parte do ciclo, levando a uma produçã o de
voz semelhante a um grito vocal. Em contraste, se tentarmos aumentar F0 aumentando apenas a ativaçã o
do CT, as pregas vocais, com uma pequena espessura da superfície medial, provavelmente produzirã o uma
produçã o de voz semelhante a falsete, com fechamento gló tico incompleto e uma forma de onda de fluxo
quase senoidal, muito alta. F0 e um nú mero limitado de harmô nicos.
Visualizar PDF
V. MODELOS MECÂ NICOS E INFORMÁTICOS PARA APLICAÇÕ ES DE VOZ

Os aplicativos de voz geralmente se enquadram em duas categorias principais. Na clínica, a simulaçã o da


produçã o da voz tem o potencial de prever os resultados do manejo clínico dos distú rbios da voz, in‐
cluindo cirurgia e terapia vocal. Para tais aplicaçõ es, é desejada uma representaçã o precisa da geometria
das pregas vocais e das propriedades do material, na medida em que corresponda ao tratamento clínico
real, e por esta razã o os modelos contínuos das pregas vocais sã o preferidos aos modelos de elementos
concentrados. O custo computacional nã o é necessariamente uma preocupaçã o em tais aplicaçõ es, mas
ainda precisa ser prá tico. Em contraste, para algumas outras aplicaçõ es, particularmente em aplicaçõ es de
tecnologia de fala, o objetivo principal é reproduzir a acú stica da fala ou pelo menos características per‐
ceptualmente relevantes da acú stica da fala. A capacidade em tempo real é desejada nessas aplicaçõ es, en‐
quanto a representaçã o realista da física subjacente envolvida muitas vezes nã o é necessá ria. Na verdade,
a maioria dos atuais sistemas de síntese de voz consideram a fala puramente como um sinal acú stico e nã o
modelam de forma alguma a física da produçã o da fala. No entanto, os modelos que levam em considera‐
çã o a física subjacente, pelo menos até certo ponto, podem ser os mais promissores na síntese de fala com
som natural e qualidade específica do alto-falante.

A. Modelos mecânicos de pregas vocais


Os primeiros esforços na produçã o artificial da fala, que remontam ao sé culo XVIII, concentraram-se na
reproduçã o mecâ nica do sistema de produçã o da fala. Uma revisã o detalhada pode ser encontrada em
Flanagan (1972) . O foco desses esforços iniciais estava geralmente na articulaçã o do trato vocal, e nã o na
fonte da voz, o que é compreensível, considerando que o significado é transmitido principalmente por
meio de mudanças na articulaçã o e na falta de compreensã o do processo de produçã o da voz. O elemento
vibrató rio nesses modelos mecâ nicos, seja uma palheta vibrante ou uma folha de borracha com fenda esti‐
cada sobre uma abertura, é apenas uma aproximaçã o aproximada das pregas vocais humanas.

Modelos mecâ nicos mais sofisticados foram desenvolvidos mais recentemente para reproduzir melhor a
estrutura tridimensional em camadas das pregas vocais. Um modelo de prega vocal de borracha de duas
camadas com membrana (capa)-almofada (corpo) foi desenvolvido pela primeira vez por Smith (1956) .
Modelos mecâ nicos semelhantes foram posteriormente desenvolvidos e usados ​em pesquisas de produ‐
çã o de voz (por exemplo, Isogai et al. , 1988 ; Kakita, 1988 ; Titze et al. , 1995 ; Thomson et al. , 2005 ; Ruty
et al. , 2007 ; Drechsel e Thomson , 2008 ), utilizando materiais de silicone ou borracha ou membranas
preenchidas com líquido. Estudos recentes ( Murray e Thomson, 2012 ; Xuan e Zhang, 2014 ) també m co‐
meçaram a incorporar fibras nesses modelos para simular as propriedades anisotró picas do material de‐
vido à presença de fibras de colá geno e elastina nas pregas vocais. Um modelo de prega vocal em camadas
semelhante foi incorporado a um sistema mecâ nico de robô falante ( Fukui et al. , 2005 ; Fukui et al. , 2007
; Fukui et al. , 2008 ). A versã o mais recente do robô falante, Waseda Talker, inclui mecanismos para o con‐
trole do tom e da abertura gló tica em repouso, e é capaz de produzir voz de qualidade modal, rangente ou
soprosa. No entanto, embora um sistema mecâ nico de produçã o de voz possa encontrar aplicaçã o em pró ‐
teses vocais ou sistemas robó ticos humanó ides no futuro, os modelos mecâ nicos atuais ainda estã o muito
longe de reproduzir ou mesmo aproximar-se da capacidade e flexibilidade dos humanos na produçã o e
controle de voz.

B. Síntese de formantes e modelos paramétricos de fonte de voz

Em comparaçã o com a reproduçã o mecâ nica do processo físico envolvido na produçã o da fala, é mais fá cil
reproduzir a fala como um sinal acú stico. Este é particularmente o caso da síntese de voz. Uma abordagem
adoptada na maioria dos actuais sistemas de síntese de voz é concatenar segmentos de voz natural pré -
gravada em novas frases ou sentenças de fala. Embora relativamente fá cil de implementar, para conseguir
uma fala com som natural, esta abordagem requer uma grande base de dados de palavras faladas em dife‐
rentes contextos, o que torna difícil a sua aplicaçã o à síntese de fala personalizada de diversas percepçõ es
emocionais. Visualizar PDF

Outra abordagem é reproduzir apenas características acú sticas da fala perceptualmente relevantes, como
na síntese de formantes. As características acú sticas alvo a serem reproduzidas geralmente incluem F0,
amplitude do som e frequê ncias e larguras de banda dos formantes. Esta abordagem ganhou populari‐
dade com o desenvolvimento de sintetizadores elé tricos e posteriores simulaçõ es computacionais que
permitem um controle flexível e preciso dessas características acú sticas. Os primeiros sintetizadores base‐
ados em formantes usavam fontes sonoras simples, muitas vezes um trem de impulso filtrado como fonte
sonora para sons sonoros e ruído branco para sons nã o sonoros. A pesquisa sobre as fontes de voz (por
exemplo, Fant, 1979 ; Fant et al. , 1985 ; Rothenberg et al. , 1971 ; Titze e Talkin, 1979 ) levou ao desenvol‐
vimento de modelos paramé tricos de fontes de voz no domínio do tempo, que sã o capazes de produzir
formas de onda de fonte de voz de variaçã o de F0, amplitude, quociente aberto e grau de abruptidade do
corte do fluxo gló tico e, portanto, síntese de diferentes qualidades de voz.

Embora os modelos paramé tricos de fonte de voz forneçam flexibilidade nas variaçõ es da fonte, a fala sin‐
té tica gerada pela síntese de formantes ainda sofre de naturalidade limitada. Essa naturalidade limitada
pode resultar das regras primitivas usadas na especificaçã o de controles dinâ micos dos modelos de fonte
de voz ( Klatt, 1987 ). Alé m disso, os parâ metros de controle do modelo fonte nã o sã o independentes uns
dos outros e muitas vezes covariam durante a fonaçã o. Um desafio na síntese de formantes é , portanto, es‐
pecificar combinaçõ es de parâ metros de fontes de voz e seus padrõ es de variaçã o de tempo que podem
ocorrer na produçã o de voz realista de diferentes qualidades de voz por diferentes falantes. També m é
possível que alguns recursos perceptualmente importantes estejam faltando nos modelos de fonte de voz
no domínio do tempo ( Klatt, 1987 ). A percepçã o humana das características da voz é melhor descrita no
domínio da frequê ncia, pois o sistema auditivo realiza uma aproximaçã o à aná lise de Fourier da voz e do
som em geral. Embora os modelos no domínio do tempo tenham melhor correspondê ncia com os eventos
físicos que ocorrem durante a fonaçã o (por exemplo, abertura e fechamento da glote e a fase fechada), é
possível que alguns detalhes espectrais de importâ ncia perceptiva nã o sejam capturados nos modelos sim‐
ples de fonte de voz no domínio do tempo . Por exemplo, os detalhes espectrais nas frequê ncias baixas e
mé dias demonstraram ser de considerável importâ ncia para o julgamento de naturalidade, mas sã o difí‐
ceis de serem representados em um modelo de fonte no domínio do tempo ( Klatt, 1987 ). Um estudo re‐
cente ( Kreiman et al. , 2015 ) mostrou que os modelos de fonte de voz no domínio espectral sã o capazes
de criar correspondê ncias significativamente melhores com vozes naturais do que os modelos de fonte de
voz no domínio do tempo. Alé m disso, devido à independê ncia entre a fonte de voz e os sistemas sub e su‐
pragló ticos na síntese de formantes, as interaçõ es e co-variaçõ es entre as pregas vocais e os sistemas sub
e supragló ticos nã o sã o levadas em consideraçã o intencionalmente. Todos esses fatores podem contribuir
para a naturalidade limitada da fala sintetizada pelo formante.

C. Modelos computacionais baseados fisicamente

Uma abordagem alternativa à síntese natural da fala é modelar computacionalmente o processo de produ‐
çã o da voz com base em princípios físicos. Os parâ metros de controle seriam a geometria e as proprieda‐
des dos materiais do sistema vocal ou, de forma mais realista, a ativaçã o dos mú sculos respirató rios e la‐
ríngeos. Esta abordagem evita a necessidade de especificar características consistentes da fonte de voz ou
dos formantes, permitindo assim a síntese e modificaçã o da voz natural de uma forma intuitivamente se‐
melhante à produçã o e controle da voz humana.

O primeiro modelo computacional de produçã o de voz é o modelo de massa ú nica de Flanagan e Landgraf
(1968) , no qual a prega vocal é modelada como um sistema massa-mola-amortecedor de grau ú nico de li‐
berdade que se move horizontalmente. Este modelo é capaz de vibrar em uma faixa restrita de condiçõ es
quando a frequê ncia natural do sistema massa-mola está pró xima de uma das ressonâ ncias acú sticas dos
tratos subgló tico ou supragló tico. Ishizaka e Flanagan (1972) estenderam este modelo para um modelo de
duas massas no qual as partes superior e inferior da prega vocal sã o modeladas como duas massas sepa‐
radas conectadas por uma mola adicional ao longo da direçã o vertical. O modelo de duas massas é capaz
de vibrar com uma diferença de fase vertical entre as duas massas e, portanto, capaz de vibrar indepen‐
dentemente da acú stica dos tratos sub e supragló ticos. Desde entã o, muitas variantes do modeloVisualizar
de duas PDF
massas foram desenvolvidas. Titze (1973) desenvolveu um modelo de 16 massas para melhor representar
o movimento das pregas vocais na direçã o â ntero-posterior. Para melhor representar a estrutura em ca‐
madas de cobertura corporal das pregas vocais, Story e Titze (1995) estenderam o modelo de duas mas‐
sas para um modelo de trê s massas, adicionando uma massa lateral adicional representando a camada
muscular interna. Regras empíricas també m foram desenvolvidas para relacionar os parâ metros de con‐
trole do modelo de trê s massas aos níveis de ativaçã o dos mú sculos laríngeos ( Titze e Story, 2002 ) para
que a produçã o da voz possa ser simulada com a atividade muscular laríngea como entrada. Projetados
originalmente para fins de síntese de fala, esses modelos de produçã o de voz de elementos agrupados sã o
geralmente rá pidos em tempo computacional e ideais para síntese de fala em tempo real.

Uma desvantagem dos modelos de fonaçã o de elementos concentrados é que os parâ metros de controle
do modelo nã o podem ser medidos diretamente ou facilmente relacionados à estrutura anatô mica ou à s
propriedades do material das pregas vocais. Assim, estes modelos nã o sã o tã o ú teis em aplicaçõ es nas
quais é necessá ria uma representaçã o realista da fisiologia da voz, como, por exemplo, no manejo clínico
de distú rbios vocais. Para entender melhor a fonte da voz e seu controle sob diferentes condiçõ es de vo‐
zeamento, modelos computacionais mais sofisticados das pregas vocais baseados na mecâ nica do contí‐
nuo foram desenvolvidos para compreender o controle do mú sculo laríngeo da geometria, rigidez e ten‐
sã o das pregas vocais, e como as mudanças nessas características vocais as propriedades das dobras afe‐
tam a interaçã o fluido-estrutura gló tica e a voz produzida. Um dos primeiros modelos é o modelo de dife‐
renças finitas de Titze e Talkin (1979) , que combinou um modelo tridimensional de prega vocal de elastici‐
dade linear com o modelo de fluxo gló tico unidimensional de Ishizaka e Flanagan (1972) . Nas ú ltimas
duas dé cadas, modelos de fonaçã o mais refinados usando uma descriçã o bidimensional ou tridimensional
de Navier-Stokes do fluxo gló tico foram desenvolvidos (por exemplo, Alipour et al. , 2000 ; Zhao et al. ,
2002; Tao et al., 2000; Zhao et al., 2002 ; Tao et al. , 2007 ; Luo et al . , 2012 , 2014 ;​​​Modelos contínuos de
ativaçã o muscular laríngea també m foram desenvolvidos para modelar a postura das pregas vocais ( Hun‐
ter et al. , 2004 ; Gommel et al. , 2007 ; Yin e Zhang, 2013 , 2014). Ao modelar diretamente o processo de
produçã o de voz, modelos contínuos com geometria realista e propriedades de materiais sã o idealmente
mais promissores na reproduçã o da produçã o natural da voz humana. No entanto, como o processo de fo‐
naçã o é altamente nã o linear e envolve grande deslocamento e deformaçã o das pregas vocais e padrõ es
complexos de fluxo gló tico, modelar esse processo em trê s dimensõ es é computacionalmente muito desa‐
fiador e demorado. Como resultado, estes estudos computacionais sã o muitas vezes limitados a um ou
dois aspectos específicos, em vez de todo o processo de produçã o da voz, e a acú stica da voz produzida,
alé m da F0 e da intensidade vocal, muitas vezes nã o é investigada. Para aplicaçõ es prá ticas, em tempo real
ou nã o, sã o necessá rios modelos de ordem reduzida com eficiê ncia computacional significativamente me‐
lhorada. Alguns modelos contínuos de ordem reduzida, com simplificaçõ es tanto no fluxo gló tico quanto
na dinâ mica das pregas vocais, foram desenvolvidos e utilizados em estudos paramé tricos de larga escala
da produçã o de voz (por exemplo, Titze e Talkin, 1979 ; Zhang, 2016a ), que parecem produzir previsõ es
qualitativamente razoáveis. No entanto, essas simplificaçõ es ainda precisam ser rigorosamente validadas
experimentalmente.

VI. DESAFIOS FUTUROS

Atualmente temos uma compreensã o geral dos princípios físicos da produçã o de voz. Para estabelecer
uma teoria de causa-efeito da produçã o da voz, há muito a ser aprendido sobre a fisiologia e a biomecâ ‐
nica da voz. Isso inclui a geometria e as propriedades mecâ nicas das pregas vocais e sua variabilidade en‐
tre sujeito, sexo e idade, e como elas variam em diferentes condiçõ es de voz sob ativaçã o do mú sculo la‐
ríngeo. Ainda menos se sabe sobre as mudanças na geometria das pregas vocais e nas propriedades dos
materiais em condiçõ es patoló gicas. Demonstrou-se que as condiçõ es da superfície das pregas vocais e
suas propriedades mecâ nicas afetam a vibraçã o das pregas vocais ( Dollinger et al. , 2014 ; Bhattacharya e
Siegmund, 2015 ; Tse et al. , 2015 ) e, portanto, precisam ser melhor quantificadas. Embora modelos in
vivo de laringe animal ou humana ( Moore e Berke, 1988 ; Chhetri et al. , 2012 ; Berke et al. , 2013 ) possam
fornecer tais informaçõ es, mé todos de mediçã o mais confiáveis ​sã o necessá rios para quantificar melhor
as propriedades viscoelá sticas da prega vocal , tensã o das pregas vocais e geometria e movimento das ca‐
madas internas das pregas vocais. Embora as propriedades macromecâ nicas sejam de interesse,Visualizar
o desen‐ PDF
volvimento de leis constitutivas das pregas vocais baseadas na distribuiçã o da MEC e nos fluidos interstici‐
ais dentro das pregas vocais nos permitiria entender melhor como as propriedades mecâ nicas das pregas
vocais mudam com o uso vocal prolongado, lesõ es nas pregas vocais e cicatrizaçã o de feridas. , que de ou‐
tra forma é difícil de quantificar.

Embora a simplificaçã o excessiva das pregas vocais em termos de massa e tensã o seja de uso prá tico limi‐
tado, o outro extremo també m nã o é atraente. Com uma melhor caracterizaçã o e compreensã o das pro‐
priedades das pregas vocais, o estabelecimento de uma relaçã o de causa-efeito entre a fisiologia e a pro‐
duçã o da voz requer, portanto, a identificaçã o de quais dessas características fisioló gicas sã o realmente
perceptualmente relevantes e sob quais condiçõ es, por meio de investigaçõ es paramé tricas sistemá ticas.
Tais investigaçõ es també m facilitarã o o desenvolvimento de modelos computacionais de fonaçã o de ordem
reduzida, nos quais características fisioló gicas perceptualmente relevantes sejam suficientemente repre‐
sentadas e características de relevâ ncia perceptual mínima sejam simplificadas. Discutimos anteriormente
que muitos dos fenô menos complexos do fluxo supragló tico tê m relevâ ncia perceptual questionável. Per‐
guntas de relevâ ncia semelhante podem ser feitas em relaçã o à geometria e à s propriedades mecâ nicas
das pregas vocais. Por exemplo, embora as pregas vocais exibam propriedades viscoelá sticas complexas,
quais sã o as principais propriedades do material que sã o definitivamente necessá rias para prever razoa‐
velmente a vibraçã o das pregas vocais e a qualidade da voz? Cada uma das camadas das pregas vocais, em
particular as diferentes camadas da lâ mina pró pria, tem um papel funcional na determinaçã o da saída da
voz ou na prevençã o de lesõ es vocais? Os modelos atuais de pregas vocais geralmente usam uma geome‐
tria simplificada das pregas vocais. Poderiam algumas características geomé tricas de uma prega vocal rea‐
lista que nã o estã o incluídas nos modelos atuais ter um papel importante em afetar a eficiê ncia e a quali‐
dade da voz? Como a comunicaçã o por voz abrange uma ampla gama de condiçõ es de voz (por exemplo,
tom, intensidade e qualidade da voz), a relevâ ncia perceptual e a adequaçã o de características específicas
(ou seja, as mudanças em características específicas levam a mudanças perceptíveis na voz?) devem ser in‐
vestigadas em todos os aspectos. um grande nú mero de condiçõ es de voz em vez de algumas condiçõ es
selecionadas. Embora os modelos fisioló gicos de fonaçã o permitam uma melhor reproduçã o das condi‐
çõ es realistas das pregas vocais, os modelos computacionais sã o mais adequados para tais investigaçõ es
paramé tricas sistemá ticas. Infelizmente, devido ao alto custo computacional, os estudos atuais que utilizam
modelos contínuos sã o frequentemente limitados a algumas condiçõ es. Assim, o estabelecimento da rela‐
çã o causa-efeito e o desenvolvimento de modelos de ordem reduzida sã o provavelmente processos iterati‐
vos, nos quais os modelos sã o gradualmente refinados para incluir mais detalhes fisioló gicos a serem con‐
siderados na relaçã o causa-efeito.

Uma teoria causal da produçã o de voz nos permitiria mapear regiõ es no espaço de parâ metros fisioló gi‐
cos que produzem padrõ es distintos de vibraçã o das pregas vocais e qualidades vocais de interesse (por
exemplo, vozes normais, soprosas e á speras para aplicaçõ es clínicas; diferentes registros vocais para trei‐
namento de canto) , semelhante ao descrito por Isshiki (1989 ; també m Fig.9). ​ Embora o sistema de pro‐
duçã o de voz seja bastante complexo, o controlo da voz deve ser estável e simples, o que é necessá rio
para que a voz seja um meio de comunicaçã o robusto e facilmente controlado. Compreender a produçã o
de voz no â mbito da dinâ mica nã o linear e das interaçõ es de modo pró prio e relacioná -la com a qualidade
da voz pode facilitar esse objetivo. Para aplicaçõ es clínicas prá ticas, tal mapa de voz nos ajudaria a enten‐
der qual alteraçã o fisioló gica causou uma determinada alteraçã o na voz (o problema inverso) e o que
pode ser feito para restaurar a voz ao normal. O desenvolvimento de ferramentas eficientes e confiáveis ​
que abordem o problema inverso tem aplicaçõ es importantes no diagnó stico clínico de distú rbios vocais.
Já existem alguns mé todos que resolvem o problema inverso em modelos de elementos concentrados (por
exemplo, Dollinger et al. , 2002 ; Hadwin et al. , 2016 ), e estes podem ser estendidos para modelos contí‐
nuos fisiologicamente mais realistas.

A resoluçã o do problema inverso també m forneceria uma abordagem indireta para a compreensã o dos
estados fisioló gicos que levam à percepçã o de diferentes estados emocionais ou à comunicaçã o de outros
traços pessoais, que de outra forma seriam difíceis de medir diretamente em seres humanos vivos.
Quando estendida à produçã o contínua da fala, esta abordagem també m pode fornecer insights sobre o
controle fisioló gico dinâ mico da voz na fala corrente (por exemplo, contornos temporais dos ajustes respi‐PDF
Visualizar
rató rios e laríngeos). Essas informaçõ es facilitariam o desenvolvimento de programas de computador ca‐
pazes de sintetizar a fala conversacional com som natural, nos quais os contornos temporais dos parâ me‐
tros de controle podem mudar com o contexto, o estilo de falar ou o estado emocional do falante.

AGRADECIMENTOS

Este estudo foi apoiado pelas bolsas de pesquisa nºs R01 DC011299 e R01 DC009229 do Instituto Nacio‐
nal de Surdez e Outros Distú rbios da Comunicaçã o, os Institutos Nacionais de Saú de. O autor gostaria de
agradecer ao Dr. Liang Wu pela assistê ncia na preparaçã o das imagens de ressonâ ncia magné tica na Fig.1,​
Dra. Jennifer Long por fornecer a imagem na Fig.1(b), Dr. Gerald Berke por fornecer a gravaçã o estrobos‐
có pica da qual a Fig.3foi gerado, e ao Dr. Jody Kreiman, ao Dr. Bruce Gerratt, ao Dr. Ronald Scherer e a um
revisor anô nimo pelos comentá rios ú teis em uma versã o anterior deste artigo.

Referências

1. Alipour, F., Berry, DA e Titze, IR (2000). “ Um modelo de elementos finitos de vibração das pregas vocais ”, J. Acoust. Soc. Sou. 108 ,
3003–3012. 10.1121/1.1324678 [ PubMed ] [ CrossRef ] [ Google Scholar ]

2. Alipour, F. e Scherer, R. (2000). “ Efeitos de abaulamento das pregas vocais na fonação usando um modelo de computador biofísico
”, J. Voice 14 , 470–483. 10.1016/S0892-1997(00)80004-1 [ PubMed ] [ CrossRef ] [ Google Scholar ]
3. Alipour, F. e Scherer, RC (2004). “ Separação de fluxo em um modelo computacional de prega vocal oscilante ”, J. Acoust. Soc. Sou. 116
, 1710–1719. 10.1121/1.1779274 [ PubMed ] [ CrossRef ] [ Google Scholar ]

4. Alipour, F. e Vigmostad, S. (2012). “ Medição das propriedades elásticas das pregas vocais para modelagem contínua ”, J. Voice 26 ,
816.e21–816.e29. 10.1016/j.jvoice.2012.04.010 [ artigo gratuito do PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]

5. Berke, G., Mendelsohn, A., Howard, N. e Zhang, Z. (2013). “Fonação induzida neuromuscular em uma preparação de laringe
perfundida ex vivo humana”, J. Acoust. Soc. Sou. 133 ( 2 ), EL114–EL117. 10.1121/1.4776776 [ artigo gratuito do PMC ] [ PubMed ] [
CrossRef ] [ Google Scholar ]

6. Berry, DA (2001). “ Mecanismos de fonação modal e não modal ”, J. Phonetics 29 , 431–450. 10.1006/jpho.2001.0148 [ CrossRef ] [
Google Scholar ]

7. Berry, DA, Herzel, H., Titze, IR e Krischer, K. (1994). “ Interpretação de simulaçõ es biomecânicas de oscilaçõ es normais e caó ticas
das pregas vocais com funçõ es pró prias empíricas ”, J. Acoust. Soc. Sou. 95 , 3595–3604. 10.1121/1.409875 [ PubMed ] [ CrossRef ] [
Google Scholar ]

8. Berry, DA, Zhang, Z. e Neubauer, J. (2006). “ Mecanismos de vibração irregular em um modelo físico das pregas vocais ”, J. Acoust.
Soc. Sou. 120 , EL36–EL42. 10.1121/1.2234519 [ PubMed ] [ CrossRef ] [ Google Scholar ]

9. Bhattacharya, P. e Siegmund, T. (2013). “ Um estudo computacional de hidratação sistemática na colisão de pregas vocais ”, Comput.
Métodos Biomecânica. Biomédica. Eng. 17 ( 16 ), 1835–1852. 10.1080/10255842.2013.772591 [ artigo gratuito do PMC ] [ PubMed ] [
CrossRef ] [ Google Scholar ]

10. Bhattacharya, P. e Siegmund, T. (2015). “ O papel da adesão da superfície gló tica na biomecânica das pregas vocais ”, Biomech.
Modelo Mecanobiol. 14 , 283–295. 10.1007/s10237-014-0603-7 [ artigo gratuito do PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]

11. Chan, R., Gray, S. e Titze, I. (2001). “ A importância do ácido hialurô nico na biomecânica das pregas vocais ”, Otolaryngol. Cirurgia
de cabeça e pescoço. 124 , 607–614. 10.1067/mhn.2001.115906 [ PubMed ] [ CrossRef ] [ Google Scholar ]

12. Chan, R. e Rodriguez, M. (2008). “ Um reô metro de cisalhamento simples para caracterização viscoelástica linear de tecidos das
pregas vocais em frequências fonató rias ”, J. Acoust. Soc. Sou. 124 , 1207–1219. 10.1121/1.2946715 [ artigo gratuito do PMC ] [
PubMed ] [ CrossRef ] [ Google Scholar ]

13. Chan, RW e Titze, IR (1999). “ Propriedades de cisalhamento viscoelástico da mucosa das pregas vocais humanas: metodologia de
medição e resultados empíricos ”, J. Acoust. Soc. Sou. 106 , 2008–2021. 10.1121/1.427947 [ PubMed ] [ CrossRef ] [ Google Scholar ]

14. Chhetri, D., Berke, G., Lotfizadeh, A. e Goodyer, E. (2009). “ Controle da rigidez da cobertura das pregas vocais pelos mú sculos
laríngeos: Um estudo preliminar ”, Laryngoscope 119 ( 1 ), 222–227. 10.1002/lary.20031 [ PubMed ] [ CrossRef ] [ Google Scholar ]
Visualizar PDF
15. Chhetri, D., Neubauer, J. e Berry, D. (2012). “ Controle neuromuscular da frequência fundamental e postura gló tica no início da
fonação ”, J. Acoust. Soc. Sou. 131 ( 2 ), 1401–1412. 10.1121/1.3672686 [ artigo gratuito do PMC ] [ PubMed ] [ CrossRef ] [ Google
Scholar ]

16. Chhetri, DK, Zhang, Z. e Neubauer, J. (2011). “ Medição do mó dulo de Young da prega vocal por indentação ”, J. Voice 25 , 1–7.
10.1016/j.jvoice.2009.09.005 [ artigo gratuito do PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]

17. Choi, H., Berke, G., Ye, M. e Kreiman, J. (1993). “Função do mú sculo tireoaritenó ideo em um modelo de laringe canina”, Ann. Otol.
Rinol. Laringol. 102 , 769–776. 10.1177/000348949310201006 [ PubMed ] [ CrossRef ] [ Google Scholar ]

18. Colton, RH, Casper, JK e Leonard, R. (2011). Compreendendo os problemas de voz: uma perspectiva fisiológica para diagnóstico e
tratamento (Lipincott Williams & Wilkins, Baltimore, MD:), cap. 13. [ Google Acadêmico ]

19. Dollinger, M., Grohn, F., Berry, D., Eysholdt, U. e Luegmair, G. (2014). “ Resultados preliminares sobre a influência da camada de
muco artificial projetada na fonação ”, J. Speech Lang. Ouvir. Res. 57 , S637–S647. 10.1044/2014_JSLHR-S-12-0277 [ PubMed ] [
CrossRef ] [ Google Scholar ]

20. Dollinger, M., Hoppe, U., Hettlich, F., Lohscheller, J., Schuberth, S. e Eysholdt U. (2002). “ Extração de parâmetros de vibração de
séries de imagens endoscó picas das pregas vocais ”, IEEE Trans. Biomédica. Eng. 49 ( 8 ), 773–781. 10.1109/TBME.2002.800755 [
PubMed ] [ CrossRef ] [ Google Scholar ]
21. Drechsel, JS e Thomson, SL (2008). “ Influência das estruturas supragló ticas no jato gló tico saindo de um modelo de prega vocal
auto-oscilante sintético de duas camadas ”, J. Acoust. Soc. Sou. 123 , 4434–4445. 10.1121/1.2897040 [ artigo gratuito do PMC ] [
PubMed ] [ CrossRef ] [ Google Scholar ]

23. Erath, BD, Peterson, S., Zanartu, M., Wodicka, G. e Plesniak, MW (2011). “ Um modelo teó rico do campo de pressão decorrente de
fluxos intragló ticos assimétricos aplicado a um modelo de duas massas das pregas vocais ”, J. Acoust. Soc. Sou. 130 , 389–403.
10.1121/1.3586785 [ PubMed ] [ CrossRef ] [ Google Scholar ]

22. Erath, BD e Plesniak, MW (2006). “ A ocorrência do efeito Coanda no fluxo pulsátil através de modelos estáticos das pregas vocais
humanas ”, J. Acoust. Soc. Sou. 120 , 1000–1011. 10.1121/1.2213522 [ PubMed ] [ CrossRef ] [ Google Scholar ]

24. Fant, G. (1970). Teoria Acústica da Produção da Fala (Mouton, Haia, Holanda:), Cap. 1. [ Google Acadêmico ]

25. Fant, G. (1979). “ Fonte gló tica e análise de excitação ”, STL-QPSR 20 , 85–107. [ Google Scholar ]

26. Fant, G. (1982). “ Preliminares à análise da fonte de voz humana ”, STL-QPSR 23 ( 4 ), 1–27. [ Google Scholar ]

27. Fant, G., Liljencrants, J. e Lin, Q. (1985). “ Um modelo de quatro parâmetros de fluxo gló tico ”, STL-QPSR 26 ( 4 ), 1–13. [ Google
Scholar ]

28. Farahani, M. e Zhang, Z. (2014). “ Um estudo computacional do efeito da pressão negativa induzida por vó rtice intragló tico na
vibração das pregas vocais ”, J. Acoust. Soc. Sou. 136 , EL369–EL375. 10.1121/1.4898743 [ artigo gratuito do PMC ] [ PubMed ] [
CrossRef ] [ Google Scholar ]

29. Finnegan, E., Luschei, E. e Hoffman, H. (2000). “ Modulaçõ es na atividade respirató ria e laríngea associadas a mudanças na
intensidade vocal durante a fala ”, J. Speech Lang. Ouvir. Res. 43 , 934–950. 10.1044/jslhr.4304.934 [ PubMed ] [ CrossRef ] [ Google
Scholar ]

30. Flanagan, JL (1972). Análise, Síntese e Percepção da Fala (Springer, Berlin:), Cap. 6. [ Google Acadêmico ]

31. Flanagan, JL e Landgraf, L. (1968). “ Fonte auto-oscilante para sintetizadores de trato vocal ”, IEEE Trans. Eletroacústica de áudio.
AU-16 , 57–64. 10.1109/TAU.1968.1161949 [ CrossRef ] [ Google Scholar ]

32. Fukui, K., Ishikawa, Y., Sawa, T., Shintaku, E., Honda, M. e Takanishi, A. (2007). “ Novo robô falante antropomó rfico com
mecanismo de articulação tridimensional e faixa de pitch aprimorada ”, em 2007 IEEE International Conference on Robotics and
Automation , pp. [ Google Scholar ]

33. Fukui, K., Ishikawa, Y., Shintaku, E., Ohno, K., Sakakibara, N., Takanishi, A. e Honda, M. (2008). “ Modelo de corda vocal para
controlar várias vozes para robô falante antropomó rfico ”, em Anais do 8º Seminário Internacional de Produção de Fala (ISSP) , pp. [
Google Scholar ] Visualizar PDF
34. Fukui, K., Nishikawa, K., Ikeo, S., Shintaku, E., Takada, K., Takanobu, H., Honda, M. e Takanishi, A. (2005). “ Desenvolvimento de
novas cordas vocais baseadas em estruturas bioló gicas humanas para robô s falantes ”, em Sistemas Inteligentes de Informação e
Engenharia Baseados em Conhecimento (Springer, Berlim:), pp. [ Google Scholar ]

35. Gerratt, B. e Kreiman, J. (2001). “ Rumo a uma taxonomia de fonação não modal ”, J. Phonetics 29 , 365–381.
10.1006/jpho.2001.0149 [ CrossRef ] [ Google Scholar ]

36. Gobl, C. e Ní Chasaide, A. (2003). “ O papel da qualidade da voz na comunicação de emoçõ es, humor e atitude ”, Speech Commun.
40 , 189–212. 10.1016/S0167-6393(02)00082-1 ​[ CrossRef ] [ Google Scholar ]

37. Gobl, C. , and Ní Chasaide, A. (2010). “Voice source variation and its communicative functions,” in The Handbook of Phonetic
Sciences, 2nd ed., edited by Hardcastle William J., Laver John, and Gibbon Fiona E. ( Blackwell, Oxford: ), pp. 378–423. [Google
Scholar]

38. Gommel, A. , Butenweg, C. , Bolender, K. , and Grunendahl, A. (2007). “ A muscle controlled finite-element model of laryngeal
abduction and adduction,” Comput. Methods Biomech. Biomed. Eng. 10, 377–388. 10.1080/10255840701550923 [PubMed] [CrossRef]
[Google Scholar]

39. Gray, S. D. , Alipour, F. , Titze, I. R. , and Hammond, T. H. (2000). “ Biomechanical and histologic observations of vocal fold fibrous
proteins,” Ann. Otol. Rhinol. Laryngol. 109, 77–85. 10.1177/000348940010900115 [PubMed] [CrossRef] [Google Scholar]
40. Hadwin, P. , Galindo, G. , Daun, K. , Zanartu, M. , Erath, B. , Cataldo, E. , and Peterson, S. (2016). “ Non-stationary Bayesian
estimation of parameters from a body cover model of the vocal folds,” J. Acoust. Soc. Am. 139, 2683–2696. 10.1121/1.4948755 [PMC
free article] [PubMed] [CrossRef] [Google Scholar]

41. Haji, T. , Mori, K. , Omori, K. , and Isshiki N. (1992a). “ Experimental studies on the viscoelasticity of the vocal fold,” Acta
Otolaryngol. 112, 151–159. 10.3109/00016489209100797 [PubMed] [CrossRef] [Google Scholar]

42. Haji, T. , Mori, K. , Omori, K. , and Isshiki N. (1992b). “ Mechanical properties of the vocal fold. Stress-strain studies,” Acta
Otolaryngol. 112, 559–565. [PubMed] [Google Scholar]

43. Herzel, H. (1993). “ Bifurcations and chaos in voice signals,” Appl. Mech. Rev. 46(7), 399–413. 10.1115/1.3120369 [CrossRef]
[Google Scholar]

44. Herzel, H. , Berry, D. A. , Titze, I. R. , and Saleh, M. (1994). “ Analysis of vocal disorders with methods from nonlinear dynamics,” J.
Speech. Hear. Res. 37, 1008–1019. 10.1044/jshr.3705.1008 [PubMed] [CrossRef] [Google Scholar]

45. Herzel, H. , Steinecke, I. , Mende, W. , and Wermke, K. (1991). “Chaos and bifurcations during voiced speech,” in Complexity, Chaos
and Biological Evolution, edited by Mosekilde E. and Mosekilde L. ( Plenum, New York: ), pp. 41–50. [Google Scholar]

46. Henrich, N. , d'Alessandro, C. , Doval, B. , and Castellengo, M. (2005). “ Glottal open quotient in singing: Measurements and
correlation with laryngeal mechanisms, vocal intensity, and fundamental frequency,” J. Acoust. Soc. Am. 117(3), 1417–1430.
10.1121/1.1850031 [PubMed] [CrossRef] [Google Scholar]

47. Hirano, M. (1974). “ Morphological structure of the vocal fold and its variations,” Folia Phoniatr. 26, 89–94. 10.1159/000263771
[PubMed] [CrossRef] [Google Scholar]

48. Hirano, M. (1975). “ Phonosurgery: Basic and clinical investigations,” Otologia (Fukuoka) 21, 239–440. [Google Scholar]

49. Hirano, M. (1988). “ Vocal mechanisms in singing: Laryngological and phoniatric aspects,” J. Voice 2, 51–69. 10.1016/S0892-
1997(88)80058-4 [CrossRef] [Google Scholar]

50. Hirano, M. , and Kakita, Y. (1985). “Cover-body theory of vocal fold vibration,” in Speech Science: Recent Advances, edited by
Daniloff R. G. ( College-Hill Press, San Diego: ), pp. 1–46. [Google Scholar]

51. Hirano, M. , Ohala, J. , and Vennard, W. (1969). “ The function of laryngeal muscles in regulating fundamental frequency and
intensity of phonation,” J. Speech Hear Res. 12, 616–628. 10.1044/jshr.1203.616 [PubMed] [CrossRef] [Google Scholar]

52. Hirschberg, A. , Pelorson, X. , Hofmans, G. , van Hassel, R. R. , and Wijnands, A. P. J. (1996). “ Starting transient of the flow through
an in-vitro model of the vocal folds,” in Vocal Fold Physiology: Controlling Complexity and Chaos ( Singular, San Diego: ), pp. 31–46.
[Google Scholar] Visualizar PDF
53. Hixon, T. J. (1987). Respiratory Function in Speech and Song ( College-Hill Press, Boston, MA: ), Chap. 1. [Google Scholar]

54. Hixon, T. J. , Weismer, G. , and Hoit, J. D. (2008). Preclinical Speech Science: Anatomy, Physiology, Acoustics, and Perception ( Plural
Publishing, San Diego, CA: ), Chap. 3. [Google Scholar]

55. Hofmans, G. C. J. (1998). “ Vortex sound in confined flows,” Ph.D. thesis, (Eindhoven University of Technology, (Eindhoven,
Netherlands. [Google Scholar]

56. Holmberg, E. , Hillman, R. , and Perkell, J. (1988). “ Glottal airflow and transglottal air pressure measurements for male and female
speakers in soft, normal, and loud voice,” J. Acoust. Soc. Am. 84, 511–529. 10.1121/1.396829 [PubMed] [CrossRef] [Google Scholar]

57. Horacek, J. , and Svec, J. G. (2002). “ Aeroelastic model of vocal-fold-shaped vibrating element for studying the phonation
threshold,” J. Fluids Struct. 16, 931–955. 10.1006/jfls.2002.0454 [CrossRef] [Google Scholar]

58. Howe, M. S. , and McGowan, R. S. (2010). “ On the single-mass model of the vocal folds,” Fluid Dyn. Res. 42, 015001.
10.1088/0169-5983/42/1/015001 [PMC free article] [PubMed] [CrossRef] [Google Scholar]

59. Howe, M. S. , and McGowan, R. S. (2013). “ Aerodynamic sound of a body in arbitrary, deformable motion, with application to
phonation,” J. Sound Vib. 332, 3909–3923. 10.1016/j.jsv.2012.11.009 [PMC free article] [PubMed] [CrossRef] [Google Scholar]

60. Hunter, E. J. , Titze, I. R. , and Alipour, F. (2004). “A three-dimensional model of vocal fold abduction/adduction,” J. Acoust. Soc. Am.
115(4), 1747–1759. 10.1121/1.1652033 [PMC free article] [PubMed] [CrossRef] [Google Scholar]
61. Ishizaka, K. (1981). “Equivalent lumped-mass models of vocal fold vibration,” in Vocal Fold Physiology, edited by Stevens K. N. and
Hirano M. ( University of Tokyo, Tokyo: ), pp. 231–244. [Google Scholar]

62. Ishizaka, K. (1988). “Significance of Kaneko's measurement of natural frequencies of the vocal folds,” in Vocal Physiology: Voice
Production, Mechanisms and Functions ( Raven, New York), pp. 181–190. [Google Scholar]

63. Ishizaka, K. , and Flanagan, J. L. (1972). “ Synthesis of voiced sounds from a two-mass model of the vocal cords,” Bell Syst. Tech. J.
51, 1233–1267. 10.1002/j.1538-7305.1972.tb02651.x [CrossRef] [Google Scholar]

64. Ishizaka, K. , and Isshiki, N. (1976). “ Computer simulation of pathological vocal-cord vibration,” J. Acoust. Soc. Am. 60, 1193–1198.
10.1121/1.381221 [PubMed] [CrossRef] [Google Scholar]

65. Ishizaka, K. , and Matsudaira, M. (1972). “ Fluid mechanical considerations of vocal cord vibration,” Monograph 8, Speech
Communications Research Laboratory, Santa Barbara, CA.

66. Isogai, Y. , Horiguchi, S. , Honda, K. , Aoki, Y. , Hirose, H. , and Saito, S. (1988). “A dynamic simulation model of vocal fold
vibration,” in Vocal Physiology: Voice Production, Mechanisms and Functions, edited by Fujimura O. ( Raven, New York: ), pp. 191–206.
[Google Scholar]

67. Isshiki, N. (1964). “ Regulatory mechanism of voice intensity variation,” J. Speech Hear Res. 7, 17–29. 10.1044/jshr.0701.17
[PubMed] [CrossRef] [Google Scholar]

68. Isshiki, N. (1989). Phonosurgery: Theory and Practice ( Springer-Verlag, Tokyo: ), Chap. 3. [Google Scholar]

69. Isshiki, N. (1998). “ Mechanical and dynamical aspects of voice production as related to voice therapy and phonosurgery,” J. Voice
12, 125–137. 10.1016/S0892-1997(98)80031-3 [PubMed] [CrossRef] [Google Scholar]

70. Joliveau, E. , Smith, J. , and Wolfe, J. (2004). “ Tuning of vocal tract resonance by sopranos,” Nature 427, 116–116.
10.1038/427116a [PubMed] [CrossRef] [Google Scholar]

71. Kaburagi, T. , and Tanabe, Y. (2009). “ Low-dimensional models of the glottal flow incorporating viscous-inviscid interaction,” J.
Acoust. Soc. Am. 125, 391–404. 10.1121/1.3021436 [PubMed] [CrossRef] [Google Scholar]

72. Kakita, Y. (1988). “Simultaneous observation of the vibratory pattern, sound pressure, and airflow signals using a physical model
of the vocal folds,” in Vocal Physiology: Voice Production, Mechanisms and Functions, edited by Fujimura O. ( Raven, New York: ), pp.
207–218. [Google Scholar]

73. Kaneko, T. , Masuda, T. , Shimada, A. , Suzuki, H. , Hayasaki, K. , and Komatsu, K. (1986). “Resonance characteristics of the human
vocal folds in vivo and in vitro by an impulse excitation,” in Laryngeal Function in Phonation and Respiration, edited by Baer T., Sasaki
C., and Harris K. ( Little, Brown, Boston: ), pp. 349–377. [Google Scholar] Visualizar PDF
74. Kazemirad, S. , Bakhshaee, H. , Mongeau, L. , and Kost, K. (2014). “ Non-invasive in vivo measurement of the shear modulus of
human vocal fold tissue,” J. Biomech. 47, 1173–1179. 10.1016/j.jbiomech.2013.11.034 [PMC free article] [PubMed] [CrossRef]
[Google Scholar]

75. Kelleher, J. E. , Siegmund, T. , Du, M. , Naseri, E. , and Chan, R. W. (2013a). “ Empirical measurements of biomechanical anisotropy
of the human vocal fold lamina propria,” Biomech. Model Mechanobiol. 12, 555–567. 10.1007/s10237-012-0425-4 [PMC free article]
[PubMed] [CrossRef] [Google Scholar]

76. Kelleher, J. E. , Siegmund, T. , Du, M. , Naseri, E. , and Chan, R. W. (2013b). “ The anisotropic hyperelastic biomechanical response
of the vocal ligament and implications for frequency regulation: A case study,” J. Acoust. Soc. Am. 133, 1625–1636. 10.1121/1.4776204
[PMC free article] [PubMed] [CrossRef] [Google Scholar]

77. Kettlewell, B. (2015). “ The influence of intraglottal vortices upon the dynamics of the vocal folds,” Master thesis, (University of
Waterloo, (Ontario, Canada. [Google Scholar]

78. Khosla, S. , Oren, L. , and Gutmark, E. (2014). “ An example of the role of basic science research to inform the treatment of
unilateral vocal fold paralysis,” SIG 3 Perspect. Voice Voice Disord. 24, 37–50. 10.1044/vvd24.1.37 [CrossRef] [Google Scholar]

79. Klatt, D. H. (1987). “ Review of text-to-speech conversion for English,” J. Acoust. Soc. Am. 82, 737–793. 10.1121/1.395275
[PubMed] [CrossRef] [Google Scholar]

80. Klatt, D. H. , and Klatt, L. C. (1990). “ Analysis, synthesis and perception of voice quality variations among male and female
talkers,” J. Acoust. Soc. Am. 87, 820–856. 10.1121/1.398894 [PubMed] [CrossRef] [Google Scholar]
81. Kreiman, J. , Garellek, M. , Chen, G. , Alwan, A. , and Gerratt, B. (2015). “ Perceptual evaluation of voice source models,” J. Acoust.
Soc. Am. 138, 1–10. 10.1121/1.4922174 [PMC free article] [PubMed] [CrossRef] [Google Scholar]

82. Kreiman, J. , and Gerratt, B. (2012). “ Perceptual interaction of the harmonic source and noise in voice,” J. Acoust. Soc. Am. 131,
492–500. 10.1121/1.3665997 [PMC free article] [PubMed] [CrossRef] [Google Scholar]

83. Kreiman, J. , Gerratt, B. R. , Garellek, M. , Samlan, R. , and Zhang, Z. (2014). “ Toward a unified theory of voice production and
perception,” Loquens 1, e009. 10.3989/loquens.2014.009 [PMC free article] [PubMed] [CrossRef] [Google Scholar]

84. Kreiman, J. , and Sidtis, D. (2011). Foundations of Voice Studies: An Interdisciplinary Approach to Voice Production and Perception (
Wiley-Blackwell, Hoboken, NJ: ), Chaps. 2 and 8. [Google Scholar]

85. Kucinschi, B. R. , Scherer, R. C. , DeWitt, K. J. , and Ng, T. T. M. (2006). “ Flow visualization and acoustic consequences of the air
moving through a static model of the human larynx,” J. Biomater. Appl. 128, 380–390. [PubMed] [Google Scholar]

86. Kutty, J. , and Webb, K. (2009). “ Tissue engineering therapies for the vocal fold lamina propria,” Tissue Eng.: Part B 15, 249–262.
10.1089/ten.teb.2008.0588 [PubMed] [CrossRef] [Google Scholar]

87. Li, S. , Scherer, R. , Wan, M. , and Wang, S. (2012). “ The effect of entrance radii on intraglottal pressure distributions in the
divergent glottis,” J. Acoust. Soc. Am. 131(2), 1371–1377. 10.1121/1.3675948 [PMC free article] [PubMed] [CrossRef] [Google Scholar]

88. Liljencrants, J. (1991). “ A translating and rotating mass model of the vocal folds,” STL/QPSR 1, 1–18. [Google Scholar]

89. Lucero, J. C. , Schoentgen, J. , Haas, J. , Luizard, P. , and Pelorson, X. (2015). “ Self-entrainment of the right and left vocal fold
oscillators,” J. Acoust. Soc. Am. 137, 2036–2046. 10.1121/1.4916601 [PubMed] [CrossRef] [Google Scholar]

90. Luo, H. , Mittal, R. , and Bielamowicz, S. (2009). “ Analysis of flow-structure interaction in the larynx during phonation using an
immersed-boundary method,” J. Acoust. Soc. Am. 126, 816–824. 10.1121/1.3158942 [PMC free article] [PubMed] [CrossRef] [Google
Scholar]

91. McGowan, R. S. (1988). “ An aeroacoustic approach to phonation,” J. Acoust. Soc. Am. 83(2), 696–704. 10.1121/1.396165 [PubMed]
[CrossRef] [Google Scholar]

92. Mihaescu, M. , Khosla, S. M. , Murugappan, S. , and Gutmark, E. J. (2010). “ Unsteady laryngeal airflow simulations of the intra-
glottal vortical structures,” J. Acoust. Soc. Am. 127, 435–444. 10.1121/1.3271276 [PMC free article] [PubMed] [CrossRef] [Google
Scholar]

94. Miri, A. , Mongrain, R. , Chen, L. , and Mongeau, L. (2012). “ Quantitative assessment of the anisotropy of vocal fold tissue using
shear rheometry and traction testing,” J. Biomechanics 45, 2943–2946. 10.1016/j.jbiomech.2012.08.030 [PMC free article] [PubMed]
[CrossRef] [Google Scholar] Visualizar PDF
93. Miri, A. K. , Heris, H. K. , Tripathy, U. , Wiseman, P. W. , and Mongeau L. (2013). “ Microstructural characterization of vocal folds
toward a strain-energy model of collagen remodeling,” Acta Biomater. 9, 7957–7967. 10.1016/j.actbio.2013.04.044 [PMC free article]
[PubMed] [CrossRef] [Google Scholar]

95. Moore, D. M. , and Berke, G. S. (1988). “ The effect of laryngeal nerve stimulation on phonation: A glottographic study using an in
vivo canine model,” J. Acoust. Soc. Am. 83, 705–715. 10.1121/1.396113 [PubMed] [CrossRef] [Google Scholar]

96. Murray, P. R. , and Thomson, S. L. (2012). “ Vibratory responses of synthetic, self-oscillating vocal fold models,” J. Acoust. Soc. Am.
132, 3428–3438. 10.1121/1.4754551 [PMC free article] [PubMed] [CrossRef] [Google Scholar]

97. Neubauer, J. , Mergell, P. , Eysholdt, U. , and Herzel, H. (2001). “ Spatiotemporal analysis of irregular vocal fold oscillations:
Biphonation due to desynchronization of spatial modes,” J. Acoust. Soc. Am. 110, 3179–3192. 10.1121/1.1406498 [PubMed]
[CrossRef] [Google Scholar]

98. Neubauer, J. , Zhang, Z. , Miraghaie, R. , and Berry, D. A. (2007). “ Coherent structures of the near field flow in a self-oscillating
physical model of the vocal folds,” J. Acoust. Soc. Am. 121, 1102–1118. 10.1121/1.2409488 [PubMed] [CrossRef] [Google Scholar]

99. Oren, L. , Khosla, S. , and Gutmark, E. (2014). “ Intraglottal pressure distribution computed from empirical velocity data in canine
larynx,” J. Biomech. 47, 1287–1293. 10.1016/j.jbiomech.2014.02.023 [PMC free article] [PubMed] [CrossRef] [Google Scholar]

100. Park, J. B. , and Mongeau, L. (2007). “ Instantaneous orifice discharge coefficient of a physical, driven model of the human
larynx,” J. Acoust. Soc. Am. 121, 442–455. 10.1121/1.2401652 [PubMed] [CrossRef] [Google Scholar]
101. Patel, S. , Scherer, K. , Bjorkner, E. , and Sundberg, J. (2011). “ Mapping emotions into acoustic space: The role of voice
production,” Biol. Psych. 87, 93–98. 10.1016/j.biopsycho.2011.02.010 [PubMed] [CrossRef] [Google Scholar]

102. Pelorson, X. , Hirschberg, A. , van Hassel, R. , Wijnands, A. , and Auregan, Y. (1994). “ Theoretical and experimental study of quasi-
steady flow separation within the glottis during phonation: Application to a modified two-mass model,” J. Acoust. Soc. Am. 96, 3416–
3431. 10.1121/1.411449 [CrossRef] [Google Scholar]

103. Rothenberg, M. (1971). “ Effect of glottal pulse shape on the quality of natural vowels,” J. Acoust. Soc. Am. 49, 583–590.
10.1121/1.1912389 [PubMed] [CrossRef] [Google Scholar]

104. Rothenberg, M. (1981). “ An interactive model for the voice source,” STL-QPSR 22(4), 1–17. [Google Scholar]

105. Ruty, N. , Pelorson, X. , Van Hirtum, A. , Lopez-Arteaga, I. , and Hirschberg, A. (2007). “ An in vitro setup to test the relevance and
the accuracy of low-order vocal folds models,” J. Acoust. Soc. Am. 121, 479–490. 10.1121/1.2384846 [PubMed] [CrossRef] [Google
Scholar]

106. Scherer, R. , Shinwari, D. , De Witt, K. , Zhang, C. , Kucinschi, B. , and Afjeh, A. (2001). “ Intraglottal pressure profiles for a
symmetric and oblique glottis with a divergence angle of 10 degrees,” J. Acoust. Soc. Am. 109(4), 1616–1630. 10.1121/1.1333420
[PubMed] [CrossRef] [Google Scholar]

107. Scherer, R. , Torkaman, S. , Kucinschi, B. , and Afjeh, A. (2010). “ Intraglottal pressure in a three-dimensional model with a non-
rectangular glottal shape,” J. Acoust. Soc. Am. 128(2), 828–838. 10.1121/1.3455838 [PMC free article] [PubMed] [CrossRef] [Google
Scholar]

108. Sciamarella, D. , and Le Quere, P. (2008). “ Solving for unsteady airflow in a glottal model with immersed moving boundaries,”
Eur. J. Mech. B/Fluids 27, 42–53. 10.1016/j.euromechflu.2007.06.004 [CrossRef] [Google Scholar]

109. Selbie, W. S. , Zhang, L. , Levine, W. S. , and Ludlow, C. L. (1998). “ Using joint geometry to determine the motion of the
cricoarytenoid joint,” J. Acoust. Soc. Am. 103(2), 1115–1127. 10.1121/1.421223 [PubMed] [CrossRef] [Google Scholar]

110. Shinwari, D. , Scherer, R. C. , DeWitt, K. J. , and Afjeh, A. A. (2003). “ Flow visualization and pressure distributions in a model of
the glottis with a symmetric and oblique divergent angle of 10 degrees,” J. Acoust. Soc. Am. 113, 487–497. 10.1121/1.1526468
[PubMed] [CrossRef] [Google Scholar]

111. Sidlof, P. , Doare, O. , Cadot, O. , and Chaigne, A. (2011). “ Measurement of flow separation in a human vocal folds model,” Exp.
Fluids 51, 123–136. 10.1007/s00348-010-1031-9 [CrossRef] [Google Scholar]

112. Smith, S. (1956). “ Membrane-Polster-Theorie der Stimmlippen,” Arch. Ohr. Nas. Kehlk. Heilk. 169, 485–485. 10.1007/BF02105609
[CrossRef] [Google Scholar]
Visualizar PDF
113. Stathopoulos, E. , and Sapienza, C. (1993). “ Respiratory and laryngeal function of women and men during vocal intensity
variation,” J. Speech Hear Res. 36, 64–75. 10.1044/jshr.3601.64 [PubMed] [CrossRef] [Google Scholar]

114. Steinecke, I. , and Herzel, H. (1995). “ Bifurcations in an asymmetric vocal fold model,” J. Acoust. Soc. Am. 97, 1874–1884.
10.1121/1.412061 [PubMed] [CrossRef] [Google Scholar]

115. Stone, R. E. , and Nuttall, A. L. (1974). “ Relative movements of the thyroid and cricoid cartilages assessed by neural stimulation
in dogs,” Acta Oto-Laryngologica 78, 135–140. 10.3109/00016487409126338 [PubMed] [CrossRef] [Google Scholar]

116. Story, B. H. , and Titze, I. R. (1995). “ Voice simulation with a body-cover model of the vocal folds,” J. Acoust. Soc. Am. 97, 1249–
1260. 10.1121/1.412234 [PubMed] [CrossRef] [Google Scholar]

117. Sundberg, J. (1987). The Science of the Singing Voice ( Northern Illinois University, DeKalb: ), Chaps. 2 and 4. [Google Scholar]

118. Sundberg, J. , and Hö gset, C. (2001). “ Voice source differences between falsetto and modal registers in counter tenors, tenors and
baritones,” Logoped. Phoniatr. Vocol. 26, 26–36. 10.1080/140154301300109107 [PubMed] [CrossRef] [Google Scholar]

119. Svec, J. , Horacek, J. , Sram, F. , and Vesely, J. (2000). “ Resonance properties of the vocal folds: In vivo laryngoscopic investigation
of the externally excited laryngeal vibrations,” J. Acoust. Soc. Am. 108, 1397–1407. 10.1121/1.1289205 [PubMed] [CrossRef] [Google
Scholar]

120. Tanaka, S. , and Tanabe, M. (1986). “ Glottal adjustment for regulating vocal intensity, an experimental study,” Acta Otolaryngol.
102, 315–324. 10.3109/00016488609108682 [PubMed] [CrossRef] [Google Scholar]
121. Tao, C. , Jiang, J. J. , and Czerwonka, L. (2010). “ Liquid accumulation in vibrating vocal fold tissue: A simplified model based on a
fluid-saturated porous solid theory,” J. Voice 24, 260–269. 10.1016/j.jvoice.2008.09.005 [PMC free article] [PubMed] [CrossRef]
[Google Scholar]

122. Tao, C. , Jiang, J. J. , and Zhang, Y. (2009). “ A hydrated model of the vocal fold based on fluid-saturated porous solid theory,” J.
Biomech. 42, 774–780. 10.1016/j.jbiomech.2008.12.006 [PMC free article] [PubMed] [CrossRef] [Google Scholar]

123. Tao, C. , Zhang, Y. , Hottinger, D. , and Jiang, J. (2007). “ Asymmetric airflow and vibration induced by the Coanda effect in a
symmetric model of the vocal folds,” J. Acoust. Soc. Am. 122, 2270–2278. 10.1121/1.2773960 [PubMed] [CrossRef] [Google Scholar]

124. Thomson, S. L. , Mongeau, L. , and Frankel, S. H. (2005). “ Aerodynamic transfer of energy to the vocal folds,” J. Acoust. Soc. Am.
118, 1689–1700. 10.1121/1.2000787 [PubMed] [CrossRef] [Google Scholar]

125. Titze, I. (1973). “ The human vocal cords: A mathematical model, part I,” Phonetica 28, 129–170. 10.1159/000259453 [PubMed]
[CrossRef] [Google Scholar]

126. Titze, I. (1988a). “ The physics of small-amplitude oscillation of the vocal folds,” J. Acoust. Soc. Am. 83, 1536–1552.
10.1121/1.395910 [PubMed] [CrossRef] [Google Scholar]

127. Titze, I. (1989). “ On the relation between subglottal pressure and fundamental frequency in phonation,” J. Acoust. Soc. Am. 85,
901–906. 10.1121/1.397562 [PubMed] [CrossRef] [Google Scholar]

128. Titze, I. (2008). “ Nonlinear source–filter coupling in phonation: Theory,” J. Acoust. Soc. Am. 123, 2733–2749. 10.1121/1.2832337
[PMC free article] [PubMed] [CrossRef] [Google Scholar]

129. Titze, I. , Riede, T. , and Popolo, P. (2008). “ Nonlinear source–filter coupling in phonation: Vocal exercises,” J. Acoust. Soc. Am.
123, 1902–1915. 10.1121/1.2832339 [PMC free article] [PubMed] [CrossRef] [Google Scholar]

130. Titze, I. , and Story, B. H. (2002). “ Rules for controlling low-dimensional vocal fold models with muscle activation,” J. Acoust.
Soc. Am. 112, 1064–1076. 10.1121/1.1496080 [PubMed] [CrossRef] [Google Scholar]

131. Titze, I. , and Sundberg, J. (1992). “ Vocal intensity in speakers and singers,” J. Acoust. Soc. Am. 91, 2936–2946. 10.1121/1.402929
[PubMed] [CrossRef] [Google Scholar]

132. Titze, I. , and Talkin, D. (1979). “ A theoretical study of the effects of various laryngeal configurations on the acoustics of
phonation,” J. Acoust. Soc. Am. 66, 60–74. 10.1121/1.382973 [PubMed] [CrossRef] [Google Scholar]

133. Titze, I. R. (1988b). “Regulation of vocal power and efficiency by subglottal pressure and glottal width,” in Vocal Physiology: Voice
Production, Mechanisms and Functions, edited by Fujimura O. ( Raven, New York: ), pp. 227–238. [Google Scholar]

134. Titze, I. R. (2002). “ Regulating glottal airflow in phonation: Application of the maximum power transfer theorem toVisualizar
a low PDF
dimensional phonation model,” J. Acoust. Soc. Am. 111, 367–376. 10.1121/1.1417526 [PubMed] [CrossRef] [Google Scholar]

135. Titze, I. R. , and Hunter, E. J. (2004). “ Normal vibration frequencies of the vocal ligament,” J. Acoust. Soc. Am. 115, 2264–2269.
10.1121/1.1698832 [PMC free article] [PubMed] [CrossRef] [Google Scholar]

136. Titze, I. R. , Jiang, J. , and Drucker, D. G. (1988). “ Preliminaries to the body cover theory of pitch control,” J. Voice 1, 314–319.
10.1016/S0892-1997(88)80004-3 [CrossRef] [Google Scholar]

137. Titze, I. R. , Schmidt, S. , and Titze, M. (1995). “ Phonation threshold pressure in a physical model of the vocal fold mucosa,” J.
Acoust. Soc. Am. 97, 3080–3084. 10.1121/1.411870 [PubMed] [CrossRef] [Google Scholar]

138. Titze, I. R. , and Strong, W. J. (1975). “ Normal modes in vocal fold tissues,” J. Acoust. Soc. Am. 57, 736–744. 10.1121/1.380498
[PubMed] [CrossRef] [Google Scholar]

139. Tokuda, I. T. , Horacek, J. , Svec, J. G. , and Herzel, H. (2007). “ Comparison of biomechanical modeling of register transitions and
voice instabilities with excised larynx experiments,” J. Acoust. Soc. Am. 122, 519–531. 10.1121/1.2741210 [PubMed] [CrossRef]
[Google Scholar]

140. Tran, Q. , Berke, G. , Gerratt, B. , and Kreiman, J. (1993). “ Measurement of Young's modulus in the in vivo human vocal folds,” Ann.
Otol. Rhinol. Laryngol. 102, 584–591. 10.1177/000348949310200803 [PubMed] [CrossRef] [Google Scholar]

141. Triep, M. , Brü cker, C. , and Schrö der, W. (2005). “ High-speed PIV measurements of the flow downstream of a dynamic
mechanical model of the human vocal folds,” Exp. Fluids 39, 232–245. 10.1007/s00348-005-1015-3 [CrossRef] [Google Scholar]
142. Tse, J. , Zhang, Z. , and Long, J. L. (2015). “ Effects of vocal fold epithelium removal on vibration in an excised human larynx
model,” J. Acoust. Soc. Am. 138, EL60–EL64. 10.1121/1.4922765 [PMC free article] [PubMed] [CrossRef] [Google Scholar]

143. Vahabzadeh-Hagh, A. , Zhang, Z. , and Chhetri, D. (2016). “Three-dimensional posture changes of the vocal fold from paired
intrinsic laryngeal muscles,” Laryngoscope (in press). [PMC free article] [PubMed] [Google Scholar]

144. van den Berg, J. W. (1958). “ Myoelastic-aerodynamic theory of voice production,” J. Speech Hear. Res. 1, 227–244.
10.1044/jshr.0103.227 [PubMed] [CrossRef] [Google Scholar]

145. van den Berg, J. W. (1968). “ Register problems,” Ann. N. Y. Acad. Sci. 155(1), 129–134. 10.1111/j.1749-6632.1968.tb56756.x
[PubMed] [CrossRef] [Google Scholar]

146. van den Berg, J. W. , and Tan, T. S. (1959). “ Results of experiments with human larynxes,” Pract. Otorhinolaryngol. 21, 425–450.
[PubMed] [Google Scholar]

147. Xuan, Y. , and Zhang, Z. (2014). “ Influence of embedded fibers and an epithelium layer on glottal closure pattern in a physical
vocal fold model,” J. Speech Lang. Hear. Res. 57, 416–425. 10.1044/2013_JSLHR-S-13-0068 [PMC free article] [PubMed] [CrossRef]
[Google Scholar]

148. Xue, Q. , Zheng, X. , Mittal, R. , and Bielamowicz, S. (2012). “ Computational modeling of phonatory dynamics in a tubular three-
dimensional model of the human larynx,” J. Acoust. Soc. Am. 132, 1602–1613. 10.1121/1.4740485 [PMC free article] [PubMed]
[CrossRef] [Google Scholar]

149. Xue, Q. , Zheng, X. , Mittal, R. , and Bielamowicz, S. (2014). “ Subject-specific computational modeling of human phonation,” J.
Acoust. Soc. Am. 135, 1445–1456. 10.1121/1.4864479 [PMC free article] [PubMed] [CrossRef] [Google Scholar]

150. Yin, J. , and Zhang, Z. (2013). “ The influence of thyroarytenoid and cricothyroid muscle activation on vocal fold stiffness and
eigenfrequencies,” J. Acoust. Soc. Am. 133, 2972–2983. 10.1121/1.4799809 [PMC free article] [PubMed] [CrossRef] [Google Scholar]

151. Yin, J. , and Zhang, Z. (2014). “ Interaction between the thyroarytenoid and lateral cricoarytenoid muscles in the control of vocal
fold adduction and eigenfrequencies,” J. Biomech. Eng. 136(11), 111006. 10.1115/1.4028428 [PMC free article] [PubMed] [CrossRef]
[Google Scholar]

152. Zemlin, W. (1997). Speech and Hearing Science: Anatomy and Physiology ( Allyn & Bacon, Needham Heights, MA: ), Chap. 3.
[Google Scholar]

153. Zhang, Y. , Czerwonka, L. , Tao, C. , and Jiang, J. (2008). “ A biphasic theory for the viscoelastic behaviors of vocal fold lamina
propria in stress relaxation,” J. Acoust. Soc. Am. 123, 1627–1636. 10.1121/1.2831739 [PubMed] [CrossRef] [Google Scholar]

154. Zhang, Z. (2009). “ Characteristics of phonation onset in a two-layer vocal fold model,” J. Acoust. Soc. Am. 125, 1091–1102.
Visualizar PDF
10.1121/1.3050285 [PMC free article] [PubMed] [CrossRef] [Google Scholar]

155. Zhang, Z. (2010). “ Dependence of phonation threshold pressure and frequency on vocal fold geometry and biomechanics,” J.
Acoust. Soc. Am. 127, 2554–2562. 10.1121/1.3308410 [PMC free article] [PubMed] [CrossRef] [Google Scholar]

156. Zhang, Z. (2011). “ Restraining mechanisms in regulating glottal closure during phonation,” J. Acoust. Soc. Am. 130, 4010–4019.
10.1121/1.3658477 [PMC free article] [PubMed] [CrossRef] [Google Scholar]

157. Zhang, Z. (2014). “ The influence of material anisotropy on vibration at onset in a three-dimensional vocal fold model,” J. Acoust.
Soc. Am. 135(3), 1480–1490. 10.1121/1.4863266 [PMC free article] [PubMed] [CrossRef] [Google Scholar]

158. Zhang, Z. (2016a). “ Cause-effect relationship between vocal fold physiology and voice production in a three-dimensional
phonation model,” J. Acoust. Soc. Am. 139, 1493–1507. 10.1121/1.4944754 [PMC free article] [PubMed] [CrossRef] [Google Scholar]

159. Zhang, Z. (2016b). “ Respiratory laryngeal coordination in airflow conservation and reduction of respiratory effort of phonation,”
J. Voice (in press) 10.1016/j.jvoice.2015.09.015. [PMC free article] [PubMed] [CrossRef] [Google Scholar]

160. Zhang, Z. , Mongeau, L. , and Frankel, S. H. (2002a). “ Experimental verification of the quasi-steady approximation for
aerodynamic sound generation by pulsating jets in tubes,” J. Acoust. Soc. Am. 112(4), 1652–1663. 10.1121/1.1506159 [PubMed]
[CrossRef] [Google Scholar]

161. Zhang, Z. , Mongeau, L. , Frankel, S. H. , Thomson, S. , and Park, J. (2004). “ Sound generation by steady flow through glottis-
shaped orifices,” J. Acoust. Soc. Am. 116(3), 1720–1728. 10.1121/1.1779331 [PubMed] [CrossRef] [Google Scholar]
162. Zhang, Z. , and Neubauer, J. (2010). “ On the acoustical relevance of supraglottal flow structures to low-frequency voice
production,” J. Acoust. Soc. Am. 128(6), EL378–EL383. 10.1121/1.3515838 [PMC free article] [PubMed] [CrossRef] [Google Scholar]

163. Zhang, Z., Neubauer, J. e Berry, DA (2006a). “ A influência da acú stica subgló tica nos modelos laboratoriais de fonação ”, J. Acoust.
Soc. Sou. 120 ( 3 ), 1558–1569. 10.1121/1.2225682 [ PubMed ] [ CrossRef ] [ Google Scholar ]

164. Zhang, Z., Neubauer, J. e Berry, DA (2007). “ Mecanismos físicos de início da fonação: Uma análise de estabilidade linear de um
modelo aeroelástico contínuo de fonação ”, J. Acoust. Soc. Sou. 122 ( 4 ), 2279–2295. 10.1121/1.2773949 [ PubMed ] [ CrossRef ] [
Google Scholar ]

165. Zhang, K., Siegmund, T. e Chan, RW (2006b). “ Um modelo constitutivo da cobertura da prega vocal humana para regulação de
frequência fundamental ”, J. Acoust. Soc. Sou. 119 , 1050–1062. 10.1121/1.2159433 [ PubMed ] [ CrossRef ] [ Google Scholar ]

166. Zhang, C., Zhao, W., Frankel, S. e Mongeau, L. (2002b). “ Aeroacú stica computacional da fonação, Parte II: Efeitos dos parâmetros
de fluxo e pregas ventriculares ”, J. Acoust. Soc. Sou. 112 , 2147–2154. 10.1121/1.1506694 [ PubMed ] [ CrossRef ] [ Google Scholar ]

167. Zhao, W., Zhang, C., Frankel, S. e Mongeau, L. (2002). “ Aeroacú stica computacional da fonação, Parte I: Métodos computacionais
e mecanismos de geração de som ”, J. Acoust. Soc. Sou. 112 , 2134–2146. 10.1121/1.1506693 [ PubMed ] [ CrossRef ] [ Google Scholar ]

168. Zheng, X., Bielamowicz, S., Luo, H. e Mittal, R. (2009). “ Um estudo computacional do efeito das falsas pregas vocais no fluxo
gló tico e na vibração das pregas vocais durante a fonação ”, Ann. Biomédica. Eng. 37 , 625–642. 10.1007/s10439-008-9630-9 [ artigo
gratuito do PMC ] [ PubMed ] [ CrossRef ] [ Google Scholar ]

Visualizar PDF

Você também pode gostar