Ce matin encore, test d’écoute en cours d’espagnol. Je n’y arrive jamais mais pourtant je comprends les gens quand je leur parle dans la rue. Pourquoi ? Est-ce un problème de perception ? Me manquerait-il des informations?
Regardez ce petit bout de film et écoutez donc.
Bizarre hein ? Petite explication ci-dessous, en Français. C'est aussi possible que cela n'est pas marché avec vous, tout le monde n'y est pas sensible.
L’effet McGurk est un effet de la perception audio-visuelle de la parole, qui a été décrit pour la première fois par H. McGurk et J. MacDonald (Nature, 1976). Cet effet consiste en une illusion perceptive lors de la présentation d’un stimulus audio-visuel dont les parties audio et visuelles ne correspondent pas l’une à l’autre.
Ils ont trouvé une catégorie perceptive intitulée « fusions » lors de la présentation combinée d’un stimulus audio /ka/ ou /ga/ et d’un stimulus visuel /pa/ ou /ba/. Pour cela un nombre significatif des sujets adultes perçoivent un phonème fusionné /ta/ ou /da/, alors qu’en condition audio seule la capacité d’identifier correctement les stimuli reste importante (plus que 90%). De plus, ils ont trouvé une catégorie perceptive « combination » pour une combinaison inverse des stimuli (audio /ka/ ou /ga/, visuel /pa/ ou /ga/).
McGurk et MacDonald ont conclu que la parole est l' objet d’une perception bimodale : le mode de l’articulation est perçu auditivement et le lieu visuellement. Cette première interprétation n’était pas confirmée par d’autres expériences. Sekiyama & Tohkura (1991) ont trouvé, que l’effet McGurk est contraint aux situations, où une confusion acoustique est très probable, comme c’est le cas pour les phonèmes /g/ et /d/.
L’importance de l’effet McGurk vient surtout du fait qu’il montre l’intégration des deux modalités audio et visuel au lieu d’un traitement séparé et isolé lors de la perception de la parole.
Mais comment fonctionne cette intégration audio-visuelle? Parmi plusieurs approches d’expliquer cet effet, la théorie motrice de la perception de la parole (TMPP, Liberman et al. (1967, 1985)) prend de plus en plus d’importance, surtout depuis la découverte des neurones miroirs dont l’existence donne des nouveaux indices soutenant la TMPP. Selon cette théorie, la perception de la parole est basée sur des connaissances et des expériences de la production de la parole en utilisant des programmes motrices (utilisé pour la production de la parole) pour reconstruire les gestes articulatoires qui peuvent faire émerger un stimulus aperçu. Ces schémas sont comparés avec la perception pour en déduire une perception finale. La TMPP propose donc, que tous les signaux de la parole soient transcodés en un code gestuel. Avec cette approche, la TMPP s’éloigne des théories perceptives basées uniquement sur les caractéristiques sonores et arrive à expliquer l’intégration des modalités différentes dans des cas de stimuli contradictoires.
Un autre modèle de la perception de la parole est le modèle «analysis-by-synthesis » développé par Stevens et Halle (1967). Ils proposent l’utilisation des informations sensorielles pour la création des hypothèses concernant l’énoncé d’un locuteur. Ces hypothèses sont basées sur la connaissance et l’expérience de l’auditeur et elles sont crées sans échange d’information avec le système moteur. Seulement dans le cas où ces hypothèses sont trop différentes des informations sensorielles, en cas d’ambiguïté par exemple, alors les informations sensorielles sont traitées à l’aide du système moteur. Cette théorie arrive aussi bien à expliquer l’effet McGurk que la perception multimodale en général.
Alors si, on considère la théorie de la TMPP ou "analysis-by-synthesis" , il est bien normal que je comprenne moins bien car la seule modalité dont je peux m’aider lors d’exercice audio est…l’audio.
mercredi 12 décembre 2007
Inscription à :
Publier les commentaires (Atom)
Aucun commentaire:
Enregistrer un commentaire