@inproceedings{seddah-etal-2009-adaptation,
title = "Adaptation de parsers statistiques lexicalis{\'e}s pour le fran{\c{c}}ais : Une {\'e}valuation compl{\`e}te sur corpus arbor{\'e}s",
author = "Seddah, Djam{\'e} and
Candito, Marie and
Crabb{\'e}, Beno{\^\i}t",
editor = "Nazarenko, Adeline and
Poibeau, Thierry",
booktitle = "Actes de la 16{\`e}me conf{\'e}rence sur le Traitement Automatique des Langues Naturelles. Articles courts",
month = jun,
year = "2009",
address = "Senlis, France",
publisher = "ATALA",
url = "https://aclanthology.org/2009.jeptalnrecital-court.1",
pages = "1--10",
abstract = "Cet article pr{\'e}sente les r{\'e}sultats d{'}une {\'e}valuation exhaustive des principaux analyseurs syntaxiques probabilistes dit {``}lexicalis{\'e}s{''} initialement con{\c{c}}us pour l{'}anglais, adapt{\'e}s pour le fran{\c{c}}ais et {\'e}valu{\'e}s sur le CORPUS ARBOR{\'E} DU FRAN{\c{C}}AIS (Abeill{\'e} et al., 2003) et le MODIFIED FRENCH TREEBANK (Schluter {\&} van Genabith, 2007). Confirmant les r{\'e}sultats de (Crabb{\'e} {\&} Candito, 2008), nous montrons que les mod{\`e}les lexicalis{\'e}s, {\`a} travers les mod{\`e}les de Charniak (Charniak, 2000), ceux de Collins (Collins, 1999) et le mod{\`e}le des TIG Stochastiques (Chiang, 2000), pr{\'e}sentent des performances moindres face {\`a} un analyseur PCFG {\`a} Annotation Latente (Petrov et al., 2006). De plus, nous montrons que le choix d{'}un jeu d{'}annotations issus de tel ou tel treebank oriente fortement les r{\'e}sultats d{'}{\'e}valuations tant en constituance qu{'}en d{\'e}pendance non typ{\'e}e. Compar{\'e}s {\`a} (Schluter {\&} van Genabith, 2008; Arun {\&} Keller, 2005), tous nos r{\'e}sultats sont state-of-the-art et infirment l{'}hypoth{\`e}se d{'}une difficult{\'e} particuli{\`e}re qu{'}aurait le fran{\c{c}}ais en terme d{'}analyse syntaxique probabiliste et de sources de donn{\'e}es.",
language = "French",
}
<?xml version="1.0" encoding="UTF-8"?>
<modsCollection xmlns="http://www.loc.gov/mods/v3">
<mods ID="seddah-etal-2009-adaptation">
<titleInfo>
<title>Adaptation de parsers statistiques lexicalisés pour le français : Une évaluation complète sur corpus arborés</title>
</titleInfo>
<name type="personal">
<namePart type="given">Djamé</namePart>
<namePart type="family">Seddah</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Marie</namePart>
<namePart type="family">Candito</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Benoît</namePart>
<namePart type="family">Crabbé</namePart>
<role>
<roleTerm authority="marcrelator" type="text">author</roleTerm>
</role>
</name>
<originInfo>
<dateIssued>2009-06</dateIssued>
</originInfo>
<typeOfResource>text</typeOfResource>
<language>
<languageTerm type="text">French</languageTerm>
<languageTerm type="code" authority="iso639-2b">fre</languageTerm>
</language>
<relatedItem type="host">
<titleInfo>
<title>Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles courts</title>
</titleInfo>
<name type="personal">
<namePart type="given">Adeline</namePart>
<namePart type="family">Nazarenko</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<name type="personal">
<namePart type="given">Thierry</namePart>
<namePart type="family">Poibeau</namePart>
<role>
<roleTerm authority="marcrelator" type="text">editor</roleTerm>
</role>
</name>
<originInfo>
<publisher>ATALA</publisher>
<place>
<placeTerm type="text">Senlis, France</placeTerm>
</place>
</originInfo>
<genre authority="marcgt">conference publication</genre>
</relatedItem>
<abstract>Cet article présente les résultats d’une évaluation exhaustive des principaux analyseurs syntaxiques probabilistes dit “lexicalisés” initialement conçus pour l’anglais, adaptés pour le français et évalués sur le CORPUS ARBORÉ DU FRANÇAIS (Abeillé et al., 2003) et le MODIFIED FRENCH TREEBANK (Schluter & van Genabith, 2007). Confirmant les résultats de (Crabbé & Candito, 2008), nous montrons que les modèles lexicalisés, à travers les modèles de Charniak (Charniak, 2000), ceux de Collins (Collins, 1999) et le modèle des TIG Stochastiques (Chiang, 2000), présentent des performances moindres face à un analyseur PCFG à Annotation Latente (Petrov et al., 2006). De plus, nous montrons que le choix d’un jeu d’annotations issus de tel ou tel treebank oriente fortement les résultats d’évaluations tant en constituance qu’en dépendance non typée. Comparés à (Schluter & van Genabith, 2008; Arun & Keller, 2005), tous nos résultats sont state-of-the-art et infirment l’hypothèse d’une difficulté particulière qu’aurait le français en terme d’analyse syntaxique probabiliste et de sources de données.</abstract>
<identifier type="citekey">seddah-etal-2009-adaptation</identifier>
<location>
<url>https://aclanthology.org/2009.jeptalnrecital-court.1</url>
</location>
<part>
<date>2009-06</date>
<extent unit="page">
<start>1</start>
<end>10</end>
</extent>
</part>
</mods>
</modsCollection>
%0 Conference Proceedings
%T Adaptation de parsers statistiques lexicalisés pour le français : Une évaluation complète sur corpus arborés
%A Seddah, Djamé
%A Candito, Marie
%A Crabbé, Benoît
%Y Nazarenko, Adeline
%Y Poibeau, Thierry
%S Actes de la 16ème conférence sur le Traitement Automatique des Langues Naturelles. Articles courts
%D 2009
%8 June
%I ATALA
%C Senlis, France
%G French
%F seddah-etal-2009-adaptation
%X Cet article présente les résultats d’une évaluation exhaustive des principaux analyseurs syntaxiques probabilistes dit “lexicalisés” initialement conçus pour l’anglais, adaptés pour le français et évalués sur le CORPUS ARBORÉ DU FRANÇAIS (Abeillé et al., 2003) et le MODIFIED FRENCH TREEBANK (Schluter & van Genabith, 2007). Confirmant les résultats de (Crabbé & Candito, 2008), nous montrons que les modèles lexicalisés, à travers les modèles de Charniak (Charniak, 2000), ceux de Collins (Collins, 1999) et le modèle des TIG Stochastiques (Chiang, 2000), présentent des performances moindres face à un analyseur PCFG à Annotation Latente (Petrov et al., 2006). De plus, nous montrons que le choix d’un jeu d’annotations issus de tel ou tel treebank oriente fortement les résultats d’évaluations tant en constituance qu’en dépendance non typée. Comparés à (Schluter & van Genabith, 2008; Arun & Keller, 2005), tous nos résultats sont state-of-the-art et infirment l’hypothèse d’une difficulté particulière qu’aurait le français en terme d’analyse syntaxique probabiliste et de sources de données.
%U https://aclanthology.org/2009.jeptalnrecital-court.1
%P 1-10
Markdown (Informal)
[Adaptation de parsers statistiques lexicalisés pour le français : Une évaluation complète sur corpus arborés](https://aclanthology.org/2009.jeptalnrecital-court.1) (Seddah et al., JEP/TALN/RECITAL 2009)
ACL