Corpus unimodal portugais FASiL “fasil-pt”

Instance of: Dataset
Description Ce corpus a été collecté dans le cadre du projet FASiL, EU FP5 IST-2001-38685 (http://www.fasil.co.uk), pour une expérience en magicien d’oz. Ainsi, il comprend les enregistrements des sujets et du magicien pour un total de 70 sujets. Le corpus est formaté en fichiers .wav (u-law) pour la partie audio, ASCII pour la partie transcriptions (.txt), et un fichier maître relie les .txt et les .wav. Le fichier maître est une sorte de réseau d’interaction temporelle qui contient l’ordre exact des interactions et des mesures de temps. Le fichier maître correspond approximativement au format de réseau HTK-SLF. L’expérience magicien d’oz tient dans l’interaction orale avec un « assistant personnel virtuel » (Virtual Personal Assistent (VPA)) dans une tâche d’email, de gestion de calendrier et de contacts. Les hésitations sont marquées par la balise “UH”, le bruit par la balise “NOISE” et les autres éléments non pertinents par la balise “IRRELEVANT”. Toutes les annotations sont en minuscules, excepté les balises précédemment citées. Une documentation précise de l’expérience est présentée dans le livrable FASiL D.2.2. Les interactions comprennent principalement des phrases mais également des noms épelés, des adresses email, des numéros de téléphone, des questions fermées.
The corpus was collected in the context of the FASiL project, EU FP5 IST-2001-38685 (http://www.fasil.co.uk), as a wizard-of-oz experiment. Therefore, there are sound recordings of subject and wizard. A total of 70 subjects were recorded. The corpus is formatted as .wav files (u-law) for audio, plain ASCII text (.txt) for transcriptions, and a masterfile which binds .txt and .wav together. The masterfile is a “lattice” of the ineraction in time, and contains the exact order of the interaction plus timings. The masterfile is loosely related to the HTK-SLF lattice format. The woz experiment is about the voice interaction with a Virtual Personal Assistent (VPA) for an email, calender and contacts task. Hesitations are marked as “UH”, noise as “NOISE” and other irrelevant stuff as “IRRELEVANT”. All annotations are in lower case, except for the former mentioned cases. Exact documentation of experiment in FASiL deliverable D.2.2 The interactions contain mostly sentences but also spelled names, email addresses, telephone numbers, yes/no questions. S0174-01, S0174-03, S0174-04, and S0174-05.
Language por
Language Portuguese
Rights ELRA_VAR
ELRA_END_USER
See Also http://metashare.elda.org/repository/browse/44e98d30de7411e2b1e400259011f6ea8245a3ca587042069e78640b083d350c/
Source META-SHARE
Title Corpus unimodal portugais FASiL “fasil-pt”
FASiL Portuguese unimodal “fasil-pt” corpus
Type Resource Info
Type Corpus

Contact Point

Communication Info
Address 55-57 rue Brillat-Savarin
City Paris
Country France
Distribution
Access URL http://www.elda.org
Type Distribution
URL
Email mapelli@elda.org
Fax Number +1 43 14 33 30
Telephone Number +1 43 13 33 33
Type Communication Info
Zip Code 75013
Given Name Mapelli
Surname Valérie
Type Contact Person
Person
Person Info Type

Corpus Info

Corpus Audio Info
Audio Size Info
Size Info
Size no size available
Size Unit Other
Type Size Info Type
Type Audio Size Info
Language Info
Language Portuguese
Language por
Language Name Portuguese
Type Language Info
Linguality Info
Linguality Type Monolingual
Type Linguality Info
Media Type Audio
Type Corpus Audio Info
Resource Type Corpus
Type Corpus Info

Distribution Info

Availability Available-restricted Use
Availability Start Date 2005-04-07 Date
License
Membership Info
Member false Boolean
Membership Institution ELRA
Type Membership Info
Permission
Action http://creativecommons.org/ns/Distribution
http://creativecommons.org/ns/CommercialUse
Constraint Metashare/44e98d30de7411e2b1e400259011f6ea8245a3ca587042069e78640b083d350c#permission
Operator Eq
Purpose Academic Use
Type Prohibition
Constraint
Permission
Restrictions Of Use
Same As http://www.elra.info/IMG/pdf_VAR_140312.pdf
Type Licence Info
User Nature Academic
Membership Info
Member true Boolean
Membership Institution ELRA
Type Membership Info
Permission Metashare/44e98d30de7411e2b1e400259011f6ea8245a3ca587042069e78640b083d350c#permission
Same As http://www.elra.info/IMG/pdf_VAR_140312.pdf
Type Licence Info
User Nature Commercial
Membership Info Metashare/44e98d30de7411e2b1e400259011f6ea8245a3ca587042069e78640b083d350c#membership Info2
Permission Metashare/44e98d30de7411e2b1e400259011f6ea8245a3ca587042069e78640b083d350c#permission
Prohibition Metashare/44e98d30de7411e2b1e400259011f6ea8245a3ca587042069e78640b083d350c#permission
Same As http://www.elra.info/IMG/pdf_ENDUSER_140312.pdf
Type Licence Info
User Nature Commercial
Membership Info Metashare/44e98d30de7411e2b1e400259011f6ea8245a3ca587042069e78640b083d350c#membership Info2
Permission Metashare/44e98d30de7411e2b1e400259011f6ea8245a3ca587042069e78640b083d350c#permission
Prohibition Metashare/44e98d30de7411e2b1e400259011f6ea8245a3ca587042069e78640b083d350c#permission
Same As http://www.elra.info/IMG/pdf_ENDUSER_140312.pdf
Type Licence Info
User Nature Academic
Membership Info Metashare/44e98d30de7411e2b1e400259011f6ea8245a3ca587042069e78640b083d350c#membership Info2
Permission Metashare/44e98d30de7411e2b1e400259011f6ea8245a3ca587042069e78640b083d350c#permission
Same As http://www.elra.info/IMG/pdf_VAR_140312.pdf
Type Licence Info
User Nature Academic
Membership Info Metashare/44e98d30de7411e2b1e400259011f6ea8245a3ca587042069e78640b083d350c#membership Info
Permission Metashare/44e98d30de7411e2b1e400259011f6ea8245a3ca587042069e78640b083d350c#permission
Prohibition Metashare/44e98d30de7411e2b1e400259011f6ea8245a3ca587042069e78640b083d350c#permission
Same As http://www.elra.info/IMG/pdf_ENDUSER_140312.pdf
Type Licence Info
User Nature Commercial
Membership Info Metashare/44e98d30de7411e2b1e400259011f6ea8245a3ca587042069e78640b083d350c#membership Info
Permission Metashare/44e98d30de7411e2b1e400259011f6ea8245a3ca587042069e78640b083d350c#permission
Same As http://www.elra.info/IMG/pdf_VAR_140312.pdf
Type Licence Info
User Nature Commercial
Membership Info Metashare/44e98d30de7411e2b1e400259011f6ea8245a3ca587042069e78640b083d350c#membership Info
Permission Metashare/44e98d30de7411e2b1e400259011f6ea8245a3ca587042069e78640b083d350c#permission
Prohibition Metashare/44e98d30de7411e2b1e400259011f6ea8245a3ca587042069e78640b083d350c#permission
Same As http://www.elra.info/IMG/pdf_ENDUSER_140312.pdf
Type Licence Info
User Nature Academic
Type Distribution Info
Distribution

Identification Info

Description The corpus was collected in the context of the FASiL project, EU FP5 IST-2001-38685 (http://www.fasil.co.uk), as a wizard-of-oz experiment. Therefore, there are sound recordings of subject and wizard. A total of 70 subjects were recorded. The corpus is formatted as .wav files (u-law) for audio, plain ASCII text (.txt) for transcriptions, and a masterfile which binds .txt and .wav together. The masterfile is a “lattice” of the ineraction in time, and contains the exact order of the interaction plus timings. The masterfile is loosely related to the HTK-SLF lattice format. The woz experiment is about the voice interaction with a Virtual Personal Assistent (VPA) for an email, calender and contacts task. Hesitations are marked as “UH”, noise as “NOISE” and other irrelevant stuff as “IRRELEVANT”. All annotations are in lower case, except for the former mentioned cases. Exact documentation of experiment in FASiL deliverable D.2.2 The interactions contain mostly sentences but also spelled names, email addresses, telephone numbers, yes/no questions. S0174-01, S0174-03, S0174-04, and S0174-05.
Ce corpus a été collecté dans le cadre du projet FASiL, EU FP5 IST-2001-38685 (http://www.fasil.co.uk), pour une expérience en magicien d’oz. Ainsi, il comprend les enregistrements des sujets et du magicien pour un total de 70 sujets. Le corpus est formaté en fichiers .wav (u-law) pour la partie audio, ASCII pour la partie transcriptions (.txt), et un fichier maître relie les .txt et les .wav. Le fichier maître est une sorte de réseau d’interaction temporelle qui contient l’ordre exact des interactions et des mesures de temps. Le fichier maître correspond approximativement au format de réseau HTK-SLF. L’expérience magicien d’oz tient dans l’interaction orale avec un « assistant personnel virtuel » (Virtual Personal Assistent (VPA)) dans une tâche d’email, de gestion de calendrier et de contacts. Les hésitations sont marquées par la balise “UH”, le bruit par la balise “NOISE” et les autres éléments non pertinents par la balise “IRRELEVANT”. Toutes les annotations sont en minuscules, excepté les balises précédemment citées. Une documentation précise de l’expérience est présentée dans le livrable FASiL D.2.2. Les interactions comprennent principalement des phrases mais également des noms épelés, des adresses email, des numéros de téléphone, des questions fermées.
Distribution
Access URL http://catalog.elra.info/product_info.php?products_id=703
Type Distribution
URL
Identifier ELRA-S0174_02
Meta Share Id NOT_DEFINED_FOR_V2
Resource Short Name fasil-pt
Title FASiL Portuguese unimodal “fasil-pt” corpus
Corpus unimodal portugais FASiL “fasil-pt”
Type Identification Info

Version Info

Has Version 1.0
Modified 2005-04-08 Date
Type Version Info

Metashare/44e98d30de7411e2b1e400259011f6ea8245a3ca587042069e78640b083d350c#metadata Info

Instance of: Catalog Record
Created 2005-05-12 Date
Primary Topic FASiL Portuguese unimodal “fasil-pt” corpus
Type Metadata Info

Metashare/44e98d30de7411e2b1e400259011f6ea8245a3ca587042069e78640b083d350c#Header

Instance of: Catalog Record
Issued 2014-09-23T00:16:07Z Date
Primary Topic FASiL Portuguese unimodal “fasil-pt” corpus
Set Spec corpus:audio
corpus