Instance of: Resource Info
Description A-SpeechDB© is an Arabic speech database suited for training acoustic models for Arabic phoneme-based speaker-independent automatic speech recognition systems. The database contains about 20 hours of continuous speech recorded through one desktop omni microphone by 205 native speakers from Egypt (about 30% of females and 70% of males), aged between 20 and 45. Automatically generated transcriptions are provided with a manually revised version for each sentence. Accuracy: • Detailed speaker information: Age, Accent, place of stay, gender • Recording in office environment • Sentence labeled. • Continuous Speech • Automatic first pass transcription • Manual second pass labeling • Each text prompt is unique, no repeated sentences • Sentences chosen to cover all Arabic phonetics several times Technology: • Automatic transcription using TransArab© • Recording using DBRec© or Validator© • Validation using Validator© Audio: • Sample Rate : 16 KHz • Resolution: 16 bit PCM • Format: MAF (A tool is included to convert the database to WAV format) Text: • Labeled data format: HTK lab format (100 nano-seconds)
A-SpeechDB© est une base de données orale arabe conçue pour entraîner les modèles acoustiques des systèmes de reconnaissance automatique de la parole en arabe, indépendants du locuteur et basés sur les phonèmes. La base de données contient environ 20 heures de parole continue enregistrée sur un microphone de table omni-directionnel par 205 locuteurs égyptiens de langue maternelle arabe (environ 30% de femmes et 70% d’hommes), âgés entre 20 et 45 ans. Les transcriptions générées automatiquement sont fournies avec une version révisée manuellement pour chaque phrase. Niveau de précision: • Information détaillée par locuteur: âge, accent, lieu de résidence, genre • Enregistrement dans un environnement de bureau • Annotation au niveau de la phrase • Parole continue • Transcription automatique (premier passage) • Annotation manuelle (deuxième passage) • Chaque énoncé de texte (prompt) est unique, les phrases ne sont pas répétées • Phrases choisies pour couvrir plusieurs fois l’ensemble de la phonétique arabe Technologie: • Transcription automatique réalisée avec TransArab© • Enregistrements réalisés avec DBRec© ou Validator© • Validation réalisée avec Validator© Audio: • Taux d’échantillonnage: 16 KHz • Résolution: 16 bit PCM • Format: MAF (Un outil est inclus pour convertir la base de données au format WAV) Texte: • Format de données d’annotation: HTK lab (100 nanosecondes)
Language ara
Language Arabic
Rights ELRA_VAR
ELRA_END_USER
See Also http://metashare.elda.org/repository/browse/9d9f4008de7111e2b1e400259011f6ea03e9c52feb8441b9962fcf2c02d87100/
Source META-SHARE
Title A-SpeechDB
A-SpeechDB
Type Dataset
Type Corpus
Is Is Replaced By of A-SpeechDB

Contact Point

Communication Info
Address 55-57 rue Brillat-Savarin
City Paris
Country France
Distribution
Access URL http://www.elda.org
Type Distribution
URL
Email mapelli@elda.org
Fax Number +1 43 14 33 30
Telephone Number +1 43 13 33 33
Type Communication Info
Zip Code 75013
Given Name Mapelli
Surname Valérie
Type Contact Person
Person
Person Info Type

Corpus Info

Corpus Audio Info
Audio Size Info
Size Info
Size no size available
Size Unit Other
Type Size Info Type
Type Audio Size Info
Creation Info
Creation Mode Mixed
Type Creation Info
Language Info
Language Arabic
Language ara
Language Name Arabic
Type Language Info
Linguality Info
Linguality Type Monolingual
Type Linguality Info
Media Type Audio
Type Corpus Audio Info
Resource Type Corpus
Type Corpus Info

Distribution Info

Availability Available-restricted Use
Availability Start Date 2011-04-27 Date
License
Membership Info
Member true Boolean
Membership Institution ELRA
Type Membership Info
Permission
Action http://creativecommons.org/ns/Distribution
http://creativecommons.org/ns/CommercialUse
Constraint Metashare/9d9f4008de7111e2b1e400259011f6ea03e9c52feb8441b9962fcf2c02d87100#permission
Operator Eq
Purpose Academic Use
Type Prohibition
Constraint
Permission
Restrictions Of Use
Same As http://www.elra.info/IMG/pdf_VAR_140312.pdf
Type Licence Info
User Nature Commercial
Membership Info
Member false Boolean
Membership Institution ELRA
Type Membership Info
Permission Metashare/9d9f4008de7111e2b1e400259011f6ea03e9c52feb8441b9962fcf2c02d87100#permission
Prohibition Metashare/9d9f4008de7111e2b1e400259011f6ea03e9c52feb8441b9962fcf2c02d87100#permission
Same As http://www.elra.info/IMG/pdf_ENDUSER_140312.pdf
Type Licence Info
User Nature Commercial
Membership Info Metashare/9d9f4008de7111e2b1e400259011f6ea03e9c52feb8441b9962fcf2c02d87100#membership Info2
Permission Metashare/9d9f4008de7111e2b1e400259011f6ea03e9c52feb8441b9962fcf2c02d87100#permission
Prohibition Metashare/9d9f4008de7111e2b1e400259011f6ea03e9c52feb8441b9962fcf2c02d87100#permission
Same As http://www.elra.info/IMG/pdf_ENDUSER_140312.pdf
Type Licence Info
User Nature Commercial
Membership Info Metashare/9d9f4008de7111e2b1e400259011f6ea03e9c52feb8441b9962fcf2c02d87100#membership Info2
Permission Metashare/9d9f4008de7111e2b1e400259011f6ea03e9c52feb8441b9962fcf2c02d87100#permission
Same As http://www.elra.info/IMG/pdf_VAR_140312.pdf
Type Licence Info
User Nature Academic
Membership Info Metashare/9d9f4008de7111e2b1e400259011f6ea03e9c52feb8441b9962fcf2c02d87100#membership Info2
Permission Metashare/9d9f4008de7111e2b1e400259011f6ea03e9c52feb8441b9962fcf2c02d87100#permission
Prohibition Metashare/9d9f4008de7111e2b1e400259011f6ea03e9c52feb8441b9962fcf2c02d87100#permission
Same As http://www.elra.info/IMG/pdf_ENDUSER_140312.pdf
Type Licence Info
User Nature Academic
Membership Info Metashare/9d9f4008de7111e2b1e400259011f6ea03e9c52feb8441b9962fcf2c02d87100#membership Info
Permission Metashare/9d9f4008de7111e2b1e400259011f6ea03e9c52feb8441b9962fcf2c02d87100#permission
Same As http://www.elra.info/IMG/pdf_VAR_140312.pdf
Type Licence Info
User Nature Commercial
Membership Info Metashare/9d9f4008de7111e2b1e400259011f6ea03e9c52feb8441b9962fcf2c02d87100#membership Info
Permission Metashare/9d9f4008de7111e2b1e400259011f6ea03e9c52feb8441b9962fcf2c02d87100#permission
Same As http://www.elra.info/IMG/pdf_VAR_140312.pdf
Type Licence Info
User Nature Academic
Membership Info Metashare/9d9f4008de7111e2b1e400259011f6ea03e9c52feb8441b9962fcf2c02d87100#membership Info
Permission Metashare/9d9f4008de7111e2b1e400259011f6ea03e9c52feb8441b9962fcf2c02d87100#permission
Prohibition Metashare/9d9f4008de7111e2b1e400259011f6ea03e9c52feb8441b9962fcf2c02d87100#permission
Same As http://www.elra.info/IMG/pdf_ENDUSER_140312.pdf
Type Licence Info
User Nature Academic
Type Distribution Info
Distribution

Identification Info

Description A-SpeechDB© is an Arabic speech database suited for training acoustic models for Arabic phoneme-based speaker-independent automatic speech recognition systems. The database contains about 20 hours of continuous speech recorded through one desktop omni microphone by 205 native speakers from Egypt (about 30% of females and 70% of males), aged between 20 and 45. Automatically generated transcriptions are provided with a manually revised version for each sentence. Accuracy: • Detailed speaker information: Age, Accent, place of stay, gender • Recording in office environment • Sentence labeled. • Continuous Speech • Automatic first pass transcription • Manual second pass labeling • Each text prompt is unique, no repeated sentences • Sentences chosen to cover all Arabic phonetics several times Technology: • Automatic transcription using TransArab© • Recording using DBRec© or Validator© • Validation using Validator© Audio: • Sample Rate : 16 KHz • Resolution: 16 bit PCM • Format: MAF (A tool is included to convert the database to WAV format) Text: • Labeled data format: HTK lab format (100 nano-seconds)
A-SpeechDB© est une base de données orale arabe conçue pour entraîner les modèles acoustiques des systèmes de reconnaissance automatique de la parole en arabe, indépendants du locuteur et basés sur les phonèmes. La base de données contient environ 20 heures de parole continue enregistrée sur un microphone de table omni-directionnel par 205 locuteurs égyptiens de langue maternelle arabe (environ 30% de femmes et 70% d’hommes), âgés entre 20 et 45 ans. Les transcriptions générées automatiquement sont fournies avec une version révisée manuellement pour chaque phrase. Niveau de précision: • Information détaillée par locuteur: âge, accent, lieu de résidence, genre • Enregistrement dans un environnement de bureau • Annotation au niveau de la phrase • Parole continue • Transcription automatique (premier passage) • Annotation manuelle (deuxième passage) • Chaque énoncé de texte (prompt) est unique, les phrases ne sont pas répétées • Phrases choisies pour couvrir plusieurs fois l’ensemble de la phonétique arabe Technologie: • Transcription automatique réalisée avec TransArab© • Enregistrements réalisés avec DBRec© ou Validator© • Validation réalisée avec Validator© Audio: • Taux d’échantillonnage: 16 KHz • Résolution: 16 bit PCM • Format: MAF (Un outil est inclus pour convertir la base de données au format WAV) Texte: • Format de données d’annotation: HTK lab (100 nanosecondes)
Distribution
Access URL http://catalog.elra.info/product_info.php?products_id=1140
Type Distribution
URL
Identifier ELRA-S0315
Meta Share Id NOT_DEFINED_FOR_V2
Title A-SpeechDB
A-SpeechDB
Type Identification Info

Usage Info

Actual Use Info
Actual Use Nlp Applications
Type Actual Use Info
Use NLPSpecific Speech Recognition
Type Usage Info

Validation Info

Type Validation Info
Validated true Boolean
Validation Mode Details Validation using Validator©

Version Info

Has Version 1.0
Modified 2012-08-02 Date
Type Version Info

Metashare/9d9f4008de7111e2b1e400259011f6ea03e9c52feb8441b9962fcf2c02d87100#Header

Instance of: Catalog Record
Issued 2014-09-23T00:16:10Z Date
Primary Topic A-SpeechDB
Set Spec corpus:audio
corpus

Metashare/9d9f4008de7111e2b1e400259011f6ea03e9c52feb8441b9962fcf2c02d87100#metadata Info

Instance of: Catalog Record
Created 2005-05-12 Date
Primary Topic A-SpeechDB
Type Metadata Info