beandeau>

Ateliers

Des ateliers de formation sont proposés le mardi 21 octobre matin de 9h30 à 12h30 avant le début du colloque.

Ils sont gratuits et ouverts à tous les participants mais l'inscription est obligatoire par mail à l'adresse jlc2025@sciencesconf.org, en précisant l'atelier choisi, votre inscription vous engage le nombre de places étant limité.

Nous remercions chaleureusement les collègues qui organisent ces ateliers.

NB : les ateliers se dérouleront en langue française.

  • AVAA Toolkit : une boîte à outils pour accompagner l’analyse des interactions à partir de corpus multimodaux   
  • Collecte et traitement vidéo qui se décompose en 2 ateliers indépendants mais complémentaires, vous pouvez n'assister qu'à l'un d'eux
    • Collecte (9h30 à 11h) : materiel audiovisuel, points de vue, quels paramètres utiliser, stockage et rgpd
    • Traitement  (11h à 12h30) : import, stockage, montage, synchronisation, anonymisation, transcription automatique
  • CORLI CORPUCIT : Un outil web pour créer des citations pérennes d'extraits de corpus ou de textes et les insérer dans vos articles scientifiques et livres au format PDF.
  • TXM débutant corpus écrits
  • TXM débutant corpus oraux

==============================================================================

AVAA Toolkit : une boîte à outils pour accompagner l’analyse des interactions à partir de corpus multimodaux 

Introduction

Le logiciel AVAA Toolkit (Audio and Video Annotations Analysis Toolkit) offre de nombreuses fonctionnalités pour l’analyse des interactions. Il peut être mobilisé à différentes étapes du processus de recherche à partir de corpus de données audiovisuelles annotées : traitement, fouille, visualisation de données, mais aussi processus d’annotation lui-même avec une procédure d’intercodage permettant la construction collaborative des items de codage.

Animatrice

Clotilde George (Université de Lorraine, chercheuse en sciences du langage, membre associée à l’ATILF)

Sujet & Objectif

Prise en main du logiciel AVAA Toolkit, adapté à l’analyse de corpus audiovisuels annotés (notamment avec ELAN). Réalisation de collections de données primaires et secondaires combinées/

Ressources & Prérequis

Logiciel : www.avaa-toolkit.org

Présentation rapide : https://avaa-toolkit.org/features/

Documentation : https://avaa-toolkit.org/documentation

Les participant·es doivent disposer d’un corpus d’annotations alignées avec le signal (formats eaf, azp, cha, textgrid…).

Modalités

Durée : 3h

Nombre de participant·es : 10 maximum

Pré-installation du logiciel : oui (www.avaa-toolkit.org). Veuillez contacter dev@avaa-toolkit.org  en cas de difficulté d’installation.

  ===========================================================================================

Collecte de données audiovisuelles

Introduction

La production et le traitement des corpus implique des réflexions méthodologiques, des connaissances techniques et des enjeux juridiques et éthiques. Nous verrons ensemble les différents matériels d’enregistrement vidéo mais aussi audio. Quels matériels peut-on utiliser selon son terrain et ses questions de recherche ? En plus des traditionnels camescopes et micros-cravates, nous verrons des matériels tels que camera 360°, caméra subjective ou encore camera action.

Animation
Justine Lascar, ingénieure de recherche CNRS au laboratoire ICAR, responsable de la cellule Corpus Ingénierie Audiovisuelle (CIA)

Léa Mouton, assistante ingénieure CNRS au laboratoire ICAR, membre de la cellule Corpus Ingénierie Audiovisuelle (CIA)


Ressources & Prérequis
Pas d'installation logicielle nécessaire
Page de la CIA https://icar.cnrs.fr/recherche/services/

Modalités
Durée : 1h30, 9h30-11h
Nombre de participant·es : 10 maximum

==

Traitement des données audiovisuelles

Introduction
Nous aborderons la question des formats, du montage et de l’export des matériaux audiovisuels. Nous réaliserons toute la chaine de traitement depuis l’import jusqu’à l’export de fichiers synchronisés.  Puis, nous réaliserons les transcriptions automatiques des fichiers audiovisuels selon plusieurs méthodes.

Animation
Justine Lascar, ingénieure de recherche CNRS au laboratoire ICAR, responsable de la cellule Corpus Ingénierie Audiovisuelle (CIA)

Léa Mouton, assistante ingénieure CNRS au laboratoire ICAR, membre de la cellule Corpus Ingénierie Audiovisuelle (CIA)


Ressources & Prérequis
Pas d'installation logicielle nécessaire
Page de la CIA https://icar.cnrs.fr/recherche/services/

Modalités
Durée : 1h30, 11h-12h30
Nombre de participant·es : 10 maximum

============================================================================================

CORLI CORPUCIT : Un outil web pour créer des citations pérennes d'extraits de corpus ou de textes et les insérer dans vos articles scientifiques et livres au format PDF.

Introduction
Le développement de la publication électronique permet d'enrichir très largement la citation d'extrait de langage ou de corpus. On peut utiliser de multiples formats et présentations, mettre du son, de l'image, de la vidéo. Mais ces présentations sont éphémères à la différence du support papier.
CORPUCIT est un outil qui permet de créer des citations d'extraits de corpus ou de texte, pérennisées sur NAKALA, insérées dans vos articles ou ouvrages, et qui font référence aux corpus ou sources originales. Les citations étant électroniques, il n'y a pas de limite de format.
CORPUCIT permet de favoriser la science ouverte, la reproduction des travaux scientifiques par la pérennité des données décrites. Il permet aussi de faire connaître l'usage des corpus sur Internet.

Animation
Christophe Parisse (CORLI & Modyco - CNRS & Université Paris Nanterre)
Driss Sadoun (PostLab & ERTIM/INALCO )

Sujet & Objectif
Prise en main du site CORPUCIT, insérer des citations dans des documents électroniques.

Ressources & Prérequis
Un navigateur web connecté.
Un outil d'édition de texte (LibreOffice, Latex, ou Microsoft Word par exemple).

Modalités
Durée : 3h, 9h30-12h30
Nombre de participant·es : 20 maximum

=============================================================================================

 TXM débutant (corpus écrits)

Introduction

TXM est un logiciel permettant d'effectuer des recherches dans des corpus, et d'en extraire des concordances et des statistiques.
La formation est destinée à des débutants, et sera composée de deux volets.

1. Importer un corpus
On verra comment organiser et importer vos corpus. Des corpus de démo seront fournis, mais vous pouvez aussi venir avec votre propre corpus (texte brut, XML − mais *pas* PDF), et on verra ce qu'on peut faire... Si vous venez avec votre propre corpus, il faudra me l'envoyer quelques jours avant la formation.

2. Recherche dans un corpus
On verra comment explorer le corpus, et faire des recherches dedans en utilisant le langage de requête CQL (aussi utilisé par d'autres logiciels).

Animation

Achille Falaise, Laboratoire de Linguistique Formelle  (LLF - UMR7110)

Prérequis
Vous devez avoir un ordinateur avec TXM installé dessus. Vous pouvez télécharger TXM ici: https://txm.gitpages.huma-num.fr/textometrie/files/software/TXM/0.8.4/ . Il n'est pas nécessaire d'avoir la dernière version. Assurez-vous toutefois que TXM démarre bien ! Je ne pourrai pas faire de support technique pendant la formation.
On utilisera aussi un éditeur de texte brut (https://www.sublimetext.com/ est recommandé) et un tableur (https://fr.libreoffice.org/download/telecharger-libreoffice/ est recommandé − attention, Excel est aussi un tableur, mais pose souvent plein de problèmes pour l'usage qu'on en aura).

Modalités
Durée: 3h, max 15 personnes

===============================================================================================

 Description de l'atelier TXM débutants (corpus oraux)  à venir ...

Chargement... Chargement...