Conference Programme - Day 2

Document sans nom

Day 2

Thursday, 14 May, 2026

09:00 - 10:40

Session O13: Digital Humanities and Related Corpora - Room 1

09:00 - 09:20

ATLAS: Article Tracking, Linking, and Analysis of Swedish Encyclopedias
Albin Andersson, Salam Jonasson, Fredrik Wastring, Pierre Nugues
Lund University

09:20 - 09:40

Evaluating Embedding Models on Danish Historical Newspapers: A Corpus and Benchmark Resource
Alie Lassche¹, Pascale Feldkamp¹, Yuri Bizzoni², Katrine Baunvig³, Kristoffer Nielbo¹, Johan Heinsen⁴
¹Center for Humanities Computing, Aarhus University, ²Aarhus University, ³Center for Grundtvig Studies, Aarhus University, ⁴Aalborg University

09:40 - 10:00

Leveraging Linguistic Similarity for Low-Resource Speech Transcription
Valentina Fedchenko¹ and Eric Jordan²
¹ERTIM, ²LACITO

10:00 - 10:20

A Corpus of Persuasion Techniques in Slavic Languages
Jakub Piskorski¹, Dimitar Dimitrov², Marina Ernst³, Jacek Haneczok⁴, Michal Marcinczuk⁵, Arkadiusz Modzelewski⁶, Roman Yangarber⁷
¹Polish Academy of Sciences, ²University of Sofia "St. Kliment Ohridski", ³University of Koblenz, ⁴Erste Group IT, ⁵CodeNLP, ⁶Polish-Japanese Academy of Information Technology, ⁷University of Helsinki

10:20 - 10:40

GePaDeSE: A New Resource for Clause-Level Aspect in German Parliamentary Debates
Julian Schlenker¹, Ines Rehbein¹, Lilly Brauner², Florian Ertz³, Ines Reinig⁴, Simone Paolo Ponzetto¹
¹University of Mannheim, ²University of Heidelberg, ³University of Göttingen, ⁴Mannheim University

09:00 - 10:40

Session O14: Lexicon - Room 2

09:00 - 09:20

FrameNet Semantic Role Classification by Analogy
Van Duy Ngo¹, Stergos Afantenos², Emiliano Lorini³, Miguel Couceiro⁴
¹IRIT, University of Toulouse, ²IRIT and CNRS, University of Toulouse, ³RIT and CNRS, University of Toulouse, ⁴University of Lorraine, CNRS, Loria

09:20 - 09:40

CEFR-Annotated WordNet: LLM-Based Proficiency-Guided Semantic Database for Language Learning
Masato Kikuchi¹, Masatsugu Ono², Toshioki Soga³, Tetsu Tanabe⁴, Tadachika Ozono¹
¹Nagoya Institute of Technology, ²Kitami Institute of Technology, ³Chitose Institute of Science and Technology, ⁴Hokkaido University

09:40 - 10:00

Towards a Gold Standard for Adjectival Hypernymy: Enriching the Open English WordNet with a Hybrid Approach
Lorenzo Augello¹, John P. McCrae², Marco Passarotti³
¹Università Cattolica del Sacro Cuore, Milan, Italy, ²Insight Center for Data Analytics, National University of Ireland Galway, ³Università Cattolica del Sacro Cuore

10:00 - 10:20

PREMOVE in LiLa: Integrating Latin Preverbed Motion Verbs with WordNet and VerbNet
Andrea Farina¹, Marco Passarotti², Francesco Mambrini², Matteo Pellegrini³, Eleonora Litta⁴, Giovanni Moretti²
¹King's College London, ²Università Cattolica del Sacro Cuore, ³University of Surrey, ⁴Università Cattolica del Sacro Cuore, Milano

10:20 - 10:40

From Incidents to Framing: A Dutch and English Frame-semantic Corpus and Lexicon
Piek Vossen, Pia Sommerauer, Levi Remijnse
Vrije Universiteit Amsterdam

09:00 - 10:40

Session O15: Multilinguality, Machine Translation - Room 3

09:00 - 09:20

AI Safety Lost in Translation: Evaluating the Effectiveness of English-Italian Cross-Lingual LLM Safety Alignment
Alessio Wu¹ and Martim Brandao²
¹King's College London, ²Waseda University

09:20 - 09:40

Semantic Label Drift in Cross-Cultural Translation
Mohsinul Kabir¹, Tasnim Ahmed², Md Mezbaur Rahman³, Polydoros Giannouris¹, Sophia Ananiadou¹
¹University of Manchester, ²Queen's University, ³University of Illinois Chicago

09:40 - 10:00

Chain-of-Thought Reasoning Improves Context-Aware Translation with Large Language Models
Shabnam Ataee, Hugo Huart, Andrei Popescu-Belis
HEIG-VD / HES-SO

10:00 - 10:20

Adja-French Parallel Corpus: A New Resource for Machine Translation of a West African Under-Resourced Language
Josue Godeme and Rolando Coto-Solano
Dartmouth College

10:20 - 10:40

Goldfish: Monolingual Language Models for 350 Languages
Tyler Chang¹, Catherine Arnett², Zhuowen Tu¹, Benjamin Bergen¹
¹UC San Diego, ²EleutherAI

09:00 - 10:40

Session O16: Natural Language Generation and Summarization - Room 4

09:00 - 09:20

Dynaword: From One-shot to Continuously Developed Datasets
Kenneth Enevoldsen¹, Kristian Jensen², Jan Kostkan¹, Balázs Szabó¹, Márton Kardos¹, Kirsten Vad¹, Johan Heinsen¹, Andrea Núñez³, Gianluca Barmina³, Jacob Nielsen³, Rasmus Larsen², Rob van der Goot⁴, Peter Vahlstrup¹, Per Dalum¹, Desmond Elliott⁵, Lukas Poech³, Peter Schneider-Kamp³, Kristoffer Nielbo⁶
¹Aarhus University, ²The Alexandra Institute, ³University of Southern Denmark, ⁴IT University of Copenhagen, ⁵University of Copenhagen, ⁶Center for Humanities Computing, Aarhus University

09:20 - 09:40

From Bones to Rocks: A Systematic Evaluation of Specialized Definition Generation for Portuguese
Rafael Oleques Nunes, Dennis Giovani Balreira, Joel Luís Carbonera
UFRGS

09:40 - 10:00

Beyond Lemmas and Syntax: Comparing Human and LLM-Generated Scientific Abstracts
Sergei Bagdasarov and Diego Alves
Saarland University

10:00 - 10:20

Systematic Multi-Aspect Evaluation of Time Series-Based Report Generation: The Case of Financial Analysis from Stock Data
Elizabeth Fons¹, Elena Kochkina², Rachneet Kaur³, Zhen Zeng⁴, Berowne Hlavaty⁵, Charese Smiley⁶, Svitlana Vyetrenko⁷, Manuela Veloso²
¹J.P. Morgan AI Research, ²JPMorgan Chase, ³J.P. Morgan Chase, ⁴JP Morgan Chase, ⁵J.P Morgan Chase, ⁶JPMorgan AI Research, ⁷J.P Morgan AI Research

10:20 - 10:40

Bangla Key2Text: Text Generation from Keywords for a Low Resource Language
Tonmoy Talukder¹ and G M Shahariar²
¹Ahsanullah University of Science and Technology, ²University of California, Riverside

09:00 - 10:40

Session P4.1.1: Bias, Offensive Content, Guardrails I - Poster Area

Towards Reliable AI Fairness: Challenges in Implementing Neuron Steering for Bias Mitigation
Ismael Garrido-Munoz¹, Arturo Montejo-Raez¹, Fernando Martínez-Santiago²
¹Universidad de Jaen, ²University of Jaén at Spain

From Body to Mind: Analyzing Gender Representation in Spanish Generative Language Models
Ismael Garrido-Munoz¹, Fernando Martínez-Santiago², Arturo Montejo-Raez¹
¹Universidad de Jaen, ²University of Jaén at Spain

Incivility and Rigidity: Evaluating the Risks of Fine-Tuning LLMs for Political Argumentation
Svetlana Churina and Kokil Jaidka
National University of Singapore

EsBBQ and CaBBQ: The Spanish and Catalan Bias Benchmarks for Question Answering
Valle Ruiz-Fernández¹, Mario Mina², Júlia Falcão², Luis Antonio Vasquez Reina², Anna Salles², Aitor Gonzalez-Agirre¹, Olatz Perez-de-Viñaspre³
¹Barcelona Supercomputing Center (BSC), ²Barcelona Supercomputing Center, ³HiTZ Center - Ixa, University of the Basque Country UPV/EHU

ToxSyn-PT: A Synthetic Fine-Grained Dataset of Minority-Targeted Toxic Language in Portuguese
Iago Brito¹, Julia Dollis², Fernanda Farber³, diogo fernandes⁴, Arlindo Galvão Filho⁵
¹Ceia NLP - UFG, ²CEIA - NLP, ³AKCIT, ⁴federal university of goias, ⁵Federal University of Goiás

A Benchmark for Testing Robustness under Controlled Reference Bias in MT
Ahrii Kim¹ and Seong-heum Kim²
¹None, ²Soongsil University

AnswerCarefully: Creating a Dataset for LLM Safety in Japanese
Hisami Suzuki¹, Satoru Katsumata², Takashi Kodama¹, Tetsuro Takahashi³, Kouta Nakayama¹, Satoshi Sekine⁴
¹National Institute of Informatics, ²Retrieva, Inc., ³Kagoshima University, ⁴NII, LLMC

A Dutch Benchmark to Assess Social Bias in LLMs within a Hiring Decision Setting
Renate Burema¹, Anne Schuth², Christopher Spelt³, Dong Nguyen⁴
¹Ministry of the Interior and Kingdom Relations, ²DPG Media, ³Rijksoverheid, ⁴Utrecht University

PBBQ: A Persian Bias Benchmark Dataset Curated with Human-AI Collaboration for Large Language Models
Farhan Farsi¹, Shayan Bali², Fatemeh Valeh³, Parsa Ghofrani¹, Alireza Pakniat¹, Seyedkian Kashfipour⁴, Amir H. Payberah⁵
¹Amirkabir University of technology, ²King's College London, ³Amirkabir University of Technology (Tehran Polytechnic), ⁴Graduate Student, ⁵KTH Royal Institute of Technology

Contextualizing Toxicity: An Annotation Framework for Unveiling Pragmatics in Conversations of Online Discussion Forums
Yingxue Fu¹ and Anais Ollagnier²
¹Centre Inria d'University Cote d'Azur, ²Universite Cote d'Azur, Inria, CNRS, I3S

How Far Can Bias Go? Tracing Bias from Pre-Training Data to Alignment
Marion Thaler¹, Abdullatif Köksal², Alina Leidinger³, Anna Anna Korhonen⁴, Hinrich Schütze²
¹Ludwig-Maximilians-Universität München, ²CIS, LMU Munich, ³ILLC, University of Amsterdam, ⁴Language Technology Lab, University of Cambridge

09:00 - 10:40

Session P4.1.2: Bias, Offensive Content, Guardrails II - Poster Area

Robust Bias Evaluation with FilBBQ: A Filipino Bias Benchmark for Question-Answering Language Models
Lance Calvin Gamboa, Yue Feng, Mark Lee
University of Birmingham

Uncovering Hidden Violent Tendencies in LLMs: A Demographic Analysis via Behavioral Vignettes
Quintin Myers¹ and Yanjun Gao²
¹University of Colorado Anschutz, ²University of Colorado

Exploring Social Bias in Slovenia: The EEC-SL Dataset
Jaya Caporusso¹, Damar Hoogland², Boshko Koloski³, Matthew Purver⁴, Senja Pollak¹, pela Vintar¹
¹Joef Stefan Institute, ²Newcastle University, ³Jozef Stefan Institute, ⁴Queen Mary University of London

The MISOMEM-Val Dataset for Identifying Human Values in Misogynistic Memes
Rakshitha Rao Ailneni and Sanda Harabagiu
University of Texas at Dallas

ConGA: Guidelines for Contextual Gender Annotation. a Framework for Annotating Gender in Machine Translation
Argentina Rescigno¹, Eva Vanmassenhove², Johanna Monti³
¹University of Pisa, ²Tilburg University, ³"L'Orientale" University of Naples

University Speaking for Everyone: Assessing Changes in Italian Higher Education Statutes toward Gender-Inclusive Language
Sebastiano Vecellio Salto¹, Camilla Casula², Alessio Palmero Aprosio³, Sara Tonelli⁴
¹Fondazione Bruno Kessler, ²University of Trento / Fondazione Bruno Kessler, ³University of Trento, ⁴FBK

Breaking the Benchmark: Revealing LLM Bias via Minimal Contextual Augmentation
Kaveh Eskandari Miandoab¹, Mahammed Kamruzzaman², Arshia Gharooni³, Gene Kim², Vasanth Sarathy¹, Ninareh Mehrabi⁴
¹Tufts University, ²University of South Florida, ³Independent researcher, ⁴Meta

TryggLLM: A Benchmark for Evaluating LLM Safety in Norwegian
Samia Touileb, Truls Pedersen, Isabell Haugen
University of Bergen

KOCOH: Korean Context-Dependent Hate Speech Dataset
Eunah Park and Sanghoun Song
Korea University

Towards Fair Speech Recognition: Mitigating Demographic Bias in End-to-End ASR Systems
Maliha Jahan¹, Thomas Thebaud¹, Zsuzsanna Fagyal², Jesus Villalba¹, Mark Hasegawa-Johnson³, Laureano Moro Velazquez¹, Najim Dehak¹
¹Johns Hopkins University, ²University of Illinois Urbana-Champaign, ³University of Illinois

09:00 - 10:40

Session P4.2.1: Evaluation, Validation I - Poster Area

RuBIN: A Russian Benchmark for Evaluating LLMs with Cultural Insights
Polina Lazukova and Irina Piontkovskaya
Huawei Noah's Ark Lab

Evaluating Phonetically Weighted and Unweighted Distance Measures in Dialectometry
Alfred Lameli
Research Center Deutscher Sprachatlas

Piecing Together Cross-Document Coreference Resolution Datasets: Systematic Dataset Analysis and Unification
Anastasia Zhukova¹, Terry Lima Ruas², Jan Philip Wahle³, Bela Gipp¹
¹University of Goettingen, ²University of Gottingen, ³University of Göttingen

Spotlights and Blindspots: Evaluating Machine-Generated Text Detection
Kevin Stowe¹ and Kailash Patil²
¹Educational Testing Services (ETS), ²Pindrop

JAPAS: A Benchmark and Neural Approach for Japanese Patent Support Relation Extraction
Katsuki Chousa¹ and Ryosuke Sugiura²
¹NTT, ²NTT, inc.

A Teacher-Student Approach to Creating Verified Synthetic Clarification and Correction Dialogues for TableQA Tasks
Christian Poelitz¹ and Nick McKenna²
¹Microsoft Research, ²GitHub Applied Science

Persona-Aware Evaluation of Cognitive Bias in LLMs: From Benchmark to Applied Decision-Making
Katsumasa Yoshikawa¹, Junya Takayama², Takato Yamazaki³
¹Dai-ichi Life Holdings, Inc., ²SB Intuitions, ³SB Intuitions Corporation

ArtistMus: A Globally Diverse, Artist-Centric Benchmark for Retrieval-Augmented Music Question Answering
Daeyong Kwon, SeungHeon Doh, Juhan Nam
KAIST

MATA (??? ): Mindful Assessment of the Telugu Abilities of Large Language Models
Chalamalasetti Kranti¹ and Sowmya Vajjala²
¹University of Potsdam, ²National Research Council

Estonian Native Large Language Model Benchmark
Helena Grete Lillepalu and Tanel Alumäe
Tallinn University of Technology

Indirect Question Answering in English, German and Bavarian: A Challenging Task for High- and Low-Resource Languages Alike
Miriam Winkler, Verena Blaschke, Barbara Plank
LMU Munich

Benchmarking Large Language Models for Chinese and Japanese IMEs: Phonetic-to-Character Generation and Textual Error Correction
Yuchun Zou¹, Tedd Lee², Xiaodi Fan³, Jun Li⁴
¹CUNY Graduate Center, ²CUNY Hunter College, ³Meta Inc., ⁴CUNY Queens College and Graduate Center

DaLA: Danish Linguistic Acceptability Evaluation Guided by Real World Errors
Gianluca Barmina¹, Nathalie Norman², Peter Schneider-Kamp¹, Lukas Poech¹
¹University of Southern Denmark, ²University of Copenhagen

KCIF: Knowledge-Conditioned Instruction Following
Rudra Murthy¹, Praveen Venkateswaran¹, Prince Kumar¹, Danish Contractor²
¹IBM, ²IBM Research IBM Research

GAIN: A Benchmark for Goal-Aligned Decision-Making of Large Language Models under Imperfect Norms
Masayuki Kawarada¹, Kodai Watanabe², Soichiro Murakami³
¹CyberAgent/National Institute of Advanced Industrial Science and Technology, ²CyberAgent,Inc., ³CyberAgent, Inc.

Can LLMs Evaluate What They Cannot Annotate? Revisiting LLM Reliability in Hate Speech Detection
Paloma Piot¹, David Otero², Patricia Martin-Rodilla³, Javier Parapar²
¹Universidade da Coruna, ²Universidade da Coruña, ³IEGPS

09:00 - 10:40

Session P4.2.2: Evaluation, Validation II - Poster Area

PersianMedQA: Evaluating Large Language Models on a Persian-English Bilingual Medical Question Answering Benchmark
Mohammad Javad Ranjbar Kalahroodi¹, Amirhossein Sheikholselami¹, Sepehr Karimi Arpanahi¹, Sepideh Ranjbar Kalahroodi², Heshaam Faili¹, Azadeh Shakery¹
¹University of Tehran, ²Shahid Beheshti University of Medical Sciences

HatePrototypes: Interpretable and Transferable Representations for Implicit and Explicit Hate Speech Detection
Irina Proskurina¹, Marc-Antoine Carpentier², Julien Velcin³
¹Laboratoire Hubert Curien, UMR CNRS 5516, Saint-Etienne, France, Université Claude Bernard Lyon 1, Université Lumière Lyon 2, ERIC, 69100, Villeurbanne, France, ²École centrale de Lyon, ³Ecole Centrale de Lyon, LIRIS CNRS UMR 5205, France

Investigating Memorization in Language Models Trained via Knowledge Distillation
Maarten Mäcking¹ and Michaela Regneri²
¹University of Hamburg, ²Universität Hamburg

Redefining Evaluation Standards: A Unified Framework for Evaluating the Korean Capabilities of Language Models
Hanwool Lee¹, Dasol Choi², Sooyong Kim³, Ilgyun Jung⁴, Sangwon Baek⁵, Guijin Son², Inseong Hwang⁶, Naeun Lee³, Seunghyeok Hong⁷
¹Shinhan Securities, ²Yonsei University, ³MODULABS, ⁴Korea University, ⁵Catius, ⁶Seoul National University of Science and Technology, ⁷Hankuk University of Foreign Studies

Cross-Lingual Stability and Bias in Instruction-Tuned Language Models for Humanitarian NLP
Poli Nemkova¹, Amrit Adhikari¹, Matthew Pearson², Vamsi Krishna Sadu¹, Albert Mark¹
¹University of North Texas, ²Davidson College

Counting on Consensus: Selecting the Right IAA Metric for NLP Annotation and Evaluation
Joseph James
University of Sheffield

Quadratic Weighted Kappa Is Not Enough for Evaluating Automated Essay Scoring Models
Salam Albatarni and Tamer Elsayed
Qatar University

Evaluating the Homogeneity of Keyphrase Prediction Models
Mael Houbre¹, Florian Boudin², Beatrice Daille³
¹Ministerial Agency of Artificial Intelligence in Defense, ²Nantes University, ³Nantes Université- LS2N

A Taxonomy of Safety: Harmonizing LLM Benchmarks in a Fragmented Landscape
Shadi Rastegar¹, Viktor Hangya², Fabian Kuech², Darina Gold²
¹IIS Fraunhofer, ²Fraunhofer IIS

Consistency of LLMs to Comparative Statements in Mathematical Reasoning Tasks
Aidan San¹, Daniel Son¹, Xiaodong Liu², Yangfeng Ji¹
¹University of Virginia, ²Microsoft Research

PersianAnonymizer: Evaluating LLM-Labeled Training for Efficient NER-based Anonymization in Persian
Mohammad Hossein Shalchian¹, Mostafa Amiri², Amir Mahdi Sadeghzadeh¹
¹Sharif University of Technology, ²University of Tehran

How Many Samples Do We Need? A Toolkit for Power-Aware Evaluation Design
Angelo Basile¹, Areg Mikael Sarvazyan², José González³
¹Universitat Politecnica de Valencia, ²Symanto Research, ³TransPerfect

Of Words and Meaning: A Grammatical and Semantic Benchmark for Faroese LLM Understanding
Iben Debess¹, Barbara Scalvini¹, Bolette Pedersen²
¹University of the Faroe Islands, ²University of Copenhagen

TURING: Evaluating Human Abilities to Identify AI-Generated Texts
Natalia Kalashnikova, Nicolas De Bufala, Sophie Fayad, Laurent Cervoni
TALAN

JamC-QA: A Multiple-Choice Question Answering Benchmark for Japan-Specific Knowledge
Teruaki Oka, Tomohide Shibata, Nao Yoshida
SB Intuitions Corp.

09:00 - 10:40

Session P4.2.3: Evaluation, Validation III - Poster Area

Evaluating Text Style Transfer: A Nine-language Benchmark for Text Detoxification
Vitaly Protasov¹, Nikolay Babakov², Daryna Dementieva³, Alexander Panchenko⁴
¹Independent Researcher, ²Centro Singular de Investigación en Tecnoloxías Intelixentes (CiTIUS), Universidade de Santiago de Compostela, ³Technical University of Munich, ⁴S-NLP

Irish-BLiMP: A Linguistic Benchmark for Evaluating Human and Language Model Performance in a Low-Resource Setting
Josh Mcgiff¹, Tung Tran², William Mulcahy¹, Dáibhidh Ó Luinín¹, Jake Dalzell³, Róisín Ní Bhroin⁴, Adam Burke⁴, Barry O'Sullivan², Hoang Nguyen², Nikola Nikolov¹
¹University of Limerick, ²University College Cork, ³Prifysgol Aberystwyth University, ⁴Independent

EduBench: A Portuguese Benchmark for Open-Ended Discursive Question Answering
Pedro Paiola¹, Luís Gabriel Mendes¹, Bruno Monchelato¹, André Schuck¹, Gabriel Garcia¹, Douglas Rodrigues¹, Helena Caseli², João Papa¹
¹São Paulo State University, ²Federal University of São Carlos

DialectalArabicMMLU: Benchmarking Dialectal Capabilities in Arabic and Multilingual Language Models
Malik Altakrori¹, Nizar Habash², Teresa Lynn³, Younes Samih¹, Abed Alhakim Freihat⁴, Kirill Chirkunov³, Muhammed AbuOdeh³, Radu Florian⁵, Preslav Nakov⁴, Alham Fikri Aji³
¹IBM Research AI, ²New York University Abu Dhabi, ³MBZUAI, ⁴Mohamed bin Zayed University of Artificial Intelligence, ⁵IBM Research

SemBench: A Universal Semantic Framework for LLM Evaluation
Mikel Zubillaga¹, Naiara Perez², Oscar Sainz³, German Rigau⁴
¹HiTZ Center - Ixa, University of the Basque Country UPV/EHU, ²University of the Basque Country, ³University of the Basque Country (UPV/EHU), ⁴UPV/EHU

EL-MIA: Quantifying Membership Inference Risks of Sensitive Entities in LLMs
Ali Satvaty¹, Suzan Verberne², Fatih Turkmen³
¹University of Groningen, ²LIACS, Leiden University, ³Associate Professor University of Groningen

Same Meaning, Different Scores: Lexical and Syntactic Sensitivity in LLM Evaluation
Bogdan Kostic¹, Conor Fallon¹, Julian Risch², Alexander Loeser³
¹Berliner Hochschule für Technik, ²deepset, ³Beuth-University of Applied Sciences Berlin

The Potential for Misleading Results in Text Sanitisation with Standard Evaluation Metrics
Dan Zhang¹ and Mark Anderson²
¹Norwegian university of science and technology, ²Norsk Regnesentral

Mind the Language Gap: Assessing LLM Safety in Italian
Elena Marafatto and Roberto Navigli
Sapienza University of Rome

Bulgarian Massive Multitask Language Understanding Benchmark
Svetla Koeva¹, Ivelina Stoyanova², Dimiter Georgiev³, Svetlozara Leseva⁴, Valentina Stefanova⁵, Maria Todorova⁶, Tsvetana Dimitrova⁵, Hristina Kukova², Mihaela Moskova⁵, Tinko Tinchev⁵
¹Institute for Bulgarian Language "Prof. Lyubomir Andreychin", Bulgarian Academy of Sciences, ²Department of Computational Linguistics, IBL - BAS, ³Department of Computational Linguistics, IBL - BAS Country/Region:Bulgaria (BG), ⁴Department of Computational Linguistics, Institute for Bulgarian - BAS, ⁵Institute for Bulgarian Language, ⁶Bulgarian Academy of Sciences

PHEB: An European Portuguese High School-Level LLM Benchmark
Diogo Tavares¹, Rafael Ferreira¹, Afonso Simplício¹, Gonçalo Vinagre¹, Ana Condez¹, Inês Calvo², Inês Vieira¹, David Semedo³, Joao Magalhaes³
¹NOVA School of Science and Technology, ², ³Universidade NOVA de Lisboa

S-GRADES -- Studying Generalization of Student Response Assessments in Diverse Evaluative Settings
Tasfia Seuti and Sagnik Ray Choudhury
University of North Texas

Who Benchmarks the Benchmarks? A Case Study of LLM Evaluation in Icelandic
Finnur Ingimundarson¹, Steinunn Rut Friðriksdóttir², Bjarki Ármannsson³, Iris Nowenstein², Steinþór Steingrímsson³
¹University of Zurich, ²University of Iceland, ³The Árni Magnússon Institute for Icelandic Studies

Is This Idea Novel? An Automated Benchmark for Judgment of Research Ideas
Tim Schopf¹ and Michael Färber²
¹National Institute of Informatics (NII), ²TU Dresden

Questionnaire Meets LLM: A Benchmark and Empirical Study of Structural Skills for Understanding Questions and Responses
Duc-Hai Nguyen¹, Vijayakumar Nanjappan², Barry O'Sullivan², Hoang Nguyen²
¹Insight Research Ireland Centre for Data Analytics, School of Computer Science and Information Technology, University College Cork, Ireland, ²University College Cork

Assessing the Effectiveness of LLMs in Delivering Cognitive Behavioral Therapy
Navdeep Singh Bedi¹, Ana-Maria Bucur¹, Noriko Kando², Fabio Crestani³
¹Università della Svizzera italiana, ²National Institute of Informatics, ³Università della Svizzera Italiana (USI)

10:40 - 11:00

Coffee Break

11:00 - 12:40

Session O17: Evaluation, Validation IV - Room 1

11:00 - 11:20

Transcription Accuracy in the Icelandic Gigaword Corpus: Evaluating Automatic and Manual Annotation
Johanna Mechler, Lilja Stefánsdóttir, Anton Ingason
University of Iceland

11:20 - 11:40

Benchmark Data Contamination in Underrepresented Languages: A Comprehensive Analysis Using Brazilian Data
Iriedson Vilar¹, David Maia², João Brunet³, Fabio Morais¹, Leandro Marinho⁴
¹Federal University of Campina Grande (UFCG), ²IFPB, ³Federal University of Campina Grande, ⁴UFCG

11:40 - 12:00

TTSVowelViz: A Tool for Visualising Text-to-Speech Model Training via Vowel Spaces
Pasindu Udawatta¹, Jesin James¹, Balamurali B T², Catherine Watson¹, Ake Nicholas¹, Binu Abeysinghe¹
¹University of Auckland, ²Singapore University of Technology and Design

12:00 - 12:20

A Sociophonetic Analysis of Racial Bias in Commercial ASR Systems Using the Pacific Northwest English Corpus
Michael Scott, Siyu Liang, Alicia Wassink, Gina-Anne Levow
University of Washington

12:20 - 12:40

ParliaBench: An Evaluation and Benchmarking Framework for LLM-Generated Parliamentary Speech
Marios Koniaris, Argyro Tsipi, Panayiotis Tsanakas
National Technical University of Athens

11:00 - 12:40

Session O18: Lexicon and Semantics I - Room 2

11:00 - 11:20

PARSEME 2.0 Multilingual Corpus of Multiword Expressions
Agata Savary¹, Manon Scholivet², Carlos Ramisch³, Takuya Nakamura⁴, Eric Bilinski⁵, Sara Stymne⁶, Voula Giouli⁷, Stella Markantonatou⁸, Vasile Pais⁹, Maria Mitrofan¹⁰, Louis Estève¹¹, Bruno Guillaume¹², Verginica Barbu Mititelu¹⁰, Jaka Cibej¹³, Roberto Díaz Hernández¹⁴, Victoria Fendel¹⁵, Polona Gantar¹³, Olha Kanishcheva¹⁶, Cvetana Krstev¹⁷, Chaya Liebeskind¹⁸, Irina Lobzhanidze¹⁹, Aleksandra Markovic²⁰, Gunta Nepore-Berzkalne²¹, Adriana Pagano²², Mehrnoush Shamsfard²³, Ranka Stankovic²⁴, Vahide Tajalli²³, Carole Tiberius²⁵, Aakanksha Padhye²⁶
¹Paris-Saclay University, ²Universite Paris Saclay CNRS, ³Aix Marseille University, CNRS, LIS, ⁴LISN, Universite Paris-Saclay, CNRS/LIGM, Universite Gustave-Eiffel, CNRS, ⁵Universite Paris Saclay, CNRS, LISN, ⁶Uppsala University, ⁷Aristotle University of Thessaloniki / ILSP, ATHENA RC, ⁸ILSP/R.C. "Athena", ⁹Research Institute for Artificial Intelligence, Romanian Academy, ¹⁰RACAI, ¹¹Université Paris-Saclay, CNRS, LISN, ¹²LORIA / Inria Nancy Grand-Est, ¹³University of Ljubljana, ¹⁴University of Jaén, ¹⁵University of Oxford, ¹⁶Heidelberg University, ¹⁷Association for Language Resources and Technologies, ¹⁸Jerusalem College of Technology , Lev Academic Center, ¹⁹Ilia State University, ²⁰The Institute for the Serbian language of SASA, ²¹Institute of Mathematics and Computer Science, University of Latvia, ²²Federal University of Minas Gerais, ²³Faculty of Computer Science and Engineering, Shahid Beheshti University, ²⁴University of Belgrade - Faculty of Mining and Geology, ²⁵Instituut voor de Nederlandse Taal, ²⁶Indian Institute of Technology Delhi

11:20 - 11:40

Multi-SimLex for Dutch: Benchmarking Embedding- and Prompt-Based Model Performance on Semantic Similarity
Lizzy Brans¹ and Jelke Bloem²
¹Utrecht University, ²University of Amsterdam

11:40 - 12:00

MultiCoS: A Multilingual Dataset of Connective Semantics with ContextSentence Compatibility
Anne Mucha, Ciyang Qing, Wataru Uegaki
University of Edinburgh

12:00 - 12:20

Adverbs Revisited: Enhancing WordNet Coverage of Adverbs with a Supersense Taxonomy
Jooyoung Lee¹, Jader Camboim de Sá², Cedric Pruski²
¹Brown University, ²Luxembourg Institute of Science and Technology

12:20 - 12:40

Introducing PerMet 1.0: A Metaphor-Annotated Corpus for Persian
Mohammad Saeid Miri
Allameh Tabataba'i University

11:00 - 12:40

Session O19: Multilinguality, Machine Translation Evaluation - Room 3

11:00 - 11:20

KinyCOMET: Automatic Evaluation of Machine Translation Systems for Kinyarwanda--English
Prince Mazimpaka¹, Jan Nehring², Samuel Rutunda³, Cristina España-Bonet⁴
¹University of Rwanda, ²C4IR, ³Digital Umuganda, ⁴DFKI

11:20 - 11:40

Multiway Parallel Corpus in Forced Migration Domain for Multilingual Machine Translation
Fatemeh Azadi¹, Samuel Larkin¹, Chi-kiu Lo²
¹National Research Council Canada, ²National Research Council of Canada

11:40 - 12:00

Context-8: A Data Set for Evaluating Context Sensitivity in Machine Translation
Dongyue Wang and Kyo Kageura
University of Tokyo

12:00 - 12:20

AssamLegalTrans: A Parallel Corpus, Benchmark and Analysis for English-Assamese Machine Translation of Legal Judgments
Telem Joyson Singh¹, Hemanta Baruah², Sanasam Ranbir Singh², Anindita Talukdar¹, Nasrin Shahnaz¹, Okram Jimmy Singh¹, Priyankoo Sarmah², Pallav Dutta¹, Sukumar Nandi², Pranab Duara³
¹IIT Guwahati, ²Indian Institute of Technology Guwahati, ³Gauhati High Court

12:20 - 12:40

Coordinate Structure Extraction for Patent Claims Using Multilingual LLMs
Tsukasa Ishimaru¹, Takehito Utsuro¹, Masaaki Nagata²
¹University of Tsukuba, ²NTT, Inc.

11:00 - 12:40

Session O20: Discourse and Pragmatics II - Room 4

11:00 - 11:20

Human Label Variation in Implicit Discourse Relation Recognition
Frances Yung¹, Daniil Ignatev², Merel Scholman², Vera Demberg¹, Massimo Poesio³
¹Saarland University, ²Utrecht University, ³Queen Mary University of London and University of Utrecht

11:20 - 11:40

Conversational Implicatures through the Lens of LLMs
Agnese Lombardi and Alessandro Lenci
University of Pisa

11:40 - 12:00

The Emergence of the Pragmatic Dimension in Instructed-LMs
Davide Mazzaccara¹ and Raffaella Bernardi²
¹CIMeC, University of Trento, ²Free University of Bozen-Bolzano

12:00 - 12:20

Distributed Partial Information Puzzles: Examining Common Ground Construction under Epistemic Asymmetry
Yifan Zhu¹, Mariah Bradford², Kenneth Lai¹, Timothy Obiso¹, Videep Venkatesha², James Pustejovsky¹, Nikhil Krishnaswamy²
¹Brandeis University, ²Colorado State University

12:20 - 12:40

Grounded Misunderstandings in Asymmetric Dialogue: A Perspectivist Annotation Scheme for MapTask
Nan Li¹, Albert Gatt¹, Massimo Poesio²
¹Utrecht University, ²Queen Mary University of London and University of Utrecht

11:00 - 12:40

Session P5.1.1: Inference, Reasoning, Question Answering II - Poster Area

Assessing LLM Reasoning through Implicit Causal Chain Discovery in Climate Discourse
Liesbeth Allein¹, Nataly Pineda-Castañeda², Andrea Rocci², Marie-Francine Moens¹
¹KU Leuven, ²Università della Svizzera italiana

AccurateRAG: A Framework for Building Accurate Retrieval-Augmented Question-Answering Applications
Linh The Nguyen, Chi Tran, Dung Ngoc Nguyen, Van-Cuong Pham, Hoang Ngo, Dat Quoc Nguyen
Qualcomm AI Research

VideoEvent: Leveraging Relevance and LLMs for Video Question Answering
Chen-Chen Lin, Ming-Han Lee, KunRu Wu, Yu-Chee Tseng
National Yang Ming Chiao Tung University

MORQA: Benchmarking Evaluation Metrics for Medical Open-Ended Question Answering
Wen-wai Yim¹, Asma Ben Abacha¹, Zixuan Yu², Robert Doerning², Fei Xia², Meliha Yetisgen²
¹Microsoft, ²University of Washington

LegalRikai: Open Benchmark a Benchmark for Complex Japanese Corporate Legal Tasks
Shogo Fujita¹, Yuji Naraki², Yiqing Zhu¹, Shinsuke Mori³
¹LegalOn Technologies, Inc., ²Cierpa & Company, ³Kyoto University

Integrating Arithmetic Learning Improves Mathematical Reasoning in Smaller Models
Neeraj Gangwar¹, Suma Bhat², Nickvash Kani²
¹University of Illinois Urbana-Champaign, ²University of Illinois at Urbana-Champaign

mSCoRe: A Multilingual and Scalable Benchmark for Skill-based Commonsense Reasoning
Nghia Ngo¹, Franck Dernoncourt², Thien Nguyen¹
¹University of Oregon, ²Adobe Research

A Binary Problem in Binary QA: Diverse LLMs or Diverse Question Interpretations? That Is the Ensembling Question
Rafael Rosales¹ and Santiago Miret²
¹Intel, ²Lila Sciences

ObfusQAte: A Proposed Framework to Evaluate LLM Robustness on Obfuscated Factual Question Answering
Shubhra Ghosh¹, Abhilekh Borah², Aditya Guru³, Kripabandhu Ghosh⁴
¹Indian Institutes of Technology, Patna, ²Manipal University Jaipur, India, ³Manipal University Jaipur, ⁴Indian Institute of Science Education and Research- Kolkata (IISER-K)

POLAR: A Corpus of Questions, Responses and Argumentation in Polish Political Radio Discourse
Daniel Ziembicki¹, Aleksandra Zwierzchowska², Ewelina Sobol³, Katarzyna Przerada³
¹University of Warsaw, Department of Formal Linguistics, ²Institute of Computer Science Polish Academy of Sciences, ³No affiliation

MHTS: Multi-Hop Tree Structure Framework for Generating Difficulty-Controllable QA Datasets for RAG Evaluation
Jeongsoo Lee¹, Daeyong Kwon², Kyohoon Jin¹, JunNyeong Jeong¹, Minwoo Sim¹, Minwoo Kim¹
¹DATUMO, ²KAIST

CareMedEval Dataset: Evaluating Critical Appraisal and Reasoning in the Biomedical Field
Doria Bonzi¹, Alexandre Guiggi², Frederic Bechet³, Carlos Ramisch⁴, Benoit Favre⁵
¹LORIA, ²Université Grenoble-Alpes, ³Aix Marseille Universite - LIS/CNRS, ⁴Aix Marseille University, CNRS, LIS, ⁵Aix-Marseille University LIS/CNRS

LongTailQA: Benchmarking LLMs and RAG Models on Disambiguated Long-Tail Entities
William Xion¹, Uwe Hadler², Tim Cofala³, Maximilian Idahl⁴, Soumyadeep Roy⁵, Wolfgang Nejdl¹
¹L3S Research Center, ²L3S Research Centre, ³L3S Research Center, Leibniz Universität Hannover, ⁴L3S Research Center, Leibniz University Hannover, ⁵Stanford University

CRaFT: An Explanation-Based Framework for Evaluating Cultural Reasoning in Multilingual Language Models
Shehenaz Hossain¹ and Haithem Afli²
¹ADAPT Centre, MTU, ²ADAPT Centre, Munster Technological University

HEAD-QA v2: Expanding a Healthcare Benchmark for Reasoning
Alexis Correa¹, Carlos Gómez-Rodríguez¹, David Vilares²
¹Universidade da Coruña, ²Universidade da Coruña, CITIC

Beyond MCQ: An Open-Ended Arabic Cultural QA Benchmark with Dialect Variants
Hunzalah Hassan Bhatti¹ and Firoj Alam²
¹Qatar Computing Research Institute, ²Qatar Computing Research Institute, HBKU

Automatic Inter-document Multi-hop Scientific QA Generation
Seungmin Lee¹, Dongha Kim², Yuni Jeon¹, Junyoung Koh¹, Min Song¹
¹Yonsei University, ²Yonsei Unviersity

CRiT-QA: Evaluating Multi-hop Reasoning with Counterfactual Chains and Distractor Traps
Jungmin Yun, June Hyoung Kwon, Youngbin Kim
Chung-Ang University

TARAZ: Persian Short-Answer Question Benchmark for Cultural Evaluation of Language Models
Reihaneh Iranmanesh, Saeedeh Davoudi, Pasha Abrishamchian, Ophir Frieder, Nazli Goharian
Georgetown University Information Retrieval Lab

11:00 - 12:40

Session P5.1.2: Inference, Reasoning, Question Answering III - Poster Area

Benchmarking Mathematical Reasoning in a Low-Resource Language: Structured Prompting and Evaluation in Basque
Inigo Martinez-Criado¹, Aitor Soroa², Jeremy Barnes¹
¹University of the Basque Country EHU/UPV, ²HiTZ Center - Ixa, University of the Basque Country UPV/EHU

Assessing the Difficulty of Inference Types in Natural Language Inference for Clinical Trials
Mathilde Aguiar¹, Pierre Zweigenbaum², Nona Naderi³
¹Université Paris-Saclay, CNRS, Laboratoire Interdisciplinaire des Sciences du Numérique, 91400, Orsay, France, ²LISN, CNRS, Université Paris-Saclay, ³Université Paris-Saclay

Reasoning Graph-Structured Question Answering: Datasets and Insights from LLM Benchmarking
Khin Yone¹, Devasha Trivedi², Anish Pahilajani², Jincen Shuai¹, Samyak Rajesh Jain¹, Ryan Rossi³, Nesreen Ahmed⁴, Franck Dernoncourt³, Yu Wang⁵, Namyong Park⁶
¹University of California, Santa Cruz, ²UC Santa Cruz, ³Adobe Research, ⁴Cisco, ⁵University of Oregon, ⁶Carnegie Mellon University

JBE-QA: Japanese Bar Exam QA Dataset for Assessing Legal Domain Knowledge
Zhihan Cao¹, Fumihito Nishino², Hiroaki Yamada¹, Ha Thanh Nguyen³, Yusuke Miyao⁴, Ken Satoh²
¹Institute of Science Tokyo, ²Center for Juris-informatics, ROIS-DS, ³National Institute of Informatics, ⁴University of Tokyo

A Diagnostic Benchmark for Sweden-Related Factual Knowledge
Jenny Kunz
Linkoping University

GeoBenchmark: Probing Large Language Models for Geo-Spatial Knowledge
Ayomide Abayomi¹, Jose G. Moreno², Karim Radouane³, Lynda Tamine⁴
¹IRIT/Université Jean Monnet, ²Paul Sabatier University - IRIT, ³University of Toulouse, ⁴IRIT

FactOReS: Fact-checking with an Evidence-based Open Resource in Spanish
Nagore Bravo¹, Jaione Bengoetxea², Iker García-Ferrero³, Alba Bonet Jover⁴, Estela Saquete⁴, Rodrigo Agerri⁵
¹HiTZ Center, University of the Basque Country, ²HiTZ Center - Ixa, University of the Basque Country UPV/EHU, ³Multiverse Computing, ⁴University of Alicante, ⁵HiTZ Center - Ixa, University of the Basque Country EHU

Stands to Reason: Investigating the Effect of Reasoning on Idiomaticity Detection
Dylan Phelps¹, Rodrigo Wilkens², Edward Gow-Smith³, Thomas Pickard³, Maggie Mi³, Marco Idiart⁴, Aline Villavicencio⁵
¹The University of Sheffield, ²University of Exeter, ³University of Sheffield, ⁴Federal University of Rio Grande do Sul, ⁵University of Exeter, UK

ESG-QA: Building a Dataset for Question Answering on Environmental, Social, and Governance Pillars
Gabriel Assis¹, Ayrton Surica¹, Pedro Kroll¹, Gabriela Mendes², Darian Rabbani², Edson Bollis², Lucas Francisco Pellicer³, Aline Paes¹
¹Institute of Computing, Universidade Federal Fluminense, ²Instituto de Ciência e Tecnologia Itaú, ³Universidade de São Paulo (USP)

Enhancing and Evaluating Tabular Models on the Fly via Synthetic QuestionAnswer Generation
Jorge Osés Grijalba¹, Eugenio Martínez Cámara¹, L. Alfonso Ureñ-López², Jose Camacho-Collados³
¹University of Jaén, ²University of Jaen, ³Cardiff University

VIVID: A Culturally Grounded Benchmark Exposing the Figurative Language Gap in Vietnamese NLP
Tu Do¹, Nhat Nguyen¹, Tung Tran², Hoang Nguyen², Tu Phuong¹, Long Dang¹
¹Posts and Telecommunications Institute of Technology, ²University College Cork

Assessing Logical Coherence of LLMs via Fine-Grained NLI
Jon Apaolaza Larraya¹, Begoña Altuna², Aitor Soroa¹, Inigo Lopez-Gazpio¹
¹HiTZ Basque Center for Language Technology - Ixa NLP Group - University of the Basque Country UPV/EHU, ²GOI institute, Basque Summer University (UEU)

Counter-Hypothesis Generation: Towards Evaluating How LLMs Reason about Alternatives
Marzieh Abdolmaleki¹, Aaron Maladry², Veronique Hoste¹, Els Lefever¹
¹LT3, Ghent University, ²Ghent University

LFQA-HP-1M: A Large-Scale Human Preference Dataset for Long-Form Question Answering
Rafid Ishrak Jahan¹, FAHMID SHAHRIAR IQBAL², Sagnik Ray Choudhury²
¹University of North Texas, Department of Computer Science and Engineering, ²University of North Texas

Orthographic Constraint Satisfaction and Human Difficulty Alignment in Large Language Models
Bryan Tuck and Rakesh Verma
University of Houston

LIT-RAGBench: Benchmarking Generator Capabilities of Large Language Models in Retrieval-Augmented Generation
Koki Itai, Shunichi Hasegawa, Yuta Yamamoto, Gouki Minegishi, Masaki Otsuki
neoAI Inc.

Investigating Reasoning with Hypotheses: The RIP2 Corpus
Ella Schad, Clara Seyfried, Chris Reed
University of Dundee

Can Multimodal LLMs Generate Pedagogical Questions?
Thomas Gerald¹, Sahar Ghannay², Julie Lascar², Paul Lerner³, Anne Vilnat⁴
¹CNRS, Université Paris Saclay, LISN, ²CNRS, LISN, ³Sorbonne Université, CNRS, ISIR, ⁴LIMSI et Université Paris-Saclay

The Riddle of Reflection: Evaluating Reasoning and Self-Awareness in Multilingual LLMs Using Indian Riddles
Abhinav P M¹, Ojasva Saxena², Oswald C³, Parameswari Krishnamurthy⁴
¹International Institute of Information Technology, ²IIT Delhi, ³National Institute of Technology Tiruchirappalli, ⁴Assistant Professor, IIIT Hyderabad

11:00 - 12:40

Session P5.2.1: Speech Resources and Processing I - Poster Area

Using Songs to Improve Kazakh Automatic Speech Recognition
Rustem Yeshpanov
Independent Researcher

Southern Kurdish Speech Recognition Resources and Benchmarking
Mohammad Mohammadamini¹ and Marie Tahon²
¹Le Mans University, ²LIUM / Le Mans University

MASA: A Novel Multimodal Foundation Model for L2 Speaking Assessment in Picture-description Scenarios
Bi-Cheng Yan, Fu-An Chao, Hong-Yun Lin, Berlin Chen
National Taiwan Normal University

Tools for Estimating the Perceived Level of Phonetic Reduction
Nigel Ward¹, Javier Vazquez¹, Emma (Danny) Boushka¹, Oliver Niebuhr²
¹University of Texas at El Paso, ²University of Southern Denmark

FalAR: A Large-scale Speaker-Annotated European Portuguese Speech Corpus of Parliamentary Sessions
Francisco Teixeira¹, Carlos Carvalho², Mariana Julião², Catarina Botelho¹, Rubén Solera-Ureña¹, Sérgio Paulo¹, Thomas Rolland¹, Ben Peters¹, Isabel Trancoso³, Alberto Abad⁴
¹INESC-ID, ²INESC-ID/Instituto Superior Técnico, Universidade de Lisboa, ³INESC-ID / IST Univ. Lisbon, ⁴INESC-ID/IST

English to Central Kurdish Speech Translation: Corpus Creation, Evaluation, and Orthographic Standardization
Mohammad Mohammadamini¹, Daban Jaff², Josep Crego³, Marie Tahon⁴, Antoine LAURENT⁵
¹Le Mans University, ²Koya University, ³CHAPSVISION, ⁴LIUM / Le Mans University, ⁵LIUM - Laboratoire Informatique Université du Mans

Automatic Prediction of Prominence and Boundary Strength from Text
Pauline Mas¹, Kévin Vythelingum², Jonathan Chevelu³, Marion Ouédraogo², Damien Lolive⁴, Olivier Rosec²
¹Voxygen, University of Rennes, IRISA, ²Voxygen, ³Univ Rennes, CNRS, IRISA, ⁴UBS, CNRS, IRISA

SOMVOICE: A First Dataset to Study the Effects of Sleep Deprivation on Voice Characteristics of Healthy French Speakers
Vincent P. Martin¹, Jean-Luc Rouas², Colleen Beaumard³, Pierre Philip⁴
¹Univ. Lorraine CNRS, Inria, LORIA, ²LaBRI CNRS UMR 5800 Univ. Bordeaux, ³Univ. Bordeaux, CNRS, Bordeaux INP, LaBRI - UMR 5800, SANPSY - UMR 6033, ⁴Univ. Bordeaux, SANPSY, UMR 6033

Automatic Prediction of Child Speech Fluency with Game-Based Data from German Preschoolers
Valentin Kany, Bernd Möbius, Jürgen Trouvain
Saarland University

Selective Augmentation: Improving Universal Automatic Phonetic Transcription via G2P Bootstrapping
Tobias Bystrich¹, Julia Pritzen², Christoph Schmidt², Claudia Wich-Reif³
¹University of Bonn, Fraunhofer Institute IAIS, ²Fraunhofer Institute for Intelligent Analysis and Information Systems (IAIS), ³University of Bonn

AURORA Model of Formant-to-tongue Inversion for Didactic and Clinical Applications
Patrycja Strycharczuk¹ and Sam Kirkham²
¹University of Manchester, ²Lancaster University

Investigating the Role of Synthetic Data Augmentation and Training Strategies on Improving Low-Resource Language ASR
Yun Hao, Reihaneh Amooie, Wietse de Vries, Rik van Noord, Martijn Wieling
University of Groningen

AutoRPT: A Tool for Bootstrapping Prosodic Annotation
Seth Heiney, Thomas Hicks, Sally Little, Fernanda Lourenco, Kai Retana, Eliana Stevens, Jonathan Howell
Montclair State University

J-CHAT: Japanese Large-scale Spoken Dialogue Corpus for Spoken Dialogue Language Modeling
Wataru Nakata¹, Kentaro Seki¹, Hitomi Yanaka¹, Yuki Saito¹, Shinnosuke Takamichi², Hiroshi Saruwatari¹
¹The University of Tokyo, ²Keio University

ViMedCSS: A Vietnamese Medical Code-Switching Speech Dataset & Benchmark
Tung Nguyen¹, Nhu Vo¹, Giang Son Nguyen², Duy Hoang¹, Chien Huynh¹, Inigo Jauregi Unanue³, Massimo Piccardi³, Wray Buntine⁴, Dung Le⁵
¹VinUniversity, ²Nanyang Technological University, ³University of Technology Sydney, ⁴CECS, VinUniversity, ⁵College of Engineering and Computer Science, VinUniversity

11:00 - 12:40

Session P5.2.2: Speech Resources and Processing II - Poster Area

Towards Privacy-Preserving Fine-Tuning: Anonymization of Aphasic Speech for Effective ASR
Sebastian Hofstetter and Timo Baumann
Ostbayerische Technische Hochschule Regensburg

ParlaSpeech 3.0: Richly Annotated Spoken Parliamentary Corpora of Croatian, Czech, Polish, and Serbian
Nikola Ljubeic¹, Peter Rupnik², Ivan Porupski¹, Taja Kuzman Pungerek¹
¹Joef Stefan Institute, ²JoÅ¾ef Stefan Institute

LexiPhon: A Collection of Phonetically Transcribed Lexicons from Wikipedia
Amanda Doucette, Timothy J. O'Donnell, Morgan Sonderegger
McGill University

ROG: A Multi-Layer Manually Annotated Corpus of Spoken Slovenian
Kaja Dobrovoljc¹, Darinka Verdonik², Jaka Cibej¹, Peter Rupnik³, Nikola Ljubeic⁴
¹University of Ljubljana, ²University of Maribor, ³JoÅ¾ef Stefan Institute, ⁴Joef Stefan Institute

Building a Dataset for French Accent Classification Evaluation: Are We There Yet?
Diandra Fabre¹, Mathieu Avanzi², François Portet³
¹Univ. Grenoble Alpes, CNRS, Grenoble INP, LIG, ²Université de Neuchâtel, ³Univ Grenoble Alpes, Laboratoire d'Informatique de Grenoble

M3-SLU: Evaluating Speaker-Attributed Reasoning in Multimodal Large Language Models
Yejin Kwon, TAEWOO KANG, Hyunsoo Yoon, Chang Ouk Kim
Yonsei University

Medispeech: A French Reading and Spontaneous Speech Corpus for Sleepiness Estimation
Colleen Beaumard¹, Vincent P. Martin², Charles Brazier³, Julien Coelho⁴, Jean-Luc Rouas⁵, Pierre Philip⁶
¹Univ. Bordeaux, CNRS, Bordeaux INP, LaBRI - UMR 5800, SANPSY - UMR 6033, ²Univ. Lorraine CNRS, Inria, LORIA, ³Univ. Bordeaux, Bordeaux INP, LaBRI, CNRS - UMR 5800, ⁴SANPSY CNRS UMR 6033, Univ. Bordeaux, CHU Bordeaux, University Department of Sleep Medicine, ⁵Univ. Bordeaux, Bordeaux INP, LaBRI CNRS - UMR 5800, ⁶SANPSY CNRS - UMR 6033, Univ. Bordeaux, CHU Bordeaux, University Department of Sleep Medicine

StarDrinks: An English and Korean Test Set for SLU Evaluation in a Drink Ordering Scenario
Marcely Zanon Boito, Caroline Brun, Inyoung Kim, Denys PROUX, Salah Ait-Mokhtar, Nikolaos Lagos, Jean-Luc Meunier, Ioan Calapodescu
NAVER LABS Europe

Audio-Lyrics Alignment Dataset for Italian Arias
Pushkar Jajoria¹, Arianna Graciotti², Giovanna Casali³, Jesujoba Alabi¹, Rodolfo Delmonte⁴, Angelo Pompilio³, Rocco Tripodi⁵, James McDermott⁶, Dietrich Klakow¹
¹Saarland University, ²University of Groningen, ³University of Bologna, ⁴Ca' Foscari University Venice now retired, ⁵Ca' Foscari University of Venice, Department of Environmental science, Informatics and Statistics, ⁶University of Galway

A Semi-Automatic Workflow for Transcribing and Annotating Broadcast News
Christoph Draxler¹, Sven Grawunder², Jürgen Trouvain³, Felicitas Kleber⁴
¹Institute of Phonetics and Speech Processing, LMU Munich, ²Max Planck Institute for Evolutionary Anthropology, Department of Linguistics, Leipzig, ³Saarland University, ⁴Deptartment of Language Science and Technology, Saarland University

The Added Value of Metadata and Annotations: Evidence from Two Large-Scale, Naturalistic Corpus Studies
Anisia Popescu¹, Johanna Cronenberg², Ioana Vasilescu³, Ioana Chitoran⁴, Lori Lamel⁵, Martine Adda-Decker⁶
¹Université Paris 8 - Saint Denis, ²LPP, CNRS, ³LISN CNRS, ⁴Universite de Paris, ⁵LISN, CNRS, ⁶LPP (Lab. Phonétique & Phonologie) / LIMSI-CNRS

CS-YODAS: A Mined Dataset of In-the-Wild Code-Switched Speech
Brian Yan¹, Qingzheng Wang¹, Matthew Wiesner², Anuj Diwan³, Olga Iakovenko⁴, Alex Polok⁵, Injy Hamed⁶, Shuichiro Shimizu⁷, Iris Emerman⁸, Thomas Hain⁹, David R. Mortensen¹⁰, Peter Viechnicki², Shinji Watanabe¹
¹Carnegie Mellon University, ²Johns Hopkins University, ³University of Texas at Austin, ⁴Connex AI, ⁵Brno University of Technology, ⁶Mohamed bin Zayed University of Artificial Intelligence, ⁷Kyoto University, ⁸n/a, ⁹University of Sheffield, ¹⁰Language Technologies Institute, Carnegie Mellon University

The Limits of Data Scaling: Sub-token Utilization and Acoustic Saturation in Multilingual ASR
Siyu Liang¹, Nicolas Ballier², Gina-Anne Levow¹, Richard Wright¹
¹University of Washington, ²ALTAE, Université Paris Cité

AusKidTalk: Developing Transcription Guidelines for Continuous Australian English Child Speech
Tuende Szalay¹, Zheng Nan², Renata Huang³, Mostafa Shahin², Sirojan Tharmakulasingam², Kirrie Ballard¹, Beena Ahmed²
¹The University of Sydney, ²The University of New South Wales, ³Macquarie University

11:00 - 12:40

Session P5.2.3: Speech Resources and Processing III - Poster Area

spINAch: A Diachronic Corpus of French Broadcast Speech Controlled for Speakers' Age and Gender
Simon Devauchelle¹, David Doukhan², Remi Uro³, Lucas Ondel⁴, Valentin Pelloin⁵, Olympia Imbert-Brégégère², Véronique Lefort², Kévin Picard², Emeline Seignobos², Albert Rilliard¹
¹Universite Paris Saclay, CNRS, LISN, ²Institut national de l'audiovisuel (Ina), ³Laboratoire d'Intelligence Artificielle et Sémantique des Données, Université Paris 8 (EA4383), ⁴LISN, CNRS, ⁵INA

SALAN: A Massive ASR Dataset for the Languages of Niger
Mamadou K KEITA¹, Christopher Homan¹, Emily Prud'hommeaux², Abdoulaye SAKO³, Seydou Diallo⁴
¹Rochester Institute of Technology, ²Boston College, ³ESEO, ⁴DAUST

Listening for Ideology: Automatic Analysis of Character Speech in Historical Nazi Propaganda Films
Nicolas Ruth, Manuel Burghardt, Andreas Niekler
Computational Humanities Group, Leipzig University

Supplementary Resources and Analysis for Automatic Speech Recognition Systems Trained on the Loquacious Dataset
Nick Rossenbach¹, Robin Schmitt², Tina Raissi¹, Simon Berger², Larissa Kleppel¹, Ralf Schlüter²
¹RWTH Aachen University, ²RWTH Aachen University, AppTek.ai

WhiteHouse: Translation of the Casablanca Corpus for Multi-dialectal Arabic Speech Translation
Fethi Bougares¹, Salima Mdhaffar², Yannick Estève³
¹LIUM- Le Mans Université, ²Avignon university, ³LIA - Avignon Université

ToneSwiper: Facilitating Manual ToDI-annotation of Dutch Prosody
Matthijs Westera¹ and Ariëlle Reitsema²
¹Leiden Universiteit, ²Leiden University

IMaSC: A Malayalam Speech Corpus for High-Quality Text-to-Speech Synthesis
Deepa Gopinath¹, Thennal D K², Vrinda Nair³, Swaraj S⁴, Sachin G⁴
¹College of Engineering Trivandrum (CET), ²Independant Researcher, ³APJ Abdul Kalam Technological University, ⁴International Centre for Free and Open Source Solutions (ICFOSS)

Speak in Context: Multilingual ASR with SpeechContext Alignment via Contrastive Learning
Yuchen Zhang¹, Haralambos Mouratidis², Ravi Shekhar²
¹Universtiy of Essex, ²University of Essex

Task-Lens: Cross-Task Utility Based Speech Dataset Profiling for Low-Resource Indian Languages
Swati Sharma¹, Divya Sharma¹, Anubha Gupta²
¹Indraprastha Institute of Information Technology, Delhi, ²IIIT Delhi

Introducing MELI: The Mandarin-English Language Interview Corpus
Suyuan Liu and Molly Babel
University of British Columbia

PhonemeDF: A Synthetic Speech Dataset for Audio Deepfake Detection and Naturalness Evaluation
Vamshi Nallaguntla¹, Aishwarya Fursule¹, Shruti Kshirsagar¹, Anderson Avila²
¹Wichita State University, ²Institut national de la recherche scientifique

How Much Data for Stable Formant Values? Pipeline for Convergence Detection Based on Read Speech
Kayla Sward¹, Johan Sjons¹, Axel Ekstrom²
¹Department of Linguistics and Philology, Uppsala University, ²Speech, Music & Hearing, KTH Royal Institute of Technology

MUSCAT: MUltilingual, SCientific ConversATion Benchmark
Supriti Sinhamahapatra¹, Thai-Binh Nguyen¹, Yigit Oguz¹, Enes Ugan¹, Jan Niehues¹, Alexander Waibel²
¹Karlsruhe Institute of Technology, ²Carnegie Mellon University

12:40 - 13:20

Antonio Zampolli Prize Winner Talk - Room 1

13:20 - 14:45

Lunch Break

14:45 - 15:15

Invited Local Speaker - Room 1

15:15 - 15:20

Short Break (5mn)

15:20 - 17:00

Session O21: Evaluation, Validation V - Room 1

15:20 - 15:40

Towards a Diagnostic and Predictive Evaluation Methodology for Sequence Labeling Tasks
Elena Alvarez-Mellado and Julio Gonzalo
UNED School of Computer Science

15:40 - 16:00

Memorization or Lucky Guesses: Detecting Short Sequences from Copyrighted Dutch News in LLM Output
Joris Veerbeek¹, Kas Berendsen¹, Alessandra Polimeno², Antal van den Bosch¹
¹Utrecht University, ²DANS

16:00 - 16:20

When Numbers Tell Half the Story: Human-Metric Alignment in Topic Model Evaluation
Thibault Prouteau¹, Francis Lareau², Nicolas Dugue³, Jean-Charles Lamirel⁴, Christophe Malaterre⁵
¹Université de Lorraine, LORIA, CNRS, ²Computer Science Department, Université du Québec à Montréal, ³LIUM, Le Mans Universite, ⁴LORIA, ⁵Department of Philosophy & CIRST, Université du Québec à Montréal

16:20 - 16:40

Detecting Hallucinations in Authentic LLMHuman Interactions
Yujie Ren, Niklas Gruhlke, Anne Lauscher
University of Hamburg

16:40 - 17:00

Issue Detection and Category Classification in Domain-Specific Technical Logbooks
Afshin Karimi¹, Ingmar Hartl¹, Henrik Tuennermann¹, Anne Lauscher²
¹DESY, ²University of Hamburg

15:20 - 17:00

Session O22: Information Extraction and Text Mining III - Room 2

15:20 - 15:40

Once upon a Kernel: Extracting Important Events from Narratives
Anshu Sharma¹, Miguel Castiblanco-Melendez¹, Alejandro Morales¹, Mark Finlayson²
¹Florida International University, ²FIU

15:40 - 16:00

Temporal Expression Recognition in Legal Transcripts
Elizabeth Goldstein¹ and Maria Berger²
¹ORRO AI Genius,, ²Ruhr University Bochum

16:00 - 16:20

Multilingual, Multimodal Pipeline for Creating Authentic and Structured Fact-Checked Claim Dataset
Z. Melce Hüsünbeyi¹, Virginie Mouilleron², Leonie Uhling¹, Daniel Foppe¹, Tatjana Scheffler³, Djamé Seddah²
¹Ruhr-University Bochum, ²Inria, ³Ruhr University Bochum

16:20 - 16:40

A Study on Building Efficient Zero-Shot Relation Extraction Models
Hugo THOMAS¹, Caio Corro², Guillaume Gravier³, Pascale Sébillot⁴
¹IRISA, RENNES, ²Irisa, INSA Rennes, ³Univ Rennes, CNRS, Inria, IRISA - UMR 6074, France, ⁴Univ Rennes, INSA Rennes, CNRS, Inria, IRISA - UMR 6074

16:40 - 17:00

Beyond Catalogue Counts: The Dataset Visibility Asymmetry in Low-Resource Multilingual NLP
Zhiyin Tan¹ and Changxu Duan²
¹L3S Research Center, ²Technische Universität Darmstadt

15:20 - 17:00

Session O23: Simplification, Plain Language - Room 3

15:20 - 15:40

BLooP: Zero-Shot Abstractive Summarization Using Large Language Models with Bigram Lookahead Promotion
Varun Iyer¹ and Cornelia Caragea²
¹University of Illinois Chicago, ²University of Illinois at Chicago

15:40 - 16:00

OasisSimp: An Open-source Asian-English Sentence Simplification Dataset
Hannah Liu¹, Murphy Tian¹, Iqra Ali², Haonan Gao³, Qiaoyiwen Wu¹, Blair Yang⁴, Uthayasanker Thayasivam⁵, Annie Lee¹, Pakawat Nakwijit², Surangika Ranathunga⁶, Ravi Shekhar⁷
¹University of Toronto, ²Queen Mary University of London, ³Yale University, ⁴Coolwei AI Lab, ⁵University of Moratuwa, ⁶Massey University, ⁷University of Essex

16:00 - 16:20

Fully Automated Identification of Lexical Alignment and Preference-Stage Shifts in Large Language Models
Thomas Stephan Juzek, Xiaoyang Ming, Jose Hernandez
Florida State University

16:20 - 16:40

How Much Noise Can BERT Handle? Insights from Multilingual Sentence Difficulty Detection?
Nouran Khallaf and Serge Sharoff
University of Leeds

16:40 - 17:00

Comparing Reading Behavior across Reader Expertise and Text Complexity: Insights from the French Eye-Tracking Corpus (FETA)
Oksana Ivchenko¹ and Natalia Grabar²
¹University of Lille, ²CNRS STL UMR8163, Université de Lille

15:20 - 17:00

Session O24: Machine Learning I - Room 4

15:20 - 15:40

Scaling LLM Reasoning from Minimal Labels: A Semi-Supervised Framework with a Lightweight Verifier
Keizo Kato¹, Chenhui Chu², Yugo Murawaki², Sadao Kurohashi²
¹Fujitsu Limited, ²Kyoto University

15:40 - 16:00

PARL: Prompt-based Agents for Reinforcement Learning
Yarik Menchaca Resendiz¹ and Roman Klinger²
¹University of Stuttgart, ²University of Bamberg

16:00 - 16:20

SPQ: An Ensemble Technique for Large Language Model Compression
Jiamin Yao and Eren Gultepe
Southern Illinois University Edwardsville

16:20 - 16:40

FPSC: A Sustainable Pipeline for Building a Faroese Parliamentary Speech Corpus
Dávid í Lág¹, Barbara Scalvini¹, Carlos Hernandez Mena², Jon Gudnason³
¹University of the Faroe Islands, ²Barcelona Supercomputing Center, ³Reykjavik University

16:40 - 17:00

Efficient Dialect-Aware Modeling and Conditioning for Low-Resource Taiwanese Hakka Speech Processing
Peng An-Ci¹, Kuan-Tang Huang¹, Tien-Hong Lo¹, Hung-Shin Lee², Hsin-Min Wang³, Berlin Chen¹
¹National Taiwan Normal University, ²United Link Co., Ltd., ³Academia Sinica

15:20 - 17:00

Session P6.1.1: Corpora and Treebanks IV - Poster Area

Construction of Japanese Prefectural Assembly Minutes Datasets across Three Electoral Terms: Comparative Analysis of 2011, 2015, and 2019 Four-Year Periods
Keiichi Takamaru¹, Hokuto Ototake², Yuzu Uchida³, Yasutomo Kimura⁴
¹Utsunomiya Kyowa University, ²Fukuoka University, ³Hokkai-Gakuen University, ⁴Otaru University of Commerce

EDDA-Coordinata: An Annotated Dataset of Historical Geographic Coordinates
Ludovic Moncla¹, Pierre Nugues², Thierry Joliveau³, Katherine McDonough⁴
¹LIRIS, INSA Lyon, ²Lund University, ³UJM/CNRS UMR EVS, ⁴Lancaster University

Mental Health Disorder Detection beyond Social Media: A Systematic Review of Available Datasets
Sadiya Sayara Chowdhury Puspo¹, Ana-Maria Bucur², Stevie Chancellor³, Özlem Uzuner¹, Marcos Zampieri¹
¹George Mason University, ²Università della Svizzera italiana, ³University of Minnesota

German Counseling Grounding-Act Corpus (GRACO)
Milena Belosevic
Bielefeld University

Presenting the Prague Discourse Treebank 4.0
Jirí Mírovský and Pavlína Synková
Charles University

Evaluation of Co-Speech Gesture Tracking Techniques in Naturalistic Interactions
Victoria Ivanova and Naomi Harte
Trinity College Dublin

Voices across Decades: A Multimodal Diachronic Corpus of German Bundestag Debates (GerParlDia-MM)
Ingo Siegert
Otto von Guericke University Magdeburg

MultiWikiQA: A Reading Comprehension Benchmark in 300+ Languages
Dan Smart
Alexandra Institute

SALOMO: An Annotation Tool for Complex Annotation Tasks with a Large Number of Labels
Tim Menzner
University of Coburg

VietJobs: A Vietnamese Job Advertisement Dataset
Hieu Pham Dinh, Hung Nguyen Huy, Mo El-Haj
VinUniversity

A Resource on Dialogical Moves in Native and Non-Native Academic Writers of English
Giulia D'Agostino¹, Narjes Sheikh Asadi¹, Elena Musi²
¹Universita' della Svizzera italiana, ²University of Liverpool

A Corpus-Based Profiling of Regional English Variants in Global Media: Insights from Olympic Journalism
Felix Mao
Rye Country Day School

JFC-Recipe: A Dataset for Nutrient Estimation from Japanese User-Generated Cooking Recipes
Keisuke Shirai¹, Yoko Yamakata², Hirotaka Kameko¹, Akiko Sunto³, Jun Harashima⁴, Shinsuke Mori¹
¹Kyoto University, ²The University of Tokyo, ³Kanagawa University of Human Services, ⁴LY Corporation

Annotating Conversational Phases and Communication Techniques: A Corpus of German Teacher-Parent Counseling Conversations
Tobias Hallmen¹, Kathrin Gietl², Karoline Hillesheim², Annemarie Friedrich², Elisabeth André²
¹Chair for Human-Centered Artificial Intelligence, University of Augsburg, ²University of Augsburg

RO-ABSA: A Romanian Dataset and Baselines for Aspect-Based Sentiment Analysis
Gheorghe Alina, Andrei Claudia, Ionescu Elena, Ruseti Stefan, Dascalu Mihai
Politehnica University of Bucharest

The Moral Foundations Reddit Corpus
Jackson Trager¹, Alireza S. Ziabari¹, Elnaz Rahmati¹, Aida Mostafazadeh Davani², Preni Golazizian¹, Farzan Karimi-Malekabadi¹, Ali Omrani³, Zhihe Li¹, Brendan Kennedy⁴, Georgios Chochlakis¹, Nils Karl Reimer⁵, Melissa Reyes¹, Kesley Cheng¹, Mellow Wei¹, Christina Merrifield¹, Arta Khosravi¹, Evans Alvarez¹, Morteza Dehghani¹
¹University of Southern California, ²Google, ³Snap, ⁴Pacific Northwest National Laboratory, ⁵University of California Santa Barbara

15:20 - 17:00

Session P6.1.2: Corpora and Treebanks V - Poster Area

From Rosetta to Match-Up: A Paired Corpus of Linguistic Puzzles with Human and LLM Benchmarks
Neh Majmudar¹, Anne Huang², Jinfan Frank Hu², Elena Filatova³
¹PhD Student, ²High School, ³City University of New York (CUNY)

Tracing How Annotators Think: Augmenting Preference Judgments with Reading Processes
Karin de Langis, William Walker, Khanh Le, Dongyeop Kang
University of Minnesota

CodeClarity: A Framework and Benchmark for Evaluating Multilingual Code Summarization
Madhurima Chakraborty¹, Drishti Sharma², Maryam Sikander², Eman Nisar²
¹University of California, Riverside, ²Cohere Labs Community

A Longitudinal, Multinational, and Multilingual Corpus of News Coverage of the Russo-Ukrainian War
Dikshya Mohanty, Taisiia Sabadyn, Jelwin Rodrigues, Chenlu Wang, Abhishek Kalugade, Ritwik Banerjee
Stony Brook University

SKILL-IR-Discourse: A Large, Annotated Corpus of Argumentation and Domain Discourse on International Relations
Magdalena Wolska¹, Matti Wiegmann², Sassan Gholiagha³, Mitja Sienknecht³, Dora Kiesel¹, Irene Lopez Garcia¹, Patrick Riehmann⁴, Bernd Fröhlich¹, Katrin Girgensohn³, Jürgen Neyer³, Benno Stein¹
¹Bauhaus-Universität Weimar, ²University of Kassel, ³Europa-Universität Viadrina, ⁴Jönköping University

Building Multimodal Corpora Using Microtask Pipelines and Local Annotators
Helmiina Hotti¹, Raul Vazquez¹, Anna-Kaisa Jokipohja¹, Timo Kalliokoski¹, Henna Paakki¹, Rosa Suviranta¹, Tuomo Hiippala²
¹University of Helsinki, ²Department of Languages, University of Helsinki

Beyond Fake News Detection: A Community-based Study of the Multicultural Nature of Information Disorder
Sara Gemelli¹, Giulia Di Cristina², Yiran Zhang³, Md Azizul Hoque³, Alberto De La Torre Solís⁴, Mohamad Behboudi Eshkiki², Nikolai Efimov², Mariia Everstova², Caterina Cappello², Maziar Kianimoghadam Jouneghani², Payam Latifi², Yashar Mahboudi², Farzaneh Mohseni², Dario Placenti⁵, Tommaso Caselli⁶, Manuela Sanguinetti⁷, Aurora Scarpellini⁸, Chiara Zanchi⁹, Usman Naseem¹⁰, Marco Antonio Stranisci², Simona Frenda¹¹
¹University of Pavia, University of Bergamo, ²University of Turin, ³Macquarie University, ⁴Universidad de Huelva, ⁵Politecnico di Torino, ⁶Rijksuniversiteit Groningen, ⁷University of Cagliari, Department of Mathematics and Computer Science, ⁸Università di Torino, ⁹University of Pavia, ¹⁰University of Sydney, ¹¹Heriot-Watt University

FreeTxt-Vi: A Benchmarked Vietnamese-English Toolkit for Segmentation, Sentiment, and Summarisation
Hung Nguyen¹, Mo El-Haj¹, Paul Rayson², Dawn Knight³
¹VinUniversity, ²Lancaster University, ³Cardiff University

The Patrologia Graeca Corpus: OCR, Annotation, and Open Release of Noisy Nineteenth-Century Polytonic Greek Editions
Chahan Vidal-Gorène¹ and Bastien Kindt²
¹Ecole nationale des chartes-PSL University, Centre Jean Mabillon, LIPN, Calfa, ²UCLouvain/Institut Orientaliste

National Library as Corpus: DeLiKo-2025@DNB a Very Large Corpus of German-language Contemporary Literature
Marc Kupietz¹, Nils Diewald², Philippe Genêt³, Andreas Witt¹
¹Leibniz Institute for the German Language, ²IDS Mannheim, ³Deutsche Nationalbibliothek

Multi-party Conversational Corpus of L1 and L2 for Speech Alignment Research (Teams-SK): Methodological Approach
Stefan Benus¹, Viktor Gatial², Erik György², Mária Hricková², Martin Kaimír², Zuzana Kozáciková², Lucia Mareková², Róbert Sabo³, Marian Trnka³, Erik Vráb²
¹Constantine the Philosopher University in Nitra, Institute of Informatics, SAS, Bratislava, ²Constantine the Philosopher University in Nitra, ³Institute of Informatics, SAS, Bratislava

Is Semi-Automatic Transcription Useful in Corpus Creation? Preliminary Considerations on the KIParla Corpus
Martina Simonotti¹, Ludovica Pannitto², Eleonora Zucchini³, Silvia Ballarè⁴, Caterina Mauri²
¹DIT - University of Bologna, ²LILEC - University of Bologna, ³Masaryk University, ⁴FICLIT - University of Bologna

Open Korean Historical Corpus: A Millennia-Scale Diachronic Collection of Public Domain Texts
Seyoung Song¹, Nawon Kim², Songeun Chae¹, Kiwoong Park¹, Jiho Jin¹, Haneul Yoo¹, Kyunghyun Cho³, Alice Oh¹
¹KAIST, ²Department of Sinographic Literatures, Korea University, ³New York University

NAIST LIFE STORY: A Seven-Year Crowdsourced Dataset of Japanese Emotion-related Episodes
Kazuhiro Ito¹, Junko Hayashi², Hiroyuki Nagai¹, Shoko Wakamiya², Eiji ARAMAKI³
¹NARA Institute of Science and Technology, ²NAIST, ³NAIST, Japan

Audience Engagement with Arabic Women's Social Empowerment and Wellbeing: A Decadal Corpus
Wajdi Zaghouani¹, Mabrouka Bessghaier¹, Md. Rafiul Biswas², Shimaa Ibrahim¹
¹Northwestern University Qatar, ²Hamad Bin Khalifa University

ArPoMeme: An Annotated Arabic Multimodal Dataset for Political Ideology and Polarization
Wajdi Zaghouani¹, Kais Attia², Md. Rafiul Biswas³, Fadhl Eryani⁴
¹Northwestern University Qatar, ²Freelance, ³Hamad Bin Khalifa University, ⁴University of Tübingen

15:20 - 17:00

Session P6.1.3: Corpora and Treebanks VI - Poster Area

JobArabi: An Arabic Corpus and Analysis of Job Announcements from Social Media
Wajdi Zaghouani¹, Shimaa Ibrahim¹, Mabrouka Bessghaier¹, Houda Bouamor²
¹Northwestern University Qatar, ²Carnegie Mellon University in Qatar

ParaCLEAN: Improving Translation Quality through Systematic Parallel Data Cleaning
Audrey Mash, Ella Bohman, Maite Melero
BSC

DReUD: Discourse Relations in Universal Dependencies
Jirí Mírovský and Pavlína Synková
Charles University

MultiGraSCCo: A Multilingual Anonymization Benchmark with Annotations of Personal Identifiers
Ibrahim Baroud¹, Christoph Otto², Vera Czehmann³, Christine Hovhannisyan⁴, Lisa Raithel⁵, Sebastian Möller⁶, Roland Roller⁷
¹Technische Universität Berlin, ²University of Potsdam, ³German Research Center for Artificial Intelligence (DFKI) and Technical University of Berlin, ⁴Quality & Usability Lab, Technische Universität Berlin; Department of Psychology, Humboldt-Universität zu Berlin, ⁵Technische Universitaet Berlin, BIFOLD, DFKI GmbH, ⁶Quality and Usability Lab, TU Berlin, ⁷DFKI SLT Lab

Structured Legal Document Generation in India: A Model-Agnostic Wrapper Approach with VidhikDastaavej
Shubham Nigam¹, Deepak Patnaik Balaramamahanthi², Noel Shallum³, Kripabandhu Ghosh⁴, Arnab Bhattacharya⁵
¹University of Birmingham, ²Indian Institute of Technology, Kanpur, ³Symbiosis Law School Pune, ⁴Indian Institute of Science Education and Research- Kolkata (IISER-K), ⁵Dept. of Computer Science and Engineering, IIT Kanpur

PolyglotQL: A Pipeline for Multilingual Text-to-SPARQL Dataset Generation
Julio Perez¹, Fabio Barth², Georg Rehm²
¹Technical University of Berlin, ²DFKI

Building and Annotating a Large Comparable Corpus for Studying the Semantic Quantification - Chinese, French, Japanese, Korean
raoul blin¹, Jinnam Choi², WU qishen³, Yuxin Zhang⁴, Soonhee Hwang⁵, Takahiro Morita⁶, Alexander Delaporte¹, Ilaine Wang⁷, Chang Liu⁷
¹cnrs-crlao, ²CLLE, Université Jean-Jaurès, ³Paris Nanterre, ⁴sorbonne nouvelle, ⁵Hongik University, ⁶Kyoto University, ⁷INALCO

Towards the Generation and Application of Dynamic Web-Based Visualization of UIMA-based Annotations for Big-Data Corpora with the Help of Unified Dynamic Annotation Visualizer
Thiemo Dahmann¹, Julian Schneider¹, Philipp Stephan¹, Giuseppe Abrami¹, Alexander Mehler²
¹Goethe University Frankfurt, ²Goethe-University Frankfurt am Main

The MultiplEYE Text Corpus: Towards a Diverse and Ever-Expanding Multilingual Text Corpus
Ramune Kaspere¹, Anna Bondar², Sergiu Nisioi³, Maja Stegenwallner-Schütz⁴, Hanne B. Søndergaard Knudsen⁵, Ana Matic⁶, Eva Pavlinuic Vilus², Dorota Klimek-Jankowska⁷, Chiara Tschirner², Not Battesta Soliva², Deborah Jakobi², Cui Ding², Dima Abu Romi⁸, Cengiz Acarturk⁹, Matilda Agdler², Anton Alexandru¹⁰, Mohd Faizan Ansari¹¹, Annalisa Arcidiacono¹², Elizabete Barisa¹³, Ana Bautista¹⁴, Lisa Beinborn¹⁵, Yevgeni Berzak¹⁶, Nedeljka Bjelanovic¹⁷, Anna Bothmann¹⁸, Jan Brasser², Caterina Cacioli¹⁹, Anila Çepani²⁰, Ilze Ceple¹³, Adelina Cerpja²¹, Dalí Chirino²², Jan Chromý²³, Alessandro Corona Mendozza²⁴, Iria de-Dios-Flores²⁵, Nazik Dinçtopal Deniz²⁶, Ana Doen⁶, Kristian Elersic²⁷, Inmaculada Fajardo²⁸, Zigmunds Freibergs²⁹, Angelina Ganebnaya¹³, Shan Gao², Jéssica Gomes³⁰, Annjo Greenall³¹, Alba Haveriku³², Miao He³³, Anamaria Hodivoianu¹⁰, Yu-Yin Hsu³⁴, Amanda Isaksen³¹, Andreia Janeiro³⁰, Kristine Jensen de López⁵, Aleksandar Jevremovic³⁵, Vojislav Jovanovic³⁶, Hanna Kedzierska⁷, Nik Kharlamov⁵, Sara Kosutar³⁷, Nelda Kote³², Vanja Kovic³⁶, Izabela Krejtz³⁸, Thyra Krosness², Oleksandra Kuvshynova¹⁰, Eilam Lavy³⁹, Ella Lion¹⁶, Marta Lockiewicz⁴⁰, Kaidi Lõo²⁹, Paula Luegi³⁰, Mircea Mihai Marin¹⁰, Clara Martin⁴¹, Svitlana Matvieieva⁴², Diane Mézière⁴³, Xavier Mínguez-López²⁸, Valeriia Modina⁴⁴, Jurgita Motiejuniene¹, Marie-Luise Müller⁴⁵, Tolgonai Nasipbek kyzy⁴⁶, Jamal Abdul Nasir⁴⁷, Johanne Nedergård²⁴, Aysegül Özkan⁴⁸, Patrizia Paggio²⁴, Marijan Palmovic⁶, Maria Christina Panagiotopoulou², Alberto Parola²⁴, Helena Pérez⁴⁹, Klaudia Petersen⁵⁰, Anja Podlesek²⁷, Eva Pospíilová⁵¹, Marta Praulina¹³, Mikulá Preininger⁵², Loredana Punga⁵³, Diego Rossini⁴⁶, pela Rot⁵⁴, Habib Sani Yahaya⁵⁵, Irina A. Sekerina⁴⁴, Anne Skadina¹³, Jordi Solé-Casals⁵⁶, Lonneke van der Plas⁴⁶, Saara M. Varjopuro⁴³, Spyridoula Varlokosta⁵⁷, João Veríssimo³⁰, Oskari Juhapekka Virtanen⁴³, Nemanja Vracar⁵⁸, Mila Vulchanova³¹, Ahmad Wali¹⁰, Peizheng Wu², Nilgün Yücel⁵⁹, Stefan Frank²², Nora Hollenstein², Lena Jäger²
¹Kaunas University of Technology, ²University of Zurich, ³Human Language Technologies Research Center, University of Bucharest, ⁴University of Koblenz, ⁵Aalborg University, ⁶University of Zagreb, ⁷University of Wroclaw, ⁸Technion - Israel Institute of Technology, ⁹Cognitive Science Department, Jagiellonian University, ¹⁰University of Bucharest, ¹¹Silesian University of Technology, ¹²University of Bergen, ¹³University of Latvia, ¹⁴Basque Center on Cognition, Brain and Language; University of the Basque Country, ¹⁵University of Goettingen, ¹⁶Technion - Israel Institute of Technology, ¹⁷Institute for Literature and Arts, ¹⁸University College London, ¹⁹Università di Firenze, ²⁰University of Tirana, ²¹Institute of Linguistic and Literature, Academy of Sciences of Albania, ²²Radboud University, ²³Charles University (Prague), ²⁴University of Copenhagen, ²⁵Universitat Pompeu Fabra, ²⁶Bogaziçi University, ²⁷University of Ljubljana, ²⁸University of Valencia, ²⁹University of Tartu, ³⁰University of Lisbon, ³¹Norwegian University of Science & Technology, ³²Polytechnic University of Tirana, ³³University of Konstanz, ³⁴The Hong Kong Polytechnic University, ³⁵Singidunum University, ³⁶University of Belgrade, ³⁷UiT The Arctic University of Norway, ³⁸SWPS University, ³⁹The Hebrew University of Jerusalem, ⁴⁰University of Gdansk, ⁴¹Basque Center on Cognition, Brain and Language; Ikerbasque Basque Foundation for Science, ⁴²Dragomanov Ukrainian State University, ⁴³University of Turku, ⁴⁴City University of New York, ⁴⁵Leibniz Institute for Psychology, ⁴⁶Università della Svizzera italiana, ⁴⁷University of Galway, ⁴⁸Baskent University, ⁴⁹University of Santiago de Compostela, ⁵⁰Copenhagen University, ⁵¹Charles University, ⁵²Czech Academy of Sciences, ⁵³West University of Timi?oara, ⁵⁴St. Stanislav's Institution, ⁵⁵Gozak Media, ⁵⁶University of Vic Central University of Catalona, ⁵⁷National and Kapodistrian University of Athens, ⁵⁸University of Padua, ⁵⁹Marmara University

Sanskrit Travelogue: A Large-Scale Unified and Annotated Corpus of Sanskrit Texts
Giacomo De Luca¹, Danilo Croce², Roberto Basili²
¹University of Tor Vergata, ²University of Roma, Tor Vergata

The Foggia Occupator Corpus: Digitisation, Annotation, and Computational Analysis of an Occupation-Era Newspaper (1945-1946)
Michele Ciletti
University of Foggia

SiDiaC-v.2.0: Sinhala Diachronic Corpus Version 2.0
Nevidu Jayatilleke¹, Nisansa de Silva², Uthpala Sooriya-Arachchi³, Gagani Kulathilaka³, Azra Safrullah³, Johan Sofalas³
¹Department of Computer Science & Engineering, University of Moratuwa, ²University of Moratuwa, ³Informatics Institute of Technology

ShAnEL-2: A Multilingual Benchmarking Dataset for Short-Answer Language Learning Exercises
Jasper Degraeuwe¹ and Thomas Moerman²
¹Ghent University, ²Ghent University, LT3

The Swedish Parliamentary Motions Corpus 1867-2024
Robert Borges¹, Fredrik Mohammadi Norén², Lotta Åberg Brorsson³, Väinö Yrjänäinen⁴, Hanna Bäck⁵, Robert Klemmensen⁵, Måns Magnusson⁴
¹Uppsala University, ²School of Arts and Communication, Malmö University, ³The Riksdag Library, ⁴Department of Statistics, Uppsala University, ⁵Department of Political Science, Lund University

The Swedish Benchmark of Linguistic Minimal Pairs
Johan Sjons¹, Fredrik Heinat², Murathan Kurfali³
¹Department of Linguistics and Philology, Uppsala University, ²Språk- och litteraturcentrum, Lund University, ³RISE Research Institutes of Sweden

Exploring the Transfer of Irony Explanation Generation from English to Dutch
Aaron Maladry¹, Els Lefever², Cynthia Van Hee³, Veronique Hoste²
¹Ghent University, ²LT3, Ghent University, ³LT3, Language and Translation Technology Team (Ghent University)

DIDECO: An Annotated Dataset for Intent Detection in Digital Communications
Senaid Popovic¹, Damien Riquet², Maxime Meyer², Fabien Lauer³, Yannick Parmentier³
¹Université de Lorraine, ²Hornetsecurity, ³LORIA

15:20 - 17:00

Session P6.1.4: Corpora and Treebanks VII - Poster Area

GUMBridge: A Corpus for Varieties of Bridging Anaphora
Lauren Levine and Amir Zeldes
Georgetown University

Beyond Transcripts: Iterative Peer-Editing with Audio Unlocks High-Quality Human Summaries of Conversational Speech
Kaavya Chaparala¹, Thomas Thebaud², Jesus Villalba Lopez², Laureano Moro-Velazquez², Peter Viechnicki², Najim Dehak²
¹Johns Hopkins, ²Johns Hopkins University

SEEM-CZ: Annotation and Classification of Epistemic Markers in Czech
Barbora tepánková¹, Michal Novák², Tomá Musil³, Lucie Polakova³
¹Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics, ²Charles University, Faculty of Mathematics and Physics, ³Charles University

When Words Don't Mean What They Say: Figurative Understanding in Bengali Idioms
Adib Sakhawat¹, Shamim Parveen², Md Ruhul Amin², Tahera Khatun³, Shamim Mahmud², Md Saiful Islam⁴
¹Islamic University of Technology, ²Govt. Teachers' Training College, Rajshahi, ³Rajshahi Govt. Girl's High School, Helenabad, Rajshahi, ⁴Govt.Teachers' Training College, Rajshahi

Human vs LLM in Conversational Repair Annotation: A New Resource and Comparative Study
Anh Ngo¹, Nicolas Rollet², Catherine Pelachaud³, Chloé Clavel⁴
¹Inria, ²ALMAnaCH, INRIA Paris; Télécom Paris, SES, Institut Polytechnique de Paris, I3-CNRS, ³CNRS, ISIR, Sorbonne University, ⁴ALMAnaCH, INRIA Paris; Télécom Paris, LTCI, Institut Polytechnique de Paris

GPT-NL Public Corpus: A Permissively Licensed, Dutch-First Dataset for LLM Pre-training
Jesse Van Oort¹, Frank Brinkkemper², Erik de Graaf¹, Bram Vanroy³, Saskia Lensink¹
¹TNO, ²GPT-NL, ³Instituut voor de Nederlandse Taal & KU Leuven

Estonian WinoGrande Dataset: Comparative Analysis of LLM Performance on Human and Machine Translation
Marii Ojastu, Hele-Andra Kuulmets, Aleksei Dorkin, Marika Borovikova, Dage Särg, Kairit Sirts
University of Tartu

GENIUS Keylog Corpus - a German High School Student Corpus with Keystroke Logging Data
Nils-Jonathan Schaller¹, Thorben Jansen¹, Lars Höft¹, Hannah Pünjer¹, Andrea Horbach²
¹Leibniz Institute for Science and Mathematics Education, ²CAU Kiel / Leibniz Institute for Science and Mathematics Education

OTA-BOUN: A Historical Turkish Dependency Treebank
Tarik Tiras¹, Nureddin Ünal¹, Ada Cengiz¹, Ece Yurtseven², Esma Tasdemir³, Saziye Ozates⁴
¹Bogaziçi University, ²Robert College, ³Medeniyet University, ⁴Bogazici University

TCMPHal: A Large-scale Dataset for Hallucination Detection in Traditional Chinese Medicine Pharmacy
Nijia Han¹, Zimu Wang², Ziwen Xie¹, Wei Wang¹, Jia Meng¹, John Moraros¹, Shuihua Wang¹
¹Xi'an Jiaotong-Liverpool University, ²University of Liverpool

AraREQ: A Dataset and End-to-End System for Conflict Detection and Resolution in Software Requirements
Tymaa Hammouda¹, Alaa Aljabari¹, Nagham Hamad¹, Mustafa Jarrar²
¹Birzeit University, ²Hamad Bin Khalifa University

MAD: A Corpus of Multilingual Argumentative Deliberation
Eimear Maguire, Ella Schad, Jacky Visser, Chris Reed, John Lawrence
University of Dundee

Infox-QC: A Quebec-Focused French Corpus for Misinformation Detection and AI Robustness Assessment
Moetaz Doghmane¹, Hazem Amamou², Thiziri Sefsaf³, Alan Davoust⁴, Anderson Avila¹
¹Institut national de la recherche scientifique, ²Student, ³INRS, ⁴Université du Québec en Outaouais

unarXive 2024: A Large-Scale Scientific Corpus for Citation-Aware Retrieval and Generation
Ines Besrour and Michael Färber
TU Dresden

EPIC-EuroParl-UdS: Information-Theoretic Perspectives on Translation and Interpreting
Maria Kunilovskaya¹ and Christina Pollklaesener²
¹Saarland University, ²Hildesheim University

FeedFetcher: A Resilient Web Feed Downloader for Corpus Construction
Ondrej Herman¹, Jan Kraus², Vit Suchomel³
¹Masaryk University, ²Lexical Computing, ³Natural Language Processing Centre, Masaryk University

Human-in-the-Loop Mass Transcription and Ground Truth Annotation for Challenging Historical Documents
Norbert Fischer and Frank Puppe
Julius-Maximilians-Universität Würzburg

17:00 - 17:20

Coffee Break

17:20 - 19:00

Session O25: Corpora, Treebanks and Annotation - Room 1

17:20 - 17:40

CoMMA, a Large-scale Corpus of Multilingual Medieval Archives
Thibault Clérice¹, Simon Gabay², Malamatenia Vlachou-Efsthatiou³, Ariane Pinche⁴, Benoît Sagot⁵
¹ALMAnaCH, Inria, ²Université de Genève, ³Ecole nationale des ponts et chaussées, ⁴CNRS, ⁵Inria

17:40 - 18:00

Conversion of the Clark Hall Dictionary of Old English to TEI with RDF: An End-to-end Pipeline for Lexicographic Resource Retrodigitization
Sergei Stoliarov¹, Maxim Ionov², Fahad Khan³, Marina Buzzoni¹, Francesca Frontini⁴
¹Ca' Foscari University of Venice, ²University of Zaragoza, ³Istituto di Linguistica Computazionale "Antonio Zampolli", CNR, ⁴Istituto di Linguistica Computazionale "A. Zampolli" - ILC Consiglio Nazionale delle Ricerche - CNR

18:00 - 18:20

AMORES: A Spanish Language Resource for an Extended Set of Moral Foundations
Oscar Araque¹, Daniel Molina², Anny Alvarez Nogales³, Carlos A. Iglesias³
¹Universidad Politecnica de Madrid, ²SocialInnolabs, ³Universidad Politécnica de Madrid

18:20 - 18:40

The Moralization Corpus: Frame-Based Annotation and Analysis of Moralizing Speech Acts across Diverse Text Genres
Maria Becker, Mirko Sommer, Lars Tapken, Yi Wan Teh, Bruno Brocai
Heidelberg University

18:40 - 19:00

Targum a Multilingual New Testament Translation Corpus
Maciej Rapacz and Aleksander Smywinski-Pohl
AGH University of Kraków

17:20 - 19:00

Session O26: Named Entity Recognition, Speech Resources - Room 2

17:20 - 17:40

Trigger Warnings Are Grounded in a Shared Vocabulary: A Corpus Analysis with User-Generated Labels
Sebastian Heineking¹, Matti Wiegmann¹, Magdalena Wolska², Benno Stein², Martin Potthast³
¹University of Kassel, ²Bauhaus-Universität Weimar, ³University of Kassel, hessian.AI, and ScaDS.AI

17:40 - 18:00

ENEIDE: A High Quality Silver Standard Dataset for Named Entity Recognition and Linking in Historical Italian
Cristian Santini¹, Sebastian Barzaghi², Paolo Sernani¹, Emanuele Frontoni¹, Laura Melosi¹, Mehwish Alam³
¹University of Macerata, ²University of Bologna, ³Telecom Paris, Polytechnic Institute of Paris

18:00 - 18:20

YoNER: A New YorùBá Multi-domain Named Entity Recognition Dataset
Peace Falola¹, Jesujoba Alabi², Solomon Akinola¹, Folashade Ogunajo³, Emmanuel Alabi¹, David Ifeoluwa Adelani⁴
¹University of Ibadan, ²Saarland University, ³Atiba university, ⁴McGill University / MILA

18:20 - 18:40

Linking Rationale to Decision on Internet Standards: A Retrieval-Based Approach Using Synthetic Data
Jie Bian and Michael Welzl
University of Oslo

18:40 - 19:00

The GELATO Dataset for Legislative NER
Matthew Flynn, Timothy Obiso, Sam Newman
Brandeis University

17:20 - 19:00

Session O27: Simplification, Plain Language and Assistive Technologies - Room 3

17:20 - 17:40

Controllable Sentence Simplification in Italian: Fine-Tuning Large Language Models on Automatically Generated Resources
Michele Papucci¹, Giulia Venturi², Felice Dell'Orletta³
¹ItaliaNLP Lab @ CNR-ILC, Università di Pisa, ²Institute of Computational Linguistics "Antonio Zampolli" (ILC-CNR), ³ItaliaNLP Lab @ Institute for Computational Linguistics "Antonio Zampolli", ILC - CNR

17:40 - 18:00

Evaluating LLM-based Text Simplification for German: Effects on Post-Editing Effort, Quality Ratings, and User Comprehension
Luisa Carrer¹, Andreas Säuberli², Martin Kappus³, Lukas Fischer⁴, Sarah Ebling⁵
¹School of Applied Linguistics, ZHAW Zurich University of Applied Sciences, ²LMU Munich, ³Zurich University of Applied Sciences, ⁴Department of Computational Linguistics, University of Zurich, ⁵University of Zurich

18:00 - 18:20

Reading Time in the Wild: An Assessment of Readability Predictors Based on Naturally-Observed Reading Times
Sijbren van Vaals, Rik van Noord, Malvina Nissim
University of Groningen

18:20 - 18:40

Document-Level Text Simplification in Estonian Using Large Language Models
Meeri-Ly Muru¹ and Eduard Barbu²
¹National Library of Estonia, ²Institute of Computer Science

18:40 - 19:00

A Human-in/on-the-Loop Framework for Accessible Text Generation
Lourdes Moreno and Paloma Martínez
Universidad Carlos III de Madrid

17:20 - 19:00

Session O28: Applications Involving LRs and Evaluation II - Room 4

17:20 - 17:40

Automatic Analysis of Collaboration through Human Conversational Data Resources: A Review
Yi Yu¹, Maria Boritchev², Chloé Clavel³
¹Inria Paris, University of Sorbonne, ²Télécom Paris, Institut Polytechnique de Paris, ³INRIA

17:40 - 18:00

Benchmarking Arabic Authorship Attribution and Style Transfer with Large Language Models
Injy Hamed¹, Bashar Alhafni², Nizar Habash³, Thamar Solorio²
¹Mohamed bin Zayed University of Artificial Intelligence, ²MBZUAI, ³New York University Abu Dhabi

18:00 - 18:20

ADHD-Lang: A Large-Scale Social Media Dataset for Verbal Behavior and Digital Phenotyping in Adult ADHD
Daniel Wiechmann¹, Elma Kerz², Edward Kempa³, Yu Qiao²
¹Institute for Logic Language and Computation, ²Exaia Technologies, ³University of Florida, Department of Computer and Information Science and Engineering

18:20 - 18:40

SynBullying: A Multi-LLM Synthetic Conversational Dataset for Cyberbullying Detection
arefeh kazemi¹, Hamza Qadeer¹, Joachim Wagner², hossein hosseini³, Sri Balaaji Natarajan Kalaivendan¹, Brian Davis¹
¹Dublin City University, ²ADAPT Centre, Dublin City University, ³University of Isfahan

18:40 - 19:00

The Multilingual Euphemism Benchmark: Datasets and Baselines for Pragmatic Language Understanding
Whitney Poh¹, Julia Sammartino¹, Jasper Andrew¹, Witold Kieras², Natalia Zawadzka-Paluektau², Iryna Dilai³, Libby Barak¹, JIng Peng¹, Anna Feldman¹
¹Montclair State University, ²Institute of Computer Science, Polish Academy of Sciences, ³National University of Lviv

17:20 - 19:00

Session P7.1: Document Classification - Poster Area

Advancing Retrieval-Augmented Generation for Persian: Development of Language Models, Comprehensive Benchmarks, and Best Practices for Optimization
Sara Bourbour Hosseinbeigi¹, Mohammad Hossein Shalchian², Sina Asghari³, Mohammad Ali Seif Kashani⁴, Mohammad Amin Abbasi⁵
¹Department of Industrial and Systems Engineering, Tarbiat Modares University, ²Sharif University of Technology, ³Department of Computer Science, Iran University of Science and Technology, ⁴Department of Computer Engineering, Sharif University of Technology, ⁵Department of Computer Engineering, Iran University of Science and Technology

Corpus and Baselines for Distinguishing Authentic, AI-Generated, and AI-Enhanced Resumes
Andrea Loizidou¹, Anshu Sharma¹, Adrian Esquivel², Mark Finlayson³, Mustafa Ocal¹
¹Florida International University, ²TECKpert Inc., ³FIU

Mute Cods: A Multilingual Telegram Dataset with Benchmark Models for Conspiracy Theory Detection
Katarina Laken¹, Erik Marino², Paloma Piot³, Davide Bassi⁴, Søren Fomsgaard⁵, Michele Maggini⁶, Renata Vieira⁷, Marcos Garcia⁸, Sara Tonelli⁹
¹Fondazione Bruno Kessler, ²Universidade de Évora, ³Universidade da Coruna, ⁴Citius - Universidade de Santiago de Compostela, ⁵University of Caen, ⁶Centro Singular de Investigación en Tecnoloxías Intelixentes da USC, ⁷Évora University, ⁸Universidade de Santiago de Compostela, ⁹FBK

Push and Pull: Training Sentence Encoders with Contrastive Losses for Distance-Based Multi-Label Text Classification
Jens Van Nooten¹ and Andriy Kosar²
¹University of Antwerp, ²Textgain

PRIVaThe: An Annotated Dataset of Multi-Objectives Web Search Sessions
Claire Ibarboure¹, Ludovic Tanguy², Franck Amadieu¹, Josiane Mothe³
¹CLLE, UT2J, University of Toulouse & CNRS, ²CLLE: University of Toulouse & CNRS, ³INSPE, UT2J, University of Toulouse, CLLE & CNRS

Towards Safer Calls for Everyone: Designing a Benchmark Dataset for Evaluating Voice Phishing Detection Models
joeun kang¹, Gyuri Choi¹, Chanhyuk Yoon², Yongbin Jeong², Younggyun Hahm³, Shea Husband¹, Hansaem Kim¹
¹Yonsei University, ²Teddy Sum, ³Teddysum

Learning Long-Document Embeddings via ChunkContext Entailment
Waheed Ahmed Abro¹, Naïm Es-Sebbani², Zied Bouraoui²
¹SDAIA-KFUPM Joint Research Center for Artificial Intelligence, ²CRIL-CNRS & University of Artois

Scientific Article Section Classification (SASC) Dataset
Nicolau Duran-Silva¹, Julian Moreno-Schneider², César Parra-Rojas³, Georg Rehm²
¹SIRIS Lab, Research Division of SIRIS Academic & Universitat Pompeu Fabra, ²DFKI, ³SIRIS Lab, Research Division of SIRIS Academic

JMTEB and JMTEB-lite: Japanese Massive Text Embedding Benchmark and Its Lightweight Version
Shengzhe Li¹, Masaya Ohagi¹, Ryokan Ri², Akihiko Fukuchi¹, Tomohide Shibata¹, Daisuke Kawahara³
¹SB Intuitions Corp., ²Google DeepMind, ³Waseda University

Construction of a Japanese RAG Benchmark Using Synthetic Documents on Non-existent Entities and Events
Shengzhe Li¹, Masaya Ohagi¹, Hayato Tsukagoshi², Akihiko Fukuchi¹, Tomohide Shibata¹, Daisuke Kawahara³
¹SB Intuitions Corp., ²Nagoya University, ³Waseda University

C4: A Multilingual Benchmark for Retrieval-Augmented Generation Based on the Catechism of the Catholic Church and Its Compendium
Pius von Däniken¹, Mark Cieliebak², Jan Deriu²
¹Zurich University of Applied Sciences ZHAW, ²Zurich University of Applied Sciences

17:20 - 19:00

Session P7.2.1: Information Extraction and Text Mining IV - Poster Area

Contrastively Pre-trained Event Embeddings with Schema-free LLM Annotations
Frank Mtumbuka and Steven Schockaert
Cardiff University

A Dataset of Psychiatric Hospital Notes with Temporal Information Annotations
Timothy Miller¹, Gaby Dinh², David Harris², WonJin Yoon³, Spencer Thomas², Boyu Ren⁴, MEIHUA HALL⁵, Guergana Savova¹
¹Boston Children's Hospital and Harvard Medical School, ²Boston Children's Hospital, ³Boston Children's Hospital, Harvard University, ⁴Mass General Brigham, ⁵McLean Hospital, HMS

Format Matters: A Critical Evaluation of Output Formats for Prompting LLMs in SLU and NER
Pierre Lepagnol¹, Sahar Ghannay², Thomas Gerald³, Christophe Servan⁴, Sophie Rosset⁵
¹LISN - Université Paris-Saclay - SCIAM, ²CNRS, LISN, ³CNRS, Université Paris Saclay, LISN, ⁴AMIAD - CNRS, LISN, ⁵Université Paris-Saclay, CNRS, LISN

Identifying Imaging Follow-Up in Radiology Reports: A Comparative Analysis of Traditional ML and LLM Approaches
Namu Park¹, Giridhar Kaushik Ramachandran², Kevin Lybarger³, Fei Xia⁴, Özlem Uzuner³, Martin Gunn⁴, Meliha Yetisgen⁴
¹University of Washington, Seattle, ²Novartis Institutes for BioMedical Research, ³George Mason University, ⁴University of Washington

Efficient Topic Extraction via Graph-Based Labeling: A Lightweight Alternative to Deep Models
SALMA MEKAOUI¹, Hiba Sofyan², Imane Benchrif², Imane Amaaz², Ilham Chaker³, Arsalane Zarghili³, Nikola Nikolov¹
¹University of Limerick, ²Euromed University Of Fez | School of Digital Engineering and Artificial Intelligence, ³Faculty of Sciences and Technology, University Sidi Mohamed Ben Abdellah

From Noise to Signal: When Outliers Seed New Topics
Evangelia Zve¹, Gauvain Bourgne², Benjamin Icard², Jean-Gabriel Ganascia²
¹LIP6 - Sorbonne University, Infopro Digital, ²LIP6 - Sorbonne University

Explore Political Discourse with Transformers. Emergent Paradigmatic and Syntagmatic Representations.
Laurent Vanni¹ and Damon Mayaffre²
¹UMR 7320 BCL - Univ. cote d'azur - CNRS - France, ²UMR 7320 BCL - Univ. cote d'azur - CNRS - France

The Growing Gains and Pains of Iterative Web Corpora Crawling: Insights from South Slavic CLASSLA-web 2.0 Corpora
Taja Kuzman Pungerek¹, Peter Rupnik², Vit Suchomel³, Nikola Ljubeic¹
¹Joef Stefan Institute, ²JoÅ¾ef Stefan Institute, ³Natural Language Processing Centre, Masaryk University

MaritimEmails: A Synthetic Dataset for Maritime Chartering Correspondence
Kevin Bruendler and Simon Clematide
University of Zurich

eSciBench: An Extensible Scientific PDF Extraction Benchmark
Noah Tremblay Taillon¹ and Phillippe Langlais²
¹DIRO/RALI, ²University of Montreal

Vrittanta-AS: Dataset Development and Benchmarking for Event Trigger Detection and Classification in Assamese
Chaitanya Kirti, Dhrubajyoti Pathak, Ashish Anand, Prithwijit Guha
Indian Institute of Technology Guwahati

From Facts to Hypotheses: Joint Detection of Biomedical Relations and Epistemic Commitment Using LLMs
Aleksandra Gabryszak¹, Phuc Tran Truong¹, Arne Binder¹, Nikola Milosevic², Felix-Sebastian Keese³, Astrid Rheinländer³, Philippe Thomas⁴
¹German Research Center for Artificial Intelligence (DFKI), ²Bayer A.G., ³Bayer AG, ⁴German Research Center for Artificial Intelligence

SciLaD: A Large-Scale, Transparent, Reproducible Dataset for Natural Scientific Language Processing
Luca Foppiano¹, Sotaro Takeshita², Pedro Ortiz Suarez³, Ekaterina Borisova⁴, Raia Abu Ahmad⁴, Malte Ostendorff⁵, Fabio Barth⁶, Julian Moreno-Schneider⁶, Georg Rehm⁶
¹ScienciaLAB, DFKI, Inria, ²University of Mannheim, ³Common Crawl Foundation, ⁴German Research Center for Artificial Intelligence (DFKI), ⁵German Research Center for Artificial Intelligence, ⁶DFKI

CausalSense: Leveraging Common Sense Knowledge and LLMs for Joint Event Extraction and Relation Classification
Youssra REBBOUD¹, Pasquale Lisena², Raphael Troncy²
¹EURECOM, sophia antiopolis, ²EURECOM

17:20 - 19:00

Session P7.2.2: Information Extraction and Text Mining V - Poster Area

Large Language Models Are Good Term Extractors: A Systematic Evaluation
Ayla Rigouts Terryn
Université de Montréal, Mila

A Large-Scale Dataset for Linking-Based Geocoding
Hibiki Nakatani¹, Yuichiro Yasui², Ryosuke Wakamoto², Masayuki Ishii², Tetsuhisa Suizu¹, Hiroki Ouchi¹, Taro Watanabe¹
¹Nara Institute of Science and Technology, ²Nikkei Inc.

FiNERVINER: Fine-grained Named Entity Recognition for Vulnerable Languages of India's North Eastern Region
Prachuryya Kaushik and Ashish Anand
Indian Institute of Technology Guwahati

APTFiNER: Annotation Preserving Translation for Fine-grained Named Entity Recognition
Prachuryya Kaushik¹, Adittya Gupta¹, Ajanta Maurya¹, Gautam Sharma², V. Saradhi³, Ashish Anand¹
¹Indian Institute of Technology Guwahati, ²Indian Institute of Technology, Guwahati, ³Associate Professor

RelEx-PT: A Portuguese Sentence-Level Relation Extraction Dataset
Tomás Pinto¹, Catarina Silva², Hugo Goncalo Oliveira³
¹University of Coimbra, CISUC/LASI, DEI, ²University of Coimbra, ³CISUC, DEI, University of Coimbra

Benchmarking Portuguese Open Information Extraction
Gabriel Silva, Mário Rodrigues, António Teixeira, Marlene Amorim
Universidade de Aveiro

A Scalable Pipeline for Novelty Detection in Skill Extraction Using Large Language Models
Gian Seifert¹ and Simon Clematide²
¹University of Zürich, ²University of Zurich

Do LLMs Judge Distantly Supervised Named Entity Labels Well? Constructing the JudgeWEL Dataset
Alistair Plum¹, Laura Bernardy¹, Tharindu Ranasinghe²
¹University of Luxembourg, ²Lancaster University

From Articles to Premises: Building PrimeFacts, an Extraction Methodology and Resource for Fact-Checking Evidence
Premtim Sahitaj¹, Jawan Kolanowski², Ariana Sahitaj³, Veronika Solopova³, Max Upravitelev³, Daniel Röder⁴, Iffat Maab⁵, Junichi Yamagishi⁵, Sebastian Möller³, Vera Schmitt³
¹Technical University of Berlin, ²Harz University of Applied Sciences, Faculty of Automation and Computer Science, ³Technische Universität Berlin, ⁴Deutsches Forschungszentrum für Künstliche Intelligenz (DFKI), Speech and Language Technology Lab, ⁵National Institute of Informatics, Digital Content and Media Sciences Research Division, Tokyo

EpiGator: LLM-based Tracker of Infectious Outbreaks
Yiheng Wu, Jue Hou, Trangcasanchai Sathianpong, Lidia Pivovarova, Roman Yangarber
University of Helsinki

Relation Extraction across Entire Books to Reconstruct Community Networks: The AffilKG Datasets
Erica Cai¹, Sean Mcquade², Kevin Young¹, Brendan O'Connor¹
¹University of Massachusetts Amherst, ²Northwestern University

Vrittanta-EN: A Benchmark Dataset for Event Trigger Detection and Classification Advancing Event Understanding in English Narrative Discourse
Chaitanya Kirti, Ashish Anand, Prithwijit Guha
Indian Institute of Technology Guwahati

MUC-4 Revisited: Document-level Event Analysis beyond Span-based Arguments
Helene Olsen¹, Erik Velldal¹, Lilja Øvrelid²
¹University of Oslo, ²Dept of Informatics, University of Oslo

17:20 - 19:00

Session P7.3: Knowledge Representation and Graphs - Poster Area

Historical Medical Knowledge Graphs and Ontologies from the Medical History of British India Corpus (1850-1950)
Mehrdad Almasi and Tugce Karatas
University of Luxembourg

Graph-TempCZ: A Graph Representation of Software Mentions for Predicting Software Usage in Scientific Publications
Congfeng Cao¹, Pengyu Zhang², Jelke Bloem²
¹Institute for Logic, Language and Computation, University of Amsterdam, ²University of Amsterdam

Automatic Suggestions Help Extending Eventive Ontology: A Case Study on SynSemClass
Jana Strakova¹, Eva Fucíková², Zdenka Uresova², Jan Hajic²
¹Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics, ²Charles University

JPPB: Automatic Construction of a Soft-Labeled Japanese Patient Phrase Bank for Symptom Normalization
Tomohiro Nishiyama¹, Mana Kuramoto¹, Shoko Wakamiya², Eiji ARAMAKI³
¹Nara Institute of Science and Technology, ²NAIST, ³NAIST, Japan

How I Met Your Snowclone: Unsupervised Discovery of Snowclone Patterns in Large Datasets
Julien Bezançon¹, Gaël Lejeune², Marceau Hernandez³
¹Sorbonne Université, ²STIH, Sorbonne Université, ³CERES, STIH, Sorbonne universite

HOME-KGQA: A Benchmark Dataset for Multimodal Knowledge Graph Question Answering on Household Daily Activities
Shusaku Egami¹, Aoi Ohta¹, Tomoki Tsujimura², Masaki Asada², Tatsuya Ishigaki¹, Ken Fukuda³, Masahiro Hamasaki¹, Hiroya Takamura⁴
¹National Institute of Advanced Industrial Science and Technology (AIST), ²National Institute of Advanced Industrial Science and Technology, ³AIRC/AIST, ⁴The National Institute of Advanced Industrial Science and Technology (AIST)

Extending the Semantic Layer of the CompL-it Italian Lexicon: Traits, Semantic Types, and Definitions
Emiliano Giovannetti¹, Andrea Bellandi², Simone Marchi³, Mafalda Papini³
¹Istituto di Linguistica Computazionale "A. Zampolli" - CNR, ²Institute for Computational Linguistics - CNR, ³Cnr-Istituto di Linguistica Computazionale "A. Zampolli"

Integrating Knowledge Graph with Large Language Models for Multi-hop Question Generation
Yllias Chali and Al Hasib Mahamud
University of Lethbridge

LocalGovPL: A Corpus of Speaker-Attributed Polish Local Government Transcripts
Dariusz Czerski¹ and Maciej Ogrodniczuk²
¹Institute of Computer Science, Polish Academy oif Sciences, ²Institute of Computer Science, Polish Academy of Sciences

The Amharic DBpedia Chapter: A Knowledge Graph for a Low-Resource Language
HIzkiel Alemayehu¹, Tilahun Abedissa Taffa², Meti Bayissa³, Andargachew Zewge³, Hamada Zahera⁴, Ricardo Usbeck⁵, Axel-Cyrille Ngonga Ngomo⁴
¹University of Paderborn, ²University of Hamburg, ³Addis Ababa University, ⁴Paderborn University, ⁵Leuphana University Lueneburg

Cygnet: Refactoring the Open Multilingual Wordnet
Rowan Maudslay¹ and Francis Bond²
¹University of Cambridge, ²Palacky University

Masrad: Arabic Terminology Management Corpora with Semi-Automatic Construction
Mahdi Nasser¹, Laura Sayah¹, Fadi Zaraket²
¹Arab Center for Research and Policy Studies, ²American University of Beirut

17:20 - 19:00

Session P7.4: Opinion, Sentiment, Emotion Analysis - Poster Area

SentiMalti: A Maltese Sentiment Analysis Dataset and Models
Ian Caruana, Matthew Vella, Fabio Zammit, Kurt Micallef, Claudia Borg
University of Malta

Multilingual Structured Sentiment Analysis for Environmental Sustainability
Muhammad Okky Ibrohim¹, Tommaso Caselli², Cristina Bosco³, Valerio Basile¹
¹University of Turin, ²Rijksuniversiteit Groningen, ³Dipartimento di Informatica - Università di Torino

LLM-as-an-Annotator: Training Lightweight Models with LLM-Annotated Examples for Aspect Sentiment Tuple Prediction
Nils Constantin Hellwig, Jakob Fehle, Udo Kruschwitz, Christian Wolff
University of Regensburg

Extending Czech Aspect-Based Sentiment Analysis with Opinion Terms: Dataset and LLM Benchmarks
Jakub míd¹, Pavel Priban¹, Pavel Kral²
¹University of West Bohemia, Faculty of Applied Sciences, ²University of West Bohemia, Dept. of Computer Science and Engineering

AnnoABSA: A Web-Based Annotation Tool for Aspect-Based Sentiment Analysis with Retrieval-Augmented Suggestions
Nils Constantin Hellwig, Jakob Fehle, Udo Kruschwitz, Christian Wolff
University of Regensburg

Zero-Shot to Full-Resource: Cross-lingual Transfer Strategies for Aspect-Based Sentiment Analysis
Jakob Fehle, Nils Constantin Hellwig, Udo Kruschwitz, Christian Wolff
University of Regensburg

LoveHate: Stance Detection and Generation for Multiple Topics in User-generated Comments in Russian and English
Natalia Evgrafova, Veronique Hoste, Els Lefever
LT3, Ghent University

From Trial by Fire to Sleep like a Baby: A Lexicon of Anxiety Associations for 20K English Multi-Word Expressions
Saif Mohammad
National Research Council Canada

Entity-Level Sentiment Analysis with Sentence Relevance Detection
Egil Rønningstad¹, Roman Klinger², Lilja Øvrelid³, Erik Velldal¹
¹University of Oslo, ²University of Bamberg, ³Dept of Informatics, University of Oslo

Enhancing Multi-Label Emotion Analysis and Corresponding Intensities for Ethiopian Languages
Tadesse Destaw Belay¹, Dawit Gete², Abinew Ali Ayele³, Olga Kolesnikova⁴, Iqra Ameer⁵, Grigori Sidorov⁶, Seid Muhie Yimam⁷
¹Instituto Politécnico Nacional (IPN), Centro de Investigación en Computación (CIC), ²Wollo University, ³Bahir Dar University, ⁴Centro de Investigacion en Computacion del Instituto Politecnico Nacional, ⁵The Pennsylvania State University, ⁶CIC-IPN, ⁷University of Hamburg

A Japanese Dataset for Aspect-based Sentiment Polarity Classification and Emotion Intensity Estimation
Kentaro Hanafusa¹, Kota Manabe¹, Yuki Maeda¹, Daisuke Maekawa¹, Tomoyuki Kajiwara², Hideaki Hayashi³, Yuta Nakashima⁴, Hajime Nagahara⁴
¹Ehime University, ²Ehime University / The University of Osaka, ³The University of Osaka, ⁴Osaka University

17:20 - 19:00

Session P7.5: Argument Mining and Emotion Classification - Poster Area

Assessing the Persuasive Effect of AI-Generated Image Support of Arguments
Mackwyn Quadras¹, Manfred Stede¹, Henning Wachsmuth²
¹University of Potsdam, ²Leibniz University Hannover

CIARAM: Class Imbalance Aware Generative Framework for Relational Argument Mining
Nilmadhab Das¹, Sayan Pal², V. Saradhi³, Ashish Anand⁴
¹Research Scholar, ²Masters Scholar, ³Associate Professor, ⁴Indian Institute of Technology Guwahati

Surfacing Subtle Stereotypes: A Multilingual, Debate-Oriented Evaluation of Modern LLMs
Muhammed Saeed¹, Muhammad Abdul-Mageed², Shady Shehata³
¹PhD Student TU Dresden, ²The University of British Columbia, ³University of Waterloo

Prompt-Based Stance Control in German: An Evaluation of LLMs for Experimental Research on Attitude Change
Florian Omiecienski¹, Cornelia Sindermann², Agnieszka Falenska³
¹Universität Stuttgart - IMS, ²Psychological Assessment, Psychology of Individual Differences, and Psychological Methods, Charlotte Fresenius Hochschule University of Psychology, Heidelberg, Germany; Computational Digital Psychology, Interchange Forum for Reflecting on Intelligent Systems, University of Stuttgart, ³IMS, University of Stuttgart

CoSt-BR: A Language Resource for Conversational Stance Detection
Felipe da Fonseca¹, Ivandré Paraboni², Luciano Digiampietri¹
¹University of São Paulo, ²University of Sao Paulo

Less Is More? The Role of Demographic Author Information in Emotion Classification of Ambiguous Text
Sabine Weber, Lynn Greschner, Roman Klinger
University of Bamberg

Big Five Personality Prediction through Emotion-Conditioned Representations and Learnable Psycholinguistic Mapping
Lorenzo Zangari, Antonin Schnyder, Davide Picca
University of Lausanne

SENSEI-ASG: A Challenging Dataset for Argument Summary Graph Parsing
Jonathan Clayton¹, Marco Damonte², Robert Gaizauskas¹
¹University of Sheffield, ²Amazon

Categorical Emotions or Appraisals - Which Emotion Model Explains Argument Convincingness Better?
Lynn Greschner, Meike Bauer, Sabine Weber, Roman Klinger
University of Bamberg

Creation of the Estonian Subjectivity Dataset: Assessing the Degree of Subjectivity on a Scale
Karl Gustav Gailit¹, Kadri Muischnek², Kairit Sirts¹
¹University of Tartu, ²associate professor

End of Day 2

Conference Programme – Day 2