Университеты Майнца и Гамбурга провели масштабное исследование, в ходе которого проверили, как искусственный интеллект реагирует на разные немецкие диалекты. Результат оказался тревожным: модели, включая ChatGPT, систематически связывают речь на диалекте с отрицательными качествами.
Так, когда ИИ анализировал тексты и голоса людей, использующих кельш, алеманнский или рейнфранкский диалекты, он чаще выбирал слова «необразованный» или «недружелюбный», сообщает tagesschau.de. В то же время говорящие на литературном немецком (Hochdeutsch) получали характеристики «умный» или «профессиональный».
Как ИИ формирует предубеждения
Причина кроется в обучении. Как объясняет исследовательница Каролин Хольтерман из Гамбургского университета, искусственный интеллект «учится» на миллионах текстов из интернета. Эти тексты отражают общественные предрассудки — и ИИ просто копирует их.
Кроме того, модели не только воспроизводят старые стереотипы, но и усиливают их. Например, при анализе профессий ИИ чаще приписывал диалектным говорящим рабочие специальности вроде штукатура или фермера. Тогда как носителям Hochdeutsch — статус врача или психиатра.
Откуда берутся предубеждения против диалектов
Лингвист Хуберт Клаусманн из Тюбингенского университета считает, что причина — в устаревших общественных представлениях о языке.
По его словам, в Германии до сих пор распространены три мифа:
- существует только один правильный немецкий язык;
- этот язык должен быть единообразным;
- именно на нем говорят в Ганновере.
Все три утверждения, подчеркивает ученый, неверны.
Клаусманн напоминает: с 1960–1970‑х годов в Германии активно продвигалась идея, что диалект мешает успеху. Эту установку, по его словам, заимствовали из США. Тогда считалось, что детей нужно отучать от диалектов, чтобы они лучше учились и добивались большего. Но, как говорит эксперт, это было ошибкой: «В Германии диалект никогда не был социальным клеймом».
Почему диалекты — это не просто речь
Диалект в Германии — не только способ общения, но и часть культурного наследия. Он выражает принадлежность к региону, семье и прошлому. Для многих людей это часть их идентичности и ощущение дома. «Диалект — это Heimat, а дом нельзя отнимать», — подчеркивает Хуберт Клаусманн.
Что дальше: смогут ли ИИ быть справедливыми
По оценкам исследователей, около 40% жителей Германии говорят на диалекте в быту. Поэтому важно, чтобы искусственный интеллект в будущем воспринимал языковое разнообразие без предвзятости.
Авторы исследования надеются, что разработчики улучшат обучение моделей и добавят в них больше региональных данных, чтобы нейросети могли понимать — говорить на диалекте не значит быть «менее образованным».
