Англійські «люди» виявилися швидше чоловіками

Контекстуальний аналіз інтернет-корпусу англійської мови показав, що збірні існуючі, які використовуються для опису людей без зазначення статі, - не гендерно-нейтральні. Контекст, в якому використовується слово виявився значно ближчим до «чоловічого», ніж до «жіночого». Через це, навіть якщо люди використовують формально нейтральні збірні, вони частіше мають на увазі чоловіків, ніж жінок, пишуть лінгвісти в.


Якщо подібні об'єкти можна об'єднати в одну групу і розглядати її як єдине ціле, то в мові для неї зазвичай є окреме збірне слово. У формі збірних існуючих крісла, столи і шафи перетворюються на, молоді люди - на, а птахи - на. Але якщо збірні існуючі описують групу людей, то в них втрачається інформація про поле окремих її членів, і за замовчуванням вони можуть бути і чоловіками, і жінками в будь-якому співвідношенні. Проте вчені припускають, що ці слова не завжди залишаються гендерно-нейтральними і часто мовчки передбачають, що її члени - швидше чоловіки.


У випадку з існуючими або займенниками множинного числа аналогічне зміщення балансу проявляється і на лексичному рівні: наприклад в англійській (люди) або французькій (вони). Але гендерну нейтральність збірних існуючих оцінити за формальними ознаками не можна. При цьому, на думку психологів і соціолінгвістів, когнітивні спотворення, викликані цим гендерним дисбалансом, можуть впливати і на соціальне середовище, і на політичні рішення, і на самосприйняття людства в цілому або його окремих спільнот.

І оскільки граматичних категорій, які підтверджують або спростовують гіпотезу ненейтральності базових збірних існуючих, немає, то робити це потрібно за якимись іншими ознаками. Лінгвісти з Нью-Йоркського університету під керівництвом Ейпріл Бейлі (April H. Bailey) запропонували для такої перевірки в англійській мові використовувати контекстуальний аналіз вживання слова та інших нейтральних збірних існуючих для груп людей. Вчені проаналізували корпус Common Crawl, який включає тексти приблизно з трьох мільярдів сайтів - сумарно в нього входить 630 мільярдів слів.

Для аналізу контекстів вчені використовували метод векторної вистави вживаних слів. Кожне слово при такому підході представляється у формі багатовимірного вектора, який фактично показує, в оточенні яких слів цікаве нас зустрічається в корпусі найчастіше.

Всього вчені провели три дослідження. Перше дослідження - пряме порівняння. У ньому лінгвісти визначали, на що контекстуально більше схоже слово - на або. Для цього вони порівняли існуючі і займенники, які в мові використовуються, щоб позначити чоловіків (, і аналогічні їм - всього 36 слів), жінок (, і їхні синоніми - всього 38 слів) і людей в цілому - без формальної вказівки статі (,, і тому подібні - всього 30 слів).

У другому і третьому дослідженнях лінгвісти порівнювали вже не самі існуючі, які позначають людей, жінок і чоловіків, а дивилися на контекст, в якому зустрічаються 716 визначень і 252 дієслова для опису людей незалежно від їх статі. Вчені порівняли, наскільки часто ці слова зустрічаються поруч зі словами для позначення чоловіків і жінок з першого списку.

Подібність визначали, вимірюючи косинусний коефіцієнт - це косинус кута між векторами понять у багатовимірному просторі. Чим більший цей коефіцієнт, тим більше поняття схожі один на одного. Якщо коефіцієнт дорівнює одиниці, подібність повна і контексти завжди збігаються. Якщо дорівнює нулю, то контексти не перетинаються взагалі ніколи. Відповідно, якщо окремо порахувати коефіцієнти схожості між «чоловічим» і «збірним» контекстами і «жіночим» і «збірним» контекстами, то їх різниця повинна, на думку авторів, довести, що - це швидше, ніж.


У всіх трьох дослідженнях «чоловічі» слова виявилися набагато ближчими до збірних словами, ніж «жіночі». Різниця в коефіцієнтах склала від 0,009-0,001 до 0,018-0,004 (p < 0,001) - завжди на користь «чоловічого» контексту.

Крім того, вчені перевірили, як з контекстом пов'язано використання визначень і дієслів з вираженою гендерною фарбою, яка з'явилася через культурну стереотипизацію. Наприклад: (гостинний/-ая), (прискіпливий/-ая), (складний/-ая) і (пліткувати), (цілувати), (скаржитися) - для жінок, і (напористий/-ая), (зарозумілий/-ая), (раціональний/-ая) і (обманювати), (поважати), (вбивати) - для чоловіків. Різниця у використанні «чоловічих» і «жіночих» стереотипних визначень і дієслів виявилася більш вираженою для «жіночих» існуючих, ніж для «чоловічих». Це, на думку лінгвістів, теж підтверджує їх початкову гіпотезу, що всередині збірних існуючих - за замовчуванням швидше чоловіки, ніж жінки.

Автори роботи дійшли висновку, що коли в текстах люди пишуть формально нейтральне збірне, вони частіше мають на увазі чоловіків, ніж жінок. Це спотворення, у свою чергу, призводить до того, що чоловіки опиняються у більш виграшному соціальному становищі. Вчені сподіваються, що їхні результати допоможуть якимось чином пом'якшити цю нерівність, зокрема на рівні методів комп'ютерного аналізу тексту.

На відміну від контекстуальної гендерної ненейтральності для збірних існуючих, яка визначається культурою, в окремих існуючих, наприклад для позначення професій, вона проявляється на рівні лексики та граматики. Пом'якшувати дисбаланс пропонують, наприклад, використовуючи фемінітиви. Детальніше про їх історію ви можете прочитати в матеріалах «Доісторичні фемінітиви» і «Підступні суфікси».

COM_SPPAGEBUILDER_NO_ITEMS_FOUND