"Яндекс" изучил использование слов из словаря Даля в поиске
Почти 40% из них полностью вышли из употребления
Москва. 29 ноября. INTERFAX.RU - "Яндекс" к стопятидесятилетию публикации словаря Даля выпустил исследование об использовании слов из этого словаря в поисковых запросах.
Словарь Даля, как отмечается в пресс-релизе, дает толкование примерно двухсот тысяч слов. Как оказалось, почти 40% из них полностью вышли из употребления. Примерно треть слов из словаря (32%) распространены до сих пор, еще чуть меньше 30% - используются, но крайне мало, треть из них - только при поиске значений.
Рассказывая о методе исследования, "Яндекс" поясняет, что почти одну пятую часть слов из словаря Даля, 18%, можно считать полностью вышедшими из употребления - в течение года люди ничего не искали с помощью этих слов и даже не спрашивали про их значение. Примерно 38% слов упоминались в поисковых запросах к "Яндексу", но отсутствовали в Национальном корпусе русского языка за XX и XXI века - такие слова в исследовании называются уходящими (с оговоркой, что вряд ли можно назвать живым слово, которое есть в письменных текстах, но встречается в запросах всего несколько раз в год, или слово, которое вводят в поиск только для того, чтобы узнать значение). В пересечение поиска и корпуса попали 44% слов, их "Яндекс" называет живыми.
Часть словаря могла попасть в поиск и корпус из-за омонимии, отмечается в описании метода: пишется так же, но значит другое. У Даля встречаются такие популярные в интернете слова, как порно, двач, прикол, клубняк - но совсем в другом значении. Иногда написание слов у Даля совпадает с распространенной в поиске ошибкой или опечаткой - навинка, кател, насиление, загатка. Также бывает, что слово ушло из русского языка, но сохранилось в украинском (ознак, соромиться, метелик), или остались родственные ему фамилии и названия населенных пунктов (верховец, хопер, пустовар). Омонимами оказались почти треть изученных слов.
В результате "Яндекс" изменил подход и стал относить к вышедшим из употребления словам не только те, которые ни разу не встретились ни в запросах, ни в текстах из корпуса русского языка, но и те, которые оказались там из-за омонимии или по ошибке. К словам, которые уходят из языка, причислили встретившиеся в поисковых запросах менее 10 раз в год, те, которые искали сравнительно мало и для которых в интернете не удалось найти примеров употребления, а также те, которые искали в первую очередь для того, чтобы узнать значение.
Что касается ушедших слов, то доля глаголов среди этих них заметно больше, чем в словаре в целом, а доля существительных - меньше. То есть, глаголы из словаря Даля устаревают быстрее, чем существительные. Около 85% ушедших глаголов содержат приставки. Самая распространенная, по-, встречается в каждом пятом случае, иногда в комбинации с другими приставками: понасудачить, попринаряжать, повзопреть. Почти треть существительных оканчивается на -ье или -ие и означает действие по соответствующему глаголу: вывороченье, избоданье, ловничанье. Много существительных на -чик, -чица, -ник, -ница и так далее. Часто они обозначают людей определенных занятий - как правило, эти занятия больше не актуальны или изменили название: наживотчик, каравайщик, нравописательница. Вообще вышедшие из употребления слова часто образованы от корней, которые вполне используются и сейчас: переребячиться, злодейчивый, заволшебствовать, отблинничать, испивочный, поплеванье - сегодня так не говорят, но можно легко догадаться, что имеется в виду.
При этом, всего около 8,5% слов из словаря Даля интересуют пользователей в первую очередь в контексте поиска значения. Из них самые популярные: инсинуация, демагогия, утрировать, моногамия и импонировать. Большая часть таких слов отсутствует в текстах из корпуса и мало распространена в запросах.