Нейросети проанализировали тысячи текстов книг, статей и дискуссий на английском и выявили слова, на которые имеет смысл тратить время.
В советских и постсоветских школах важно было знать грамматику. Поэтому их выпускникам сложно разговаривать. Английский изучали по абстрактным героям учебников, энциклопедиям и литературе, упуская самое важное — обычную человеческую речь.
Сколько слов нужно знать?
Составители современных учебных программ хором произносят цифру 3000 — это такой «золотой запас» английских слов. Мы назвали его Gold 3000 и сейчас все про это расскажем.
Это вообще сколько?
3000 слов — это первая глава поэмы Евгений Онегин, 15 страниц текста А4 12 кеглем, полчаса неторопливого чтения вслух. Словом, это не так уж много. Но здесь начинается tricky thing. Нельзя выучить три тысячи любых слов и быть уверенным, что свободно знаешь язык. Это как пытаться составить слово «счастье» из известного набора букв.
А какие английские слова учить?
Чтобы сойти за человека, который говорит по-английски, учить нужно распространенные, разговорные слова, устойчивые выражения, фразы высокой частотности, которые все собраны в одном списке от составителей Оксфордовского словаря. Чтобы профессионально расти — нужны те, что относятся к вашей профессии. Чтобы разбираться в предмете — по предмету.
Кто учил частотные слова, тот легко читает тексты в New York Times, смотрит BBC и общается с носителями о Брекзите и Дональде Трампе. Потому что занимался по подходящим и актуальным материалам. А кое-кто в это время зачем-то запоминал слово serendipity, чтобы потом встретить его однажды в статье о биполярном расстройстве.
Сколько слов есть вообще?
Успокойтесь, всех слов не знает никто. Более-менее образованный носитель английского языка в среднем владеет запасом от 10 000 до 30 000 слов.
Составители легендарного словаря Мacmillan считают, что 2500 самых частотных выражений покрывают 80% английской речи. 7500 слов покрывают уже 90% речи. То есть, выучив больше, вы зарабатываете себе шансы общаться на профессиональные темы, читать тематическую литературу или как-то особенно глубоко говорить о своих чувствах.
Как они это поняли?
Это понял искусственный интеллект, выполнив компьютерный анализ тысячи текстов книг, статей, сочинений и обсуждений (сейчас в корпусе Macmillan уже 1,6 млрд слов).
Авторы словаря Longman выделили 3000 (в реальности чуть больше) слов, которые, согласно их исследованию. покрывают 86% всех текстов на английском языке.
Оксфордский словарь также имеет собственный список самых важных слов английского языка. Здесь их тоже 3000 (и тут округлили в меньшую сторону до ровного числа), но авторы не упоминают, какой процент речи и/или текстов они помогут понять.
Так и что это за слова?
Для примера можно прогнать фрагмент статьи The Guardian в специальном сервисе Оксфордского словаря, который показывает, сколько слов из списка Oxford 3000™ используются в тексте. Как видно, 90% текста приходится на те самые 3000 самых частотных слов.