[Course Forum] 17000+ modern popular worlds (Eng for Rus)


(Zashibis) #1

The English course for Russian.
Ссылка на курс
Курс был создан автоматизированно на основе Google.
Я взял 50000 самых популярных слов, удалил то, что словами не является, получилось чуть больше 17000, которые и были выгружены в Memrise.
Вы можете взять исходники данного курса здесь и использовать их где-то еще, или даже вносить правки.
В данном форуме можно задавать вопросы по поводу курса, предлагать исправления.


17000+ modern popular words (Eng for Rus), error found
(Kisvadim) #2

Если автор на досуге добьет до “ровного счета” в 20K слов, то будет здорово!
А так конечно респект!


(Zashibis) #3

Курс создан автоматическими средствами, можно и 100к слов набить. Но добавлять слова имеет смысл, только если хоть кто-нибудь выучит эти 17000 :slight_smile:


(Zashibis) #4

Здесь можно почитать, как оптимизировать обучение в Memrise, и как еще можно учить язык.


(Arakchi) #5

А каким способом была получена выборка из 17к слов. Сам Ngram Viewer насколько я понял, в версии через сайт имеет ограничение в 5 слов на графике. API у него, как такового, я не нашёл. Данные скачивались и обрабатывались скриптом? Или возможно я что-то проглядел в справке?


(Zashibis) #6

На странице Ngram Viewer в самом низу страницы есть текст “Raw data is available for download”, там собственно можно скачать исходники - списки слов в виде текстовых файлов. Я скачал все файлы из раздела “1-grams” и скриптами на Python перегнал их в базу данных, а от туда уже достал отсортированные списки.
Потом другой питоновский скрипт забрал переводы слов с google translate, причем забирал только помеченные как “Популярные переводы”. Озвучку и транскрипцию я взял еще с нескольких ресурсов, тоже скриптами.
Ну и курс выложил на memrise еще одним скриптом, 17000+ слов примерно 3 дня выгружались.


(Petr N Rozhanskiy) #7

Вы проделали офигенную работу и сделали самый крутой курс на Мемрайзе. Я там уже два года каждый день ботаю. 40 тыс слов за два года выучил (разумеется, не только английский). И уверенно заявляю — Вашему курсу равных нет! (С поправкой на то, что новичкам все-таки не с него начинать надо)…
А реально ли что-то подобное сделать со словосочетаниями? Не все “смысловые единицы” выражаются одним словом. Есть много “вещей”, которые называются двумя словами, а то и тремя. Не говоря уже об устойчивых словосочетаниях, идиомах, фразовых глаголах и т.д…

P.S. Как бы мне научиться так же программировать как Вы? =) Где этому всему можно научиться?


(Zchenzo) #8

Очень жаль что Вы отсортировали вообще все слова в порядке частоты употребления в тексте. Имхо, числа, названия дней недели и месяцев, все имена собственные (London, Britain etc) стоило выделить в отдельный базовый уровень, где их можно пачкой заигнорить, или вообще исключить из курса.


(Petr N Rozhanskiy) #9

Да не говорите ерунды.
Если Вам нужна сортировка по темам — для этого есть очень много других курсов, в том числе у меня. По географии вообще есть много отдельных курсов на английском языке тут на Мемрайзе.
А сортировка частотных словарей — это отдельная тема. Проходить это конечно нужно уже после того как у Вас уровень языка intermediate, это не для новичков. И, в процессе прохождения частотного словаря, очень много слов нужно добавлять себе в игнор.


(Zchenzo) #10

petr.n.rozhanskiy
Вы вообще с кем разговариваете? Я писал о том, что по моему мнению есть в курсе лишнего, просто как отзыв, а вы телепатически оценили мой уровень, отправили учить курсы по географии и еще какой-то бред.


(Petr N Rozhanskiy) #11

Я лишь сказал, что то, что Вы ищете, есть в других курсах.
Если нужно — могу дать конкретные ссылки. Покопаться?
А частотные словари — это именно частотные словари, без разбивки по темам. В этом и заключается их специфика.
Что-то Вы слишком остро реагируете на критику -)

Вот тут, например, Вы можете найти отличные курсы с разбивкой по темам и от простого к сложному:
http://www.memrise.com/user/lvlmasterlvl/courses/teaching/
Курсы очень хорошие. Там не только слова, но и словосочетания. Суммарно 9000 слов/словосочетаний, но в сухом остатке не более 4000 отдельных слов. Я участвовал в их редактировании (проставлял синонимы вручную).
Кроме этого можете найти много тематических курсов на моей странице.

Calm down, bro -)


@zashibis,
К сожалению, этот идиотский форум Мемрайза не позволяет писать больше трех ответов в одной теме. Поэтому пишу методом редактирования предыдущего моего сообщения.

http://envoc.ru/code/idioms/idioms_a0.php
http://envoc.ru/code/frverb/frverb_a0.php
— тут есть хорошие списки идиом и фразовых глаголов в количестве нескольких тысяч с примерами употребления.
По поводу устойчивых словосочетаний — готовых списков не встречал -(
Если интересно — могу покидать еще кучу ссылок с готовыми списками словосочетаний разного рода… У меня на ноуте где-то пылятся…

Возможно ли сделать частотные словари по другим языкам? Немецкий-Испанский-Французский хотя бы… - ? Тут на Мемрайзе частотные словари только по английским словам… Возможно, это связано с тем, что по английским словам есть для этого какие-то готовые материалы, а возможно просто никто не заморачивался сделать такую офигенно полезную вещь по другим языкам…

Как мне научиться так же программировать? -)) Есть в интернетах какие-то курсы? Можете что-то порекомендовать?


(Zashibis) #12

Господа, не ссорьтесь :slight_smile:
Это базовый курс, тут все в кучу свалено. Пройдя 10 тысяч слов вы будете знать и дни недели, и месяца, и популярные города. Если вам срочно необходима какая-то особая тема (части тела, география и т.д.), то действительно можно пройти тематические курсы.
Про то, что курс “не для новичков” - не соглашусь. Если вы знаете 300 слов и алфавит - ничто не мешает начинать данный курс, первые 10 уровней содержат самые важные слова. Уровень Intermediate может спокойно игнорировать первые 20 уровней.
Про идиомы и фразовые глаголы: у меня есть список фразовых глаголов из 1000+ слов, я также могу довольно быстро составить список из 1000+ идиом. Скрипт отсортирует это все по популярности за пару дней, еще за 3-4 дня я могу сделать озвучку (если конечно надо). Главная проблема - найти качественные переводы, этого у меня просто нет и скриптами взять негде. Надо все обрабатывать вручную, а на это просто нет времени.


(Zchenzo) #13

Спасибо за предложения, но нет. За прошедшее время я сильно разочаровался в Мемрайзе. В основном из-за скудности настроек.

Самое разражающее это то, что новое слово будет повторяться 6 раз, даже если мне хватило 2-х или вообще одного. Бредовое значение, которое очень неэффективно расходует время.

Во -вторых невозможность редактирования. Например, в данном словаре часто попадается, что наиболее употребительного перевода вообще нет в списке (effciency, item, framework, latter), Или пара слов которые пишутся одинаково, но означают разное (не знаю как они правильно называются) - пример solution / decision по русски одинаково - решение. К таким очень хочется оставлять комментарии.

zashibis
Пожалуй, попробую перетащить вашу колоду к себе в Anki. Большое спасибо за проделанную работу!


(Zashibis) #14

Так вы пишите на форуме, что надо поправить в курсе, или прямо на гитхабе изменения предлагайте.
Все изменения вносятся в текстовый файл, потом я запускаю скрипт и он выполняет обновление курса на memrise, это все очень быстро можно сделать.


(Zashibis) #15

@petr.n.rozhanskiy,
Спасибо за ссылки, выглядят неплохо, попробую чуть позже создать курс из них.
Ранее я собирал материалы только в варианте “Фразовый глагол” - “Описание на английском”, это вроде как интереснее учить было бы.
“Немецкий-Испанский-Французский” - я к сожалению не владею этими языками вообще. У Google есть подборки слов для Китайского, Французского, Немецкого, Иврита, Итальянского, Русского и Испанского, но без базового знания языка из них не сделать Курс. Там ведь только сами слова без перевода, причем две трети из них вовсе не слова, а производные (прошедшее время и т.д.). После обработки скриптами все равно приходится проверять все глазками.
По поводу языков программирования, можете начать с этого: Учебник Python


(Petr N Rozhanskiy) #16

Ранее я собирал материалы только в варианте “Фразовый глагол” - “Описание на английском”, это вроде как интереснее учить было бы.

Что касается именно фразовых глаголов, то их удобнее всего учить в контексте, чтобы различать коннотации, ибо там очень много синонимов с тонкими различиями, примерно так: “come across (alt ‘came across’)” = “I suddenly [наткнуться; неожиданно встретить] Mike today in the shopping center”…

“Немецкий-Испанский-Французский” - я к сожалению не владею этими языками вообще. У Google есть подборки слов для Китайского, Французского, Немецкого, Иврита, Итальянского, Русского и Испанского, но без базового знания языка из них не сделать Курс. Там ведь только сами слова без перевода, причем две трети из них вовсе не слова, а производные (прошедшее время и т.д.). После обработки скриптами все равно приходится проверять все глазками.

Да, тут наверное посложнее… Но все равно, думаю, можно что-то придумать… Аналогов в интернете не видел, везде частотные словари только по английскому -(
А можно ссылки на гугловские подборки? Вдруг я через годик научусь как Вы программировать и тоже попробую что-то похожее сделать…

По поводу языков программирования, можете начать с этого: Учебник Python

Я проходил курсы Python на Coursera.Org и Stepic.Org. Но, насколько я понимаю, здесь другое задействовано: JS с какими-то готовыми фреймворками…
Можно даже без ссылок — можете просто сказать какие языки и фреймворки нужно изучить? Не начальный этап, а весь фронт работ… Учебные материалы я уже найду сам -)
Всегда впечатляло как такие люди за несколько часов пишут программу и она еще за несколько часов делает то, что челове вручную делает годами… Очень хочу так же уметь и готов много и долго учиться -)


(Zashibis) #17

Для подготовки данного курса я использовал именно Python и библиотеку Selenium. Мой скрипт открывает браузер и имитирует поведение пользователя (только в разы быстрее). Т.е. я не использовал JS напрямую, тут достаточно базовых навыков HTML. Это очень примитивно, работает нестабильно и относительно медленно. Но я потратил на скрипт всего 2 часа :slight_smile:


(Petr N Rozhanskiy) #18

И да, насчет словосочетаний.
Я имел ввиду не только фразовые глаголы и идиомы, а просто устойчивые словосочетания, когда одно понятие выражается двумя-тремя словами. Ну например:
windshield wiper = дворник (автомобильный)
rain cloud = туча
to get wet = промокнуть
to lose one’s way = заблудиться
artificial lake = водохранилище
to take aim at = целиться в
barbed wire = колючая проволока
machine gun = пулемет
chain armour = кольчуга
dead end = тупик (конец дороги)
death penalty = смертная казнь
… перечислять можно очень долго: есть многие тысячи устойчивых словосочетаний. и знание отдельных слов не поможет — нужно заучивать готовые словосочетания в этом случае…

За ссылки спасибо. Даже не думал что все это можно одним только Python’ом сделать…


(Frid Reich28) #19

Спасибо за курс!
Подскажите пожалуйста каким образом можно убрать одну из озвучек?


(Zashibis) #20

Сейчас озвучка загружена одной сплошной аудио-дорожкой: два варианта на американском-английском, потом через паузу два варианта британского английского. Т.е. сейчас вы никак от нее не избавитесь.
Я могу разбить озвучку на две дорожки:

  1. два варианта американского английского
  2. два варианта британского английского.
    Либо:
  3. вариант US, через паузу вариант UK
  4. второй вариант US, через паузу второй вариант UK
    В этом случае при изучении вам всегда будет воспроизводиться первая дорожка, а вторую можно будет послушать опционально - только при просмотре информации о слове.
    Это уже вопрос ко всем изучающим курс - подойдет ли вам такое?