Форум Протвино
 

Видео от Романа Фурцева


Яндекс.Метрика

 
Вернуться   Форум города Протвино > Протвино - город > Великий и могучий
Регистрация Справка Пользователи Календарь Поиск Сообщения за день Все разделы прочитаны

Великий и могучий Как мы говорим и пишем? Наблюдаем и обсуждаем.

Ответ
 
Опции темы Опции просмотра
  #1  
Старый 17.02.2016, 21:59
Аватар для Empedocles
Empedocles Empedocles вне форума
490 - 430 до Р.Х.
 
Регистрация: 18.08.2006
Сообщения: 205
Вес репутации: 843
Empedocles стоит на развилке
Сколько слов в русском языке?

Озадачив этим вопросом Гугл, можно получить, например,
https://ru.wikipedia.org/wiki/Словарный_запас

Там утверждают, что в русском языке около 500 тыс. слов и дают такую библиографическую ссылку:
В. Пекелис «Кибернетическая смесь», М., "Знание", 1991, стр. 323-324; "IEEE Proc.", 1985, Vol.68, No.7

Ещё раньше в книге Льва Успенского «Слово о словах» (1971 г., 5-е издание) отмечается, что, «Сотрудники словарного отдела (Института языкознания в Ленинграде) полагают, что ими зарегистрировано около 400–500 тысяч разных русских слов.
http://www.audit-it.ru/articles/soft/a119/597862.html

В последнее время многие говорят и пишут, называют различные числа, и не только о русском языке. Но нигде слова и словосочетания во всём их многообразии невозможно «потрогать руками».

Такую возможность теперь предоставляет

БОЛЬШОЙ РУССКИЙ СЛОВАРЬ-СПРАВОЧНИК
СИНОНИМОВ (близких по смыслу слов)
Автор — ТРИШИН Виталий Николаевич


Его адрес: trishin.da.ru
Ответить с цитированием
  #2  
Старый 18.02.2016, 02:45
Аватар для Василий
Василий Василий вне форума
Вольноопределяющийся
 
Регистрация: 27.12.2006
Сообщения: 3,555
Вес репутации: 2212
Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть
Не желая уводить разговор в сторону (словарь-то ценный), не могу удержаться, чтобы не вспомнить матроса Володю из кино "Красная площадь". Он был убеждённым анархистом и со своим звериным чутьём толпы вот как он начал одну из своих самых ярких речей:

- В русском языке имеется полтора миллиарда слов. Это вычислил ученый…
(кто-то из толпы) - Какой?
- Менделеев! Но он так и не смог определить, какие из них два слова самые дорогие. А я могу, сразу. Самые драгоценные слова — это свобода и воля!
(в воздух летят шапки, толпа ревёт от восторга)

Хорошо сделанный фильм с яркими персонажами. Понятно, что пропаганда и героизировать гражданскую войну нехорошо, а снято талантливо.

Ещё раз извините за отступление от темы.
Ответить с цитированием
  #3  
Старый 18.02.2016, 09:41
Аватар для Armageddon
Armageddon Armageddon вне форума
Мегасолнцеще
 
Регистрация: 15.09.2005
Сообщения: 2,690
Вес репутации: 1846
Armageddon . Такую репутацию нельзя пошатнуть Armageddon . Такую репутацию нельзя пошатнуть Armageddon . Такую репутацию нельзя пошатнуть Armageddon . Такую репутацию нельзя пошатнуть Armageddon . Такую репутацию нельзя пошатнуть Armageddon . Такую репутацию нельзя пошатнуть Armageddon . Такую репутацию нельзя пошатнуть Armageddon . Такую репутацию нельзя пошатнуть Armageddon . Такую репутацию нельзя пошатнуть Armageddon . Такую репутацию нельзя пошатнуть Armageddon . Такую репутацию нельзя пошатнуть
Даже представить невозможно, что эти слова обозначают. Большинство, наверное, не более 5 тыс. всего знают и пользуются. А на форуме за всю историю его существования и 3 тыс. не применено.
__________________

Ответить с цитированием
  #4  
Старый 18.02.2016, 09:53
OBender OBender вне форума
Эксперт
 
Регистрация: 03.10.2009
Сообщения: 1,122
Вес репутации: 0
OBender , кажется, это ваша репутация OBender , кажется, это ваша репутация OBender , кажется, это ваша репутация OBender , кажется, это ваша репутация OBender , кажется, это ваша репутация OBender , кажется, это ваша репутация OBender , кажется, это ваша репутация OBender , кажется, это ваша репутация
Цитата:
Словарь Вильяма Шекспира, по подсчету исследователей, составляет 12 000 слов. Словарь негра из людоедского племени «Мумбо-Юмбо» составляет 300 слов.
Эллочка Щукина легко и свободно обходилась тридцатью.
.
Ответить с цитированием
  #5  
Старый 18.02.2016, 11:33
Аватар для All Eyez On Me
All Eyez On Me All Eyez On Me вне форума
big bro's watchin' ya
 
Регистрация: 09.07.2007
Адрес: out there
Сообщения: 3,667
Вес репутации: 2172
All Eyez On Me . Такую репутацию нельзя пошатнуть All Eyez On Me . Такую репутацию нельзя пошатнуть All Eyez On Me . Такую репутацию нельзя пошатнуть All Eyez On Me . Такую репутацию нельзя пошатнуть All Eyez On Me . Такую репутацию нельзя пошатнуть All Eyez On Me . Такую репутацию нельзя пошатнуть All Eyez On Me . Такую репутацию нельзя пошатнуть All Eyez On Me . Такую репутацию нельзя пошатнуть All Eyez On Me . Такую репутацию нельзя пошатнуть All Eyez On Me . Такую репутацию нельзя пошатнуть All Eyez On Me . Такую репутацию нельзя пошатнуть
Цитата:
Сообщение от Armageddon Посмотреть сообщение
Даже представить невозможно, что эти слова обозначают. Большинство, наверное, не более 5 тыс. всего знают и пользуются. А на форуме за всю историю его существования и 3 тыс. не применено.
Это, грубо говоря, не так. Начав учить следующий иностранный язык, например, я быстро обнаружил, что знаю около тысячи слов (в программе есть статистика изученных). Думаю, что 5 тыс. слов даже для среднего человека маловато, скорее их количество стремится к 10 тыс. Другое дело, что с пониманием смысла некоторых слов и их грамотным применением у среднего человека могут быть большие проблемы.
Ответить с цитированием
  #6  
Старый 18.02.2016, 13:21
Аватар для Armageddon
Armageddon Armageddon вне форума
Мегасолнцеще
 
Регистрация: 15.09.2005
Сообщения: 2,690
Вес репутации: 1846
Armageddon . Такую репутацию нельзя пошатнуть Armageddon . Такую репутацию нельзя пошатнуть Armageddon . Такую репутацию нельзя пошатнуть Armageddon . Такую репутацию нельзя пошатнуть Armageddon . Такую репутацию нельзя пошатнуть Armageddon . Такую репутацию нельзя пошатнуть Armageddon . Такую репутацию нельзя пошатнуть Armageddon . Такую репутацию нельзя пошатнуть Armageddon . Такую репутацию нельзя пошатнуть Armageddon . Такую репутацию нельзя пошатнуть Armageddon . Такую репутацию нельзя пошатнуть
Цитата:
Сообщение от All Eyez On Me Посмотреть сообщение
Это, грубо говоря, не так. Начав учить следующий иностранный язык, например, я быстро обнаружил, что знаю около тысячи слов (в программе есть статистика изученных). Думаю, что 5 тыс. слов даже для среднего человека маловато, скорее их количество стремится к 10 тыс. Другое дело, что с пониманием смысла некоторых слов и их грамотным применением у среднего человека могут быть большие проблемы.
В Википедии нашёл:
Цитата:
По современным оценкам словарный запас учащегося первого класса школы составляет 2000 слов. Человек с высшим образованием знает порядка 10 тыс. слов, эрудиты — до 50 тыс. слов
Не знаю как подсчитывается СЗ, если туда входят имена и названия, то вполне возможен словарный запас примерно до 10 тыс. слов.
__________________

Ответить с цитированием
  #7  
Старый 20.02.2016, 12:47
Аватар для Empedocles
Empedocles Empedocles вне форума
490 - 430 до Р.Х.
 
Регистрация: 18.08.2006
Сообщения: 205
Вес репутации: 843
Empedocles стоит на развилке
БОЛЬШОЙ РУССКИЙ СЛОВАРЬ-СПРАВОЧНИК СИНОНИМОВ (близких по смыслу слов)

После преодоления в течение двух дней небольших затруднений на сервере словарь обрёл в полном объёме свою функциональность и может быть рекомендован для активного использования.

Я согласен с замечанием Василия. Это действительно очень ценный словарь. Автор Виталий Николаевич Тришин, подобно Владимиру Ивановичу Далю вложил в его создание многолетний каждодневный труд.

Впечатления первых пользователей интерактивного словаря несколько омрачаются необходимостью подождать полминуты-минуту, когда сервер ответит на выданный ему поисковый запрос. Чтобы чрезмерно не испытывать терпение пользователя, выдача одноразового списка синонимов ограничена числом 40.

Это ограничение усложняет выдачу списка синонимов, где их больше 40, только у 0.9% слов. Больше 1000 синонимов (в расширенном смысле) у 9 слов. Это минерал — 5650 синонимов, растение — 4580, город — 2937, река — 2131, лекарство — 1418, рабочий — 1220, имя — 1152, препарат — 1077 и болезнь — 1022 синонимов. В среднем получается 2112 / 577 = 3.7 синонима на слово.

По мнению автора, «этот словарь практически показывает, что по количеству слов русский язык относится к наиболее развитым языкам мира, а по масштабу и плотности пространства синонимов (а также рифм, интонаций) ему нет равных».

В.И. Даль писал об отрыве письменного языка от живого русского языка: «Живой народный язык, сберегший в жизненной свежести дух, который придает языку стойкость, силу, ясность, целость и красоту, должен послужить источником и сокровищницей для развития образованной русской речи».

Данный словарь-справочник и является попыткой продолжения словаря В.И. Даля на современной живой бесцензурной языковой основе (кроме обсценной лексики).

Последний раз редактировалось Empedocles, 20.02.2016 в 12:57. Причина: синтаксис
Ответить с цитированием
  #8  
Старый 20.02.2016, 14:15
Аватар для Василий
Василий Василий вне форума
Вольноопределяющийся
 
Регистрация: 27.12.2006
Сообщения: 3,555
Вес репутации: 2212
Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть
Словарь, безусловно, достоин внимания, поддержки и развития. Хотел бы призвать, однако, присмотреться к опыту более зрелых в отношении филологии культур - как они работают со словарным материалом и его организацией. В этом нет ничего зазорного, ведь русская филология - относительно молодая отрасль знания, развитие которой к тому же подверглось суровым историческим испытаниям.

В отношении конкретно синонимических словарей конкретно английского языка, могу посоветовать вот эту подборку: English language -- Synonyms and antonyms -- Dictionaries Этот список даёт представление о разнообразии и исторической глубине усилий, прилагавшихся к составлению синонимических словарей. Я не знаком со всеми словарями из этого списка, но однажды зашёл в лавочку, которая торгует б/у вещами, безделушками и книжками, и отоварился там по цене чашки кофе упомянутым в списке словарём Крэбба (Crabb's English Synonyms). Это переиздание 1966-года года обновлённого в 1916-м году издания изначального словаря, выпущенного в 1816-м году - к столетию оного. Когда совсем нечего делать или возникает желание оживить свои, по выражению Эркюля Пуаро, "маленькие клеточки серого вещества", открываю его на произвольном месте и читаю какую-нибудь статью. Статья устроена следующим образом: перечислены синонимы и близкие по смыслу слова, дана краткая справка об их происхождлении (часто старофранцузском, англосаксонском или латинском) и объяснены оттенки смысла с примером употребления того или иного синонима в той или иной ситуации. То есть это отчасти этимологический и отчасти толковый словарь - но лишь постольку, поскольку это важно для понимания оттенков смысла синонимов.

Конечно, никто не ожидает, что подобные глубокие изыскания могут быть сделаны одним или несколькими любителями русского языка. Однако, мне кажется, некоторые пояснения, почему то или иное слово в словаре считается синонимом другого слова, просто необходимы. Например, по слову "город" словарь выдаёт кучу названий городов. Действительно, пользователю словаря (которым может быть не только человек, но и машинный агент - компьютерная программа) может быть важно знать, что "Абакан" - это "город", но речь тут идёт скорее не о синонимии, а об иного рода смысловой связи. Хорошо, что эти связи в словаре есть (я ни в коем случае не призываю "вычищать" их - их наличие представляет ценность), просто этот словарь, возможно, неверно называть синонимическим - ну или только в расширительном смысле, подобно тому как в глазах пуристов и упомянутый словарь Крэбба не является строго синонимическим, но выполняет и другие функции.

Что касается производительности (времени отклика), оно может быть связано с тем, что в качестве бэк-энда используется реляционная база данных, которая даже с индексацией не вполне отвечает информационной природе словаря, не позволяет эффективно определять связи и быстро извлекать их. По роду своих занятий я последнее время присматриваюсь к графовым базам данных. Сильно подозреваю, что графовая база данных подошла бы лучше в данном случае и в отношении производительности, и в отношении гибкости определения связей между терминами; например, ребру графа можно присвоить атрибуты, что в данном случае позволит дать "объяснение", почему эти два слова суть синонимы - ну или просто именовать рёбра (иметь разные типы рёбер для разных случаев - например, тип ребра "ЯвляетсяГородом", которым можно связать узлы с метками "Абакан" и "город").

По случайному стечению обстоятельств я сейчас экспериментирую с графовой БД примерно такого же объёма (600 тысяч узлов), но более крупной по числу рёбер - их пять с лишним миллионов. Чтобы "ворочать" это хозяйство с приемлемым откликом, мне достаточно относительно скромной машины с четырёхъядерным процессором и восемью гигабайтами памяти. Движок взял на neo4j.com (бесплатную версию - community edition). Это одна из самых популярных в мире графовых БД с хорошей репутацией, множеством учебных материалов и обширным сообществом разработчиков - так что всегда найдётся у кого спросить совета. Я сам вряд ли могу внести большой вклад в приспособление словаря к графовой модели данных, но могу дать несколько начальных советов: например, как импортировать табличный (comma-separated) источник данных в граф.
Ответить с цитированием
  #9  
Старый 20.02.2016, 15:58
В.Павлова В.Павлова вне форума
Пишущий
 
Регистрация: 12.09.2010
Сообщения: 153
Вес репутации: 981
В.Павлова . Такую репутацию нельзя пошатнуть В.Павлова . Такую репутацию нельзя пошатнуть В.Павлова . Такую репутацию нельзя пошатнуть В.Павлова . Такую репутацию нельзя пошатнуть В.Павлова . Такую репутацию нельзя пошатнуть В.Павлова . Такую репутацию нельзя пошатнуть В.Павлова . Такую репутацию нельзя пошатнуть В.Павлова . Такую репутацию нельзя пошатнуть В.Павлова . Такую репутацию нельзя пошатнуть В.Павлова . Такую репутацию нельзя пошатнуть В.Павлова . Такую репутацию нельзя пошатнуть
Цитата:
Сообщение от Armageddon Посмотреть сообщение
В Википедии нашёл:
Не знаю как подсчитывается СЗ, если туда входят имена и названия, то вполне возможен словарный запас примерно до 10 тыс. слов.
Для русского языка известно, что первые по частотности 1100 слов покрывают 70% текста; понимание 70% текста достаточно для понимания текста в целом. Эти цифры справедливы с небольшими отклонениями и для других языков.

В 1977 году был выпущен "Частотный словарь русского языка" (под редакцией Л.Н.Засориной). Словарь составлялся на основе выборки в 1056 382 словоупотреблений.

Во введении отмечено: наиболее частые слова (с частотой 10 и выше на указанной выборке) составляют 23,02% всего словника, но покрывают 92,4% всего текста. Остальные 30 тысяч слов покрывают только 7,6% всей выборки.

Хотя словарный состав русского языка за 40 лет сильно изменился, актуальность этого частотного словаря сохраняется. Может быть, не больше десятка слов (советский, социалистический и пр.) перешли в заметно менее частотную группу. А слово, например, "господин" (частота – 425) даже в те времена было популярнее слова "коммунистический" (частота – 373).
Ответить с цитированием
  #10  
Старый 20.02.2016, 22:35
Аватар для Василий
Василий Василий вне форума
Вольноопределяющийся
 
Регистрация: 27.12.2006
Сообщения: 3,555
Вес репутации: 2212
Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть
Была хорошая инициатива по созданию и поддержке машинного фонда русского языка, которая, к сожалению, свёрнута:

Работы по созданию Машинного фонда русского языка были начаты в 1985 г. по инициативе академика А.П. Ершова (http://ershov.iis.nsk.su/russian/), после состоявшейся в 1983 г. специальной всесоюзной конференции, материалы которой позднее были опубликованы в книге Машинный фонд русского языка: идеи и суждения, М.: Наука, 1989. Тогда же был создан отдел Машинного фонда русского языка в Институте русского языка РАН. Заведование отделом взял на себя тогдашний директор Института член-корреспондент АН СССР Ю.Н. Караулов. Под его руководством была разработана «Комплексная программа научных исследований и прикладных разработок по созданию Машинного фонда русского языка на 1996-2000 гг. и информатизации исследований в Институте русского языка АН СССР», в основу которой легли упомянутые материалы. Руководителями Отдела были последовательно член-корреспондент АН СССР Ю.Н. Караулов (1985-1991 гг.), доктор филологических наук В.М. Андрющенко (1992-1998 гг.), профессор, доктор филологических наук А.Я. Шайкевич (1998-2006 гг.). В 2006 г. Отдел был ликвидирован, работы по развитию Машинного фонда русского языка продолжаются в рамках отдела корпусной лингвистики и лингвистической поэтики.

[ Ссылка, подробности ]


Любопытно, хотя и печально отметить, что программа свёрнута в 2006-м году, когда было общее впечатление, что "жизнь налаживается". Однако для работ по созданию современных машинных продуктов, чтобы жизнь русского языка была как следует обустроена в компьютерную эпоху, средств почему-то не нашлось. Стихийное продвижение русского языка продолжается, ведь русский - второй по популярности язык Интернет. Но стихия не может решить все вопросы: в частности, квалифицироваванным филологам и сотрудничающим с ними айтишникам нужно создать достаточно удобные и достаточно просторные "экологические ниши" - чтобы не думали, чем прокормить себя и семью, а занимались любимым делом, важным для русской культуры.


Ну а статья про Машинный фонд в Википедии подсказала мне, что одним из продуктов программы была компьютерная версия «Словаря синонимов» под ред. А. П. Евгеньевой, М. Наука:1975. Он маленький, но в свободном доступе.
Ответить с цитированием
Ответ


Здесь присутствуют: 1 (пользователей - 0 , гостей - 1)
 
Опции темы
Опции просмотра

Ваши права в разделе
Вы не можете создавать темы
Вы не можете отвечать на сообщения
Вы не можете прикреплять файлы
Вы не можете редактировать сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.
Быстрый переход

Праздники сегодня

 

 

Реклама на форуме

Помочь форуму:

Я-деньги № 4100154088247

Яндекс.Метрика

 

Видео от Романа Фурцева

 
Часовой пояс GMT +3, время: 07:31.


vBulletin v3.6.2, Copyright ©2000-2017, Jelsoft Enterprises Ltd.
Русский перевод: zCarot, Vovan & Co
Администрация форума не несет ответственности за содержание сообщений на форуме.