Форум Протвино
 

Видео от Романа Фурцева


Яндекс.Метрика

 
Вернуться   Форум города Протвино > Протвино - город > Великий и могучий
Регистрация Справка Пользователи Календарь Поиск Сообщения за день Все разделы прочитаны

Великий и могучий Как мы говорим и пишем? Наблюдаем и обсуждаем.

Ответ
 
Опции темы Опции просмотра
  #11  
Старый 21.02.2016, 21:10
Аватар для Владимир Аникеев
Владимир Аникеев Владимир Аникеев на форуме
ce est moi
(офицер)
 
Регистрация: 11.06.2008
Сообщения: 2,653
Вес репутации: 1498
Владимир Аникеев , можно гордиться Владимир Аникеев , можно гордиться Владимир Аникеев , можно гордиться Владимир Аникеев , можно гордиться Владимир Аникеев , можно гордиться Владимир Аникеев , можно гордиться Владимир Аникеев , можно гордиться Владимир Аникеев , можно гордиться Владимир Аникеев , можно гордиться Владимир Аникеев , можно гордиться
Почувствовать миллион

Сегодня легко произносят "миллион" неважно чего.
Мне припомнились книжки Перельмана "Занимательная арифметика, физика и др." В детстве из этих книг я узнал, как почувствовать миллион, и это произвело впечатление.

см.
https://books.google.ru/books?id=5W-...%D1%83&f=false
__________________
Бритва Хэнлона: Никогда не приписывайте злому умыслу то, что вполне можно объяснить глупостью.
(англ. Hanlon's Razor «Never attribute to malice that which can be adequately explained by stupidity»).
Ответить с цитированием
  #12  
Старый 21.02.2016, 21:31
Аватар для Василий
Василий Василий вне форума
Вольноопределяющийся
 
Регистрация: 27.12.2006
Сообщения: 3,570
Вес репутации: 2226
Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть
Цитата:
Сообщение от Владимир Аникеев Посмотреть сообщение
Сегодня легко произносят "миллион" неважно чего.
Мне припомнились книжки Перельмана "Занимательная арифметика, физика и др." В детстве из этих книг я узнал, как почувствовать миллион, и это произвело впечатление.

см.
https://books.google.ru/books?id=5W-...%D1%83&f=false
На самом деле, миллион почувствовать очень легко, если представить себе куб с ребром в один метр. В нём миллион кубиков по кубическому сантиметру каждый. Но это оффтопик, мы тут вообще-то про словари и их машинные версии.
Ответить с цитированием
  #13  
Старый 22.02.2016, 11:48
Аватар для Владимир Аникеев
Владимир Аникеев Владимир Аникеев на форуме
ce est moi
(офицер)
 
Регистрация: 11.06.2008
Сообщения: 2,653
Вес репутации: 1498
Владимир Аникеев , можно гордиться Владимир Аникеев , можно гордиться Владимир Аникеев , можно гордиться Владимир Аникеев , можно гордиться Владимир Аникеев , можно гордиться Владимир Аникеев , можно гордиться Владимир Аникеев , можно гордиться Владимир Аникеев , можно гордиться Владимир Аникеев , можно гордиться Владимир Аникеев , можно гордиться
Цитата:
Сообщение от Василий Посмотреть сообщение
На самом деле, миллион почувствовать очень легко, если представить себе куб с ребром в один метр. В нём миллион кубиков по кубическому сантиметру каждый. Но это оффтопик, мы тут вообще-то про словари и их машинные версии.
Вы, Василий, пишете "представить" (воображение), а я говорил "почувствовать" (подразумевая действия и органы осязания - покрутить ручку, поставить точки на страницах). Т.о. богатство словаря в сочетании с неумением им (богатством) пользоваться может наплодить изрядное количество непоняток.
Вас последняя фраза касается значительно реже остальных форумчан (IMHO).
__________________
Бритва Хэнлона: Никогда не приписывайте злому умыслу то, что вполне можно объяснить глупостью.
(англ. Hanlon's Razor «Never attribute to malice that which can be adequately explained by stupidity»).
Ответить с цитированием
  #14  
Старый 23.02.2016, 02:25
Аватар для Василий
Василий Василий вне форума
Вольноопределяющийся
 
Регистрация: 27.12.2006
Сообщения: 3,570
Вес репутации: 2226
Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть
Цитата:
Сообщение от Владимир Аникеев Посмотреть сообщение
Т.о. богатство словаря в сочетании с неумением им (богатством) пользоваться может наплодить изрядное количество непоняток.
Пугаете :-). Но мне не очень страшно, поскольку мне знакомы подходы к моделированию смысловых связей в словарях, в том числе чтобы их могли использовать компьютеры, а не только люди. Раз можно сделать так, что у компьютеров не будет непоняток, то не будет их и у людей.

В обсуждаемом словаре смысловые связи нечёткие, на что я уже указал. Я также предложил путь, как сделать их более чёткими - поименовать рёбра графа. А есть и более формальные техники, которые даже позволят машине (умеренно) рассуждать, делать выводы. Например, можно так определить термины в словаре и связи между ними, что из того, что "Протвино - город", "протвинец - житель Протвино", и "горожанин - житель города", машина сможет сделать вывод, что протвинец - это горожанин, т.е. выведет связь, которая не определена в словаре явно. Есть зрелые стандарты (рекомендации), как делать такие описания, и есть куча движков, в том числе бесплатных, которые позволяют на основании таких описаний делать несложный машинный вывод.

Уж с чем-чем, а с грамотным определением словарей в машинных форматах люди научились работать. Это не вопрос отсутствия нужных технологий (они есть, а для обсуждаемых объёмов достаточно бесплатных решений). Это просто вопрос человеческих ресурсов, чтобы сделать большой словарь с чёткой семантикой; это большой проект, который по уму должно финансировать государство или богатый меценат на протяжении нескольких лет. Мы же обсуждаем интересную любительскую разработку - если угодно, "заявку" на объёмный синонимический словарь.
Ответить с цитированием
  #15  
Старый 24.02.2016, 13:00
Аватар для Empedocles
Empedocles Empedocles вне форума
490 - 430 до Р.Х.
 
Регистрация: 18.08.2006
Сообщения: 205
Вес репутации: 854
Empedocles стоит на развилке
О пользе дискуссии о словаре

Цитата:
Сообщение от Василий Посмотреть сообщение
Была хорошая инициатива по созданию и поддержке машинного фонда русского языка, которая, к сожалению, свёрнута:

Работы по созданию Машинного фонда русского языка были начаты в 1985 г. по инициативе академика А.П. Ершова (http://ershov.iis.nsk.su/russian/), после состоявшейся в 1983 г. специальной всесоюзной конференции, материалы которой позднее были опубликованы в книге Машинный фонд русского языка: идеи и суждения, М.: Наука, 1989. Тогда же был создан отдел Машинного фонда русского языка в Институте русского языка РАН. Заведование отделом взял на себя тогдашний директор Института член-корреспондент АН СССР Ю.Н. Караулов. Под его руководством была разработана «Комплексная программа научных исследований и прикладных разработок по созданию Машинного фонда русского языка на 1996-2000 гг. и информатизации исследований в Институте русского языка АН СССР», в основу которой легли упомянутые материалы. Руководителями Отдела были последовательно член-корреспондент АН СССР Ю.Н. Караулов (1985-1991 гг.), доктор филологических наук В.М. Андрющенко (1992-1998 гг.), профессор, доктор филологических наук А.Я. Шайкевич (1998-2006 гг.). В 2006 г. Отдел был ликвидирован, работы по развитию Машинного фонда русского языка продолжаются в рамках отдела корпусной лингвистики и лингвистической поэтики.

[ Ссылка, подробности ]


Любопытно, хотя и печально отметить, что программа свёрнута в 2006-м году, когда было общее впечатление, что "жизнь налаживается". Однако для работ по созданию современных машинных продуктов, чтобы жизнь русского языка была как следует обустроена в компьютерную эпоху, средств почему-то не нашлось. Стихийное продвижение русского языка продолжается, ведь русский - второй по популярности язык Интернет. Но стихия не может решить все вопросы: в частности, квалифицироваванным филологам и сотрудничающим с ними айтишникам нужно создать достаточно удобные и достаточно просторные "экологические ниши" - чтобы не думали, чем прокормить себя и семью, а занимались любимым делом, важным для русской культуры.


Ну а статья про Машинный фонд в Википедии подсказала мне, что одним из продуктов программы была компьютерная версия «Словаря синонимов» под ред. А. П. Евгеньевой, М. Наука:1975. Он маленький, но в свободном доступе.
Василий, спасибо за своевременный призыв познакомиться с «зарубежными аналогами» синонимических словарей и подборку: English language -- Synonyms and antonyms – Dictionaries.

Выяснилось, что Оксфордский словарь был задуман (цитирую отсюда) Лондонским филологическим обществом ещё в 1857 году. Проект будущего словаря был сформулирован в 1859 году, когда было опубликовано детальное Предложение относительно публикации нового английского словаря. Редактором был назначен Джеймс Марри (7.02.1837–26.07.1915). Также над словарём работали Генри Брэдли и Уильям Крэйги.

1 февраля 1884 года начался выпуск первого издания, которое называлось «Новый английский словарь, основанный на исторических принципах» (англ. «New English Dictionary on Historical Principles», NED).

Полностью переработанное издание готовится к выпуску в 2017 году. Издание будет только в электронном виде (то есть бумажная версия выпущена не будет). В настоящее время (непонятно, это в 2016 или в 2011 году) над изданием работают 80 специалистов, которые по данным от 24 марта 2011 г. дошли до слова Ryvita.

Но это книгоиздатели. Интерактивом там и не пахнет.

Раньше начали и большего достигли в нашем понимании американцы.
Пионером оказался Ноа Уэбстер (1758—1843), автор словарей и справочников, которые уже при жизни автора играли ведущую роль на американском книжном рынке, потратил десятилетия на исследования и составление своих книг. Его первый словарь, «A Compendious Dictionary of the English Language» («Краткий словарь английского языка»), вышел в 1806 году. В нём он впервые ввёл элементы, которые стали отличительной чертой будущих изданий, такие как американское написание слов (center вместо centre, honor вместо honour, program вместо programme, etc.), и включил технические термины из наук и искусств, не ограничивая словарь литературными терминами. Последующие два десятилетия он потратил на совершенствование своего словаря.

В 1828 году, в возрасте 70 лет, Уэбстер опубликовал свой «Американский словарь английского языка» («American Dictionary of the English Language», ADEL) в двух томах in-quarto (размеры страницы составляют 24,15 × 30,5 см), который включал в себя 70 000 статей, в отличие от всех ранее изданных словарей, каждый из которых содержал не более 58 000 статей. Было напечатано всего 2 500 экземпляров.

После смерти Уэбстера (Webster) дело переиздания словаря получили Джордж и Чарльз Мерриэм (Merriam). Их деятельность продолжается и в настоящее время. На сайте их компании Мерриэм-Уэбстер реализована наша любимая функция — получение толкований введённого на этой веб-странице слова. В нашем понимании — это выдача синонимических связей. В интерактивном словаре Мерриэм-Уэбстеров, по их сообщению, более 600 тыс. слов.

Другие наследники дела Уэбстера, ребята из Принстонского университета сделали ещё лучше. У них быстро выдаётся то, что и мы понимаем под синонимами (Related Words), и много что ещё (фонетические транскрипции слов, их звучание, перевод на другие европейские языки). Ясно, что нашему наследнику «любителя» Владимира Ивановича Даля (10.11.1801–22.09.1872), подобно Безенчуку с Нимфами, конкурировать с Принстонским университетом в этом отношении нереально.

Реальная польза от дискуссии оказалась в скором устранении медленного выполнения запросов SQL в нашей реляционной базе словаря.

Чем мы хуже американцев? Ясен пень, лучше!
Наш словарь позволяет находить слова не только по их точному написанию, но и по усечённому с любой стороны фрагменту слова.

Теперь Большой русский словарь-справочник синонимов Тришина (trishin.da.ru) отзывается быстро и выдаёт полный список синонимов почти мгновенно, даже для слова минерал, у которого наибольшее число синонимов — 5650.
Ответить с цитированием
  #16  
Старый 24.02.2016, 13:04
Аватар для Empedocles
Empedocles Empedocles вне форума
490 - 430 до Р.Х.
 
Регистрация: 18.08.2006
Сообщения: 205
Вес репутации: 854
Empedocles стоит на развилке
Ещё раз о любителях

Если сравнивать Словарь "любителя" В.Даля с имеющимися на
то время словарями "профессионалов", то интересная мысль
приведена в статье Елены Жуйковой
http://chast-re4i.livejournal.com/1595.html

"Словарь содержит около 200 тысяч слов, из них 80 тысяч, по
свидетельству автора, собрано и объяснено им самим (для
остальных были использованы материалы имеющихся словарей).
Для сравнения: Академический словарь 1847 года содержал
около 115 тысяч слов. Таким образом, словарь Даля был и
остается до сих пор самым обширным словарем русского языка.

Даль сам говорил, что его словарь не соответствует
требованиям науки о словарях. Он появился, когда эта наука
не была еще достаточно разработана, типология словарей еще
не была составлена. В наши дни подобный словарь вряд ли мог
бы появиться: его тотчас бы «засушили» под предлогом
унификации или других формальных требований".
Ответить с цитированием
  #17  
Старый 24.02.2016, 14:36
Аватар для Василий
Василий Василий вне форума
Вольноопределяющийся
 
Регистрация: 27.12.2006
Сообщения: 3,570
Вес репутации: 2226
Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть
Цитата:
Сообщение от Empedocles Посмотреть сообщение
Раньше начали и большего достигли в нашем понимании американцы.
Американцам надо было себя "доказать", поэтому они старались - в том числе и по части составления словарей со своими вариантами написания и словоупотребления. В общем, да, у них получилось. Но не стоит недооценивать англичан ;-). Технология технологией, но есть и другие "виды соревнований" - например, такие специфически филологические, как выбор "слова года". Большие словари пытаются выпендриться друг перед другом и найти слово хоть и популярное (или быстро набирающее популярность), но необычное, броское. Уэбстер, возможно думал, что заткнул за пояс Оксфорд и всех остальных, выбрав в качестве слова 2015 года "-ism". Оксфорд же выбрал в качестве слова 2015 года картинку-эмоджи:


Для любителя не только филологии, но и культуры в широком понимании - включая, например, политическую культуру - этот пример скажет многое о разнице "американского" и "английского" подходов, но различение этих тонкостей, конечно, далеко бы увело нас от темы обсуждения.


Цитата:
Сообщение от Empedocles Посмотреть сообщение
Теперь Большой русский словарь-справочник синонимов Тришина (trishin.da.ru) отзывается быстро и выдаёт полный список синонимов почти мгновенно, даже для слова минерал, у которого наибольшее число синонимов — 5650.
Вроде правда быстрее стал откликаться. Но у меня по-прежнему есть претензии к семантике, к сути того, что в словаре считается синонимической связью. Я уже обращал внимание на то, что, если ввести слово "город", в качестве синонимов выдаётся список, включающий в себя названия городов. Но дело обстоит ещё интереснее, поскольку если, наоборот, ввести в строку поиска название какого-нибудь города из оного списка - например, полюбившийся мне "Абакан" - то "город" в качестве синонима к нему не выдаётся. То есть словарь считает "Абакан" синонимом "города", но не считает "город" синонимом "Абакана".

Ну и, наконец, главная претензия к словарю ;-). Если спросить его "Протвино", он в ответ незамысловато выдаст опять-таки одно "Протвино". Про Серпухов, например, словарь знает больше ;-).
Ответить с цитированием
  #18  
Старый 24.02.2016, 17:51
Аватар для Empedocles
Empedocles Empedocles вне форума
490 - 430 до Р.Х.
 
Регистрация: 18.08.2006
Сообщения: 205
Вес репутации: 854
Empedocles стоит на развилке
Цитата:
Сообщение от Василий Посмотреть сообщение
... То есть словарь считает "Абакан" синонимом "города", но не считает "город" синонимом "Абакана".
К слову 'Абакан' словарь выдаёт выдаёт 4 синонима: 'город', 'река', 'Усть-Абаканское' и 'Хакасск' (в правом, а не в левом выпадающем меню).

Цитата:
Сообщение от Василий Посмотреть сообщение
Ну и, наконец, главная претензия к словарю ;-). Если спросить его "Протвино", он в ответ незамысловато выдаст опять-таки одно "Протвино". Про Серпухов, например, словарь знает больше ;-).
Напротив, Серпухов только город, а Протвино ещё и наукоград.

Недоразумение получилось от того, что в левом меню выводятся все найденные слова, совпадающие с введённым для поиска, если их усечь справа (по умолчанию).

Другие альтернативы усечения, а также поиск точного совпадения можно установить перед поиском здесь же выше с помощью селектора альтернатив.

В списке слов можно отмечать левым мышиным курсором другие слова и искать (клавишей 'Найти') относящиеся к ним синонимы без изменения поля для поиска слов.

А в списке синонимов можно отмечать другие синонимы. Тогда после поиска (клавишей 'Найти') без внесения других изменений уточняется число синонимов у отмеченного синонима.

Правда, чтобы получить список синонимов синонима, придётся его с клавиатуры внести в поле поиска слова и повторить поиск.

Мы - не американцы. Выпадающие меню вместо обычного вывода на веб-страницу сделаны, чтобы затруднить полное "заимствование" базы синонимических связей.
Ответить с цитированием
  #19  
Старый 24.02.2016, 22:08
Аватар для Василий
Василий Василий вне форума
Вольноопределяющийся
 
Регистрация: 27.12.2006
Сообщения: 3,570
Вес репутации: 2226
Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть
Теперь яснее, как работает интерфейс. Однако меня всё равно гложет сомнение, что "Абакан" и "город" можно считать синонимами. Ведь "Протвино" и "город" тоже синонимы, согласно словарю. Тогда что, "Абакан" и "Протвино" тоже синонимы, или словарь правильно делает, что не предлагает такого, потому что синоним синонима - не обязательно синоним?

Относительно закрытости словаря: конечно, надо искать способы открыть его и сделать общественным достоянием. Было бы здорово, чтобы кто-нибудь проспонсировал это дело, равно как и привлечение профессиональных филологов к решению вопроса об адекватности синонимических связей и синонимических групп. Моё ощущение - лучше всего бы иметь больше одного типа связей для выражения разной силы, модальности или смыслового оттенка связи слов в словаре.
Ответить с цитированием
  #20  
Старый 24.02.2016, 23:51
Аватар для Empedocles
Empedocles Empedocles вне форума
490 - 430 до Р.Х.
 
Регистрация: 18.08.2006
Сообщения: 205
Вес репутации: 854
Empedocles стоит на развилке
Цитата:
Сообщение от Василий Посмотреть сообщение
синоним синонима - не обязательно синоним?
Вот ответ на этот вопрос автора словаря.

Василий, вы конечно правы. И автор словаря об этом же пишет
в своей статье «Мощь русского языка...»,
http://www.ocenchik.ru/docsb/1630-an...niya-asis.html

Дело в том, что сами филологи не имеют единого мнения о понятии синоним.
В узком смысле синонимами являются слова, которые могут быть взаимозаменяемыми в любых текстах. Другие филологи вводят понятие «квазисинонимы» либо синонимы в широком смысле, когда в одних предложениях слова-синонимы могут быть заменены без изменения смысла, а в других смысл предложения меняется.

Приведу две цитаты из вышеупомянутой статьи.

1) «Понятие «синоним» используется в расширенном смысле.
Нас интересует в первую очередь, являются ли взаимозаменяемыми конкретные слова в именных словосочетаниях (с сохранением хотя бы частично их смысла) или нет. Иначе говоря, улучшит ли установление синонимической связи между двумя конкретными словами качество распознавания смысла именных словосочетаний или нет при компьютерной обработке словосочетаний. А является ли данное слово точным синонимом другого слова или только смежно ему по смыслу (то, о чем часто спорят филологи) нас интересует во вторую очередь».

2) Предлагаемый словарь имеет несколько особенностей:
1. Отсутствие разделения омонимов, что приводит к тому, что в одной группе синонимов к слову, скажем, «стан» оказываются слова «лагерь», «блюминг» и «талия». Для развитого носителя языка это не представляет сложности, но для иностранца, желающего углубиться в недра русского языка, отсутствие разделения омонимов будет, конечно, представлять сложности. Это несколько ограничивает возможности применения текущей версии словаря в системах компьютерной (автоматической) обработки русских текстов.

Для того же «стана» правильно было бы иметь несколько словарных статей, например:
Стан 1 => блюминг, трубопрокатник, листопрокатник, ...
Стан 2 => становище, стойбище, станица, бивуак, лагерь, ...
Стан 3 => торс, талия, поясница, ...

В будущих версиях словаря, возможно, такое разделение будет предусмотрено, и словарь будет состоять из синонимических групп, связанных с некоторыми «понятиями», для которых останется или дать определения из толковых словарей, или выбрать среди синонимов группы так называемую «точку входа», то есть слово, наиболее точно (строго) обозначающее понятие, объединяющее данные синонимы.

2. Отсутствие разделения синонимических и родо-видовых связей. Родо-видовые (цело-частные) отношения – это, вообще говоря, предмет тезаурусов. Синонимическое отношение - это отношение эквивалентности, которое разбивает все слова на классы эквивалентности. А родо-видовое отношение - отношение частичного порядка. В идеале должна быть вкладка для синонимов, для родительских терминов и для дочерних.

Такое разделение также планируется произвести в программе словаря после завершения работы над его пополнением.
Именно поэтому автор словаря старается использовать понятие «синонимическая связь», понимая что такая cвязь не транзитивная.

Кстати, так же поступают и американцы, используя в своих словарях понятие «Related Words» вместо «Synonyms».
Ответить с цитированием
Ответ


Здесь присутствуют: 2 (пользователей - 0 , гостей - 2)
 
Опции темы
Опции просмотра

Ваши права в разделе
Вы не можете создавать темы
Вы не можете отвечать на сообщения
Вы не можете прикреплять файлы
Вы не можете редактировать сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.
Быстрый переход

Праздники сегодня

 

 

Реклама на форуме

Помочь форуму:

Я-деньги № 4100154088247

Яндекс.Метрика

 

Видео от Романа Фурцева

 
Часовой пояс GMT +3, время: 11:50.


vBulletin v3.6.2, Copyright ©2000-2017, Jelsoft Enterprises Ltd.
Русский перевод: zCarot, Vovan & Co
Администрация форума не несет ответственности за содержание сообщений на форуме.