Показать сообщение отдельно
  #8  
Старый 20.02.2016, 14:15
Аватар для Василий
Василий Василий вне форума
Вольноопределяющийся
 
Регистрация: 27.12.2006
Сообщения: 4,720
Вес репутации: 3921
Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть Василий . Такую репутацию нельзя пошатнуть
Словарь, безусловно, достоин внимания, поддержки и развития. Хотел бы призвать, однако, присмотреться к опыту более зрелых в отношении филологии культур - как они работают со словарным материалом и его организацией. В этом нет ничего зазорного, ведь русская филология - относительно молодая отрасль знания, развитие которой к тому же подверглось суровым историческим испытаниям.

В отношении конкретно синонимических словарей конкретно английского языка, могу посоветовать вот эту подборку: English language -- Synonyms and antonyms -- Dictionaries Этот список даёт представление о разнообразии и исторической глубине усилий, прилагавшихся к составлению синонимических словарей. Я не знаком со всеми словарями из этого списка, но однажды зашёл в лавочку, которая торгует б/у вещами, безделушками и книжками, и отоварился там по цене чашки кофе упомянутым в списке словарём Крэбба (Crabb's English Synonyms). Это переиздание 1966-года года обновлённого в 1916-м году издания изначального словаря, выпущенного в 1816-м году - к столетию оного. Когда совсем нечего делать или возникает желание оживить свои, по выражению Эркюля Пуаро, "маленькие клеточки серого вещества", открываю его на произвольном месте и читаю какую-нибудь статью. Статья устроена следующим образом: перечислены синонимы и близкие по смыслу слова, дана краткая справка об их происхождлении (часто старофранцузском, англосаксонском или латинском) и объяснены оттенки смысла с примером употребления того или иного синонима в той или иной ситуации. То есть это отчасти этимологический и отчасти толковый словарь - но лишь постольку, поскольку это важно для понимания оттенков смысла синонимов.

Конечно, никто не ожидает, что подобные глубокие изыскания могут быть сделаны одним или несколькими любителями русского языка. Однако, мне кажется, некоторые пояснения, почему то или иное слово в словаре считается синонимом другого слова, просто необходимы. Например, по слову "город" словарь выдаёт кучу названий городов. Действительно, пользователю словаря (которым может быть не только человек, но и машинный агент - компьютерная программа) может быть важно знать, что "Абакан" - это "город", но речь тут идёт скорее не о синонимии, а об иного рода смысловой связи. Хорошо, что эти связи в словаре есть (я ни в коем случае не призываю "вычищать" их - их наличие представляет ценность), просто этот словарь, возможно, неверно называть синонимическим - ну или только в расширительном смысле, подобно тому как в глазах пуристов и упомянутый словарь Крэбба не является строго синонимическим, но выполняет и другие функции.

Что касается производительности (времени отклика), оно может быть связано с тем, что в качестве бэк-энда используется реляционная база данных, которая даже с индексацией не вполне отвечает информационной природе словаря, не позволяет эффективно определять связи и быстро извлекать их. По роду своих занятий я последнее время присматриваюсь к графовым базам данных. Сильно подозреваю, что графовая база данных подошла бы лучше в данном случае и в отношении производительности, и в отношении гибкости определения связей между терминами; например, ребру графа можно присвоить атрибуты, что в данном случае позволит дать "объяснение", почему эти два слова суть синонимы - ну или просто именовать рёбра (иметь разные типы рёбер для разных случаев - например, тип ребра "ЯвляетсяГородом", которым можно связать узлы с метками "Абакан" и "город").

По случайному стечению обстоятельств я сейчас экспериментирую с графовой БД примерно такого же объёма (600 тысяч узлов), но более крупной по числу рёбер - их пять с лишним миллионов. Чтобы "ворочать" это хозяйство с приемлемым откликом, мне достаточно относительно скромной машины с четырёхъядерным процессором и восемью гигабайтами памяти. Движок взял на neo4j.com (бесплатную версию - community edition). Это одна из самых популярных в мире графовых БД с хорошей репутацией, множеством учебных материалов и обширным сообществом разработчиков - так что всегда найдётся у кого спросить совета. Я сам вряд ли могу внести большой вклад в приспособление словаря к графовой модели данных, но могу дать несколько начальных советов: например, как импортировать табличный (comma-separated) источник данных в граф.
Ответить с цитированием