Показать сообщение отдельно
  #182  
Старый 20.10.2019, 07:10
Тришин Виталий Тришин Виталий вне форума
Пишущий
 
Регистрация: 29.10.2017
Сообщения: 311
Вес репутации: 860
Тришин Виталий . Такую репутацию нельзя пошатнуть Тришин Виталий . Такую репутацию нельзя пошатнуть Тришин Виталий . Такую репутацию нельзя пошатнуть Тришин Виталий . Такую репутацию нельзя пошатнуть Тришин Виталий . Такую репутацию нельзя пошатнуть Тришин Виталий . Такую репутацию нельзя пошатнуть Тришин Виталий . Такую репутацию нельзя пошатнуть Тришин Виталий . Такую репутацию нельзя пошатнуть Тришин Виталий . Такую репутацию нельзя пошатнуть Тришин Виталий . Такую репутацию нельзя пошатнуть Тришин Виталий . Такую репутацию нельзя пошатнуть
Цитата:
Сообщение от Тришин Виталий Посмотреть сообщение
Из статьи «Оцифровкой русского языка займутся в ДВФУ» (3 июля 2019):

«Цифровой корпус русского языка для обучения машин, нейросетей и разработки синтетической личности на основе искусственного интеллекта создадут в Школе цифровой экономики Дальневосточного федерального университета (ШЦЭ ДВФУ). Проект реализуется в лаборатории машинного обучения ШЦЭ на базе магистерской образовательной программы «Искусственный интеллект и большие данные». Сбор заявок на участие в первом этапе работы будет открыт в сентябре.
Одним из первых продуктов по итогам работы станет цифровой менеджер — синтетическая личность на основе искусственного интеллекта, способная поддерживать сложные диалоги с пользователем, задавать наводящие вопросы, находить неочевидные ответы и круглосуточно решать сервисные задачи. На подобном принципе можно будет построить работу call-центров, систем обучения языкам, переводчиков, различных экспертных систем, систем управления сложными машинными механизмами.
«Мы уже начали разработку синтетической личности в партнёрстве со «Сбербанком», что и привело к постановке более глобальных задач. Серьёзным вызовом стало отсутствие качественно размеченной базы русского языка для обучения нейросетей. Мы планируем ответить на него вместе с нашим техническим партнёром по машинному обучению — компанией «Нейросети Ашманова». Она предоставит нам технологию цифровой разметки материала. Результаты нашей совместной работы мы поэтапно будем передавать для открытого использования всем заинтересованным сторонам», — рассказал директор Школы цифровой экономики ДВФУ Илья Мирин.

Эксперт объяснил, что фактически речь идёт о подготовке академического корпуса русского языка, аналоги которого в глобальном масштабе существуют только для английского и французского языков».

Адрес в Интернете:
"https://www.dvfu.ru/news/science_and_innovation/the_digitization_of_the_russian_language_will_be_engaged_in_the_far_eastern_federal_university/".
См. также https://www.dvfu.ru/news/fefu-news/s...t_of_sberbank/.

Интересно: «Малашка Акульку выпередит или не выпередит»?
Люди из ДВФУ, получившие государственный заказ на создание оцифрованного «академического корпуса русского языка», явно не понимают масштабы и сложности задачи. Ведь академический корпус русского языка, основанный на академических (нормативных) словарях, занимает порядка трети моего словаря-справочника. И компьютерно распознать с помощью такого укороченного словаря невозможно реальный текст, не говоря уже о текстах по около 2200 наукам, квазинаукам и направлениями человеческой деятельности, слова из которых практически отсутствуют в академических словарях (да и самих специализированных соответствующих словарей нет в подавляющем числе наук, направлений деятельности и пр.), но которые уже введены в мой словарь-справочник (хотя и не все).
Поразительно, что люди с нуля, не имея никакого опыта и задела, берутся за решение такой сложной задачи.
Ответить с цитированием