Форум Протвино


Яндекс.Метрика

Написать Админу: protvino-forum@mail.ru
 
Вернуться   Форум города Протвино > Протвино - город > Наука
Регистрация Справка Пользователи Календарь Поиск Сообщения за день Все разделы прочитаны

Наука О науке в городе и за его пределами

Ответ
 
Опции темы Опции просмотра
  #1  
Старый 03.05.2022, 21:49
Аватар для Владимир Аникеев
Владимир Аникеев Владимир Аникеев вне форума
ce est moi
(офицер)
 
Регистрация: 11.06.2008
Сообщения: 4,542
Вес репутации: 3416
Владимир Аникеев . Такую репутацию нельзя пошатнуть Владимир Аникеев . Такую репутацию нельзя пошатнуть Владимир Аникеев . Такую репутацию нельзя пошатнуть Владимир Аникеев . Такую репутацию нельзя пошатнуть Владимир Аникеев . Такую репутацию нельзя пошатнуть Владимир Аникеев . Такую репутацию нельзя пошатнуть Владимир Аникеев . Такую репутацию нельзя пошатнуть Владимир Аникеев . Такую репутацию нельзя пошатнуть Владимир Аникеев . Такую репутацию нельзя пошатнуть Владимир Аникеев . Такую репутацию нельзя пошатнуть Владимир Аникеев . Такую репутацию нельзя пошатнуть
Сначала не навреди: контрфактические целевые функции для безопасного и этичного ИИ

First do no harm: counterfactual objective functions for safe & ethical AI 28 стр.


Jonathan G. Richens1 , Rory Beard2 and Daniel H. Thompson3
1DeepMind, 2CoMind, 3Babylon

Цитата:
To act safely and ethically in the real world, agents must be able to reason about harm and avoid harmful actions. In this paper we develop the first statistical definition of harm and a framework for factoring harm into algorithmic decisions. We argue that harm is fundamentally a counterfactual quantity, and show that standard machine learning algorithms are guaranteed to pursue harmful policies in certain environments. To resolve this, we derive a family of counterfactual objective functions that robustly mitigate for harm. We demonstrate our approach with a statistical model for identifying optimal drug doses. While identifying optimal doses using the causal treatment effect results in harmful treatment decisions, our counterfactual algorithm identifies doses that are far less harmful without sacrificing efficacy. Our results show that counterfactual reasoning is a key ingredient for safe and ethical AI.

Сначала не навреди: контрфактические целевые функции для безопасного и этичного ИИ


Цитата:
Чтобы действовать безопасно и этично в реальном мире, агенты должны уметь рассуждать о вреде и избегать вредных действий. В этой статье мы разрабатываем первое статистическое определение вреда и основу для учета вреда в алгоритмических решениях. Мы утверждаем, что вред по своей сути является контрфактической величиной, и показываем, что стандартные алгоритмы машинного обучения гарантированно будут проводить вредоносную политику в определенных средах. Чтобы решить эту проблему, мы выводим семейство контрфактических целевых функций, которые надежно снижают ущерб. Мы демонстрируем наш подход со статистической моделью для определения оптимальных доз лекарств. В то время как определение оптимальных доз с использованием причинно-следственного лечебного эффекта приводит к вредным решениям о лечении, наш контрфактический алгоритм определяет дозы, которые гораздо менее вредны, не жертвуя при этом эффективностью. Наши результаты показывают, что контрфактические рассуждения являются ключевым компонентом безопасного и этичного ИИ.
Полностью https://arxiv.org/pdf/2204.12993.pdf

PS
КОНТРФАКТИЧЕСКИЕ ПРЕДЛОЖЕНИЯ
__________________
Бритва Хэнлона: Никогда не приписывайте злому умыслу то, что вполне можно объяснить глупостью.
(англ. Hanlon's Razor «Never attribute to malice that which can be adequately explained by stupidity»).
Ответить с цитированием
Ответ


Здесь присутствуют: 1 (пользователей - 0 , гостей - 1)
 
Опции темы
Опции просмотра

Ваши права в разделе
Вы не можете создавать темы
Вы не можете отвечать на сообщения
Вы не можете прикреплять файлы
Вы не можете редактировать сообщения

BB коды Вкл.
Смайлы Вкл.
[IMG] код Вкл.
HTML код Выкл.
Быстрый переход

Праздники сегодня

 

Реклама на форуме

 

 
Часовой пояс GMT +3, время: 03:55.


vBulletin v3.6.2, Copyright ©2000-2022, Jelsoft Enterprises Ltd.
Русский перевод: zCarot, Vovan & Co
Администрация форума не несет ответственности за содержание сообщений на форуме.