Модераторы: Grey, Модераторы форума
akarika писал(а):Насколько я поняла, главный "провал" в моём понимании - что же является результатом обучения нейросетей (те самые "обученные кирпичики" из первой статьи). Это сохраняется в виде неформализиуемых алгоритмов, известных только сети? В виде каких-то "баз данных" со всеми изученными позициями и которыми потом пользуется АльфаГо? Правильно я понимаю, что действительно используются образы при обучении?
could писал(а):Т.е. сеть не знает ничего про правила Го, нет никаких гошных алгоритмов, есть только веса.
Филиппов Вадим писал(а):А после того как нейронная сеть нашла ход? АльфаГо его делает?
WinPooh писал(а):Не совсем так. Некоторое априорное знание о Го системе задаётся. Например, в качестве одного из факторов, поступающих на вход value network, в статье упоминается
статус камня как ситё-прерывателя. Всё-таки это уже часть теории Го, уровнем выше, чем аксиоматика о взятии одиночного камня или группы. Вообще, что именно подавать на вход нейросети - задача достаточно нетривиальная. В машинном обучении это называется feature engineering, и представляет собой особый раздел магии.
Филиппов Вадим писал(а):Спасибо, Владимир.
Это точно и понятно. Есть Царь Монте-Карло. К нему приходит позиция и задаёт вопрос.
Сейчас этот форум просматривают: нет зарегистрированных пользователей и гости: 88