Описание рейтинг-системы РФГ

 

1. Общие положения

Рейтинг-система РФГ представляет собой автоматизированную систему сбора и обработки результатов турниров, признаваемых рейтинговыми. Она построена на основе статистических методов оценки уровня игроков го.

В рейтинг-системе (РС) каждому ее участнику присваивается индивидуальный рейтинг-коэффициент R (или просто – рейтинг), оценивающий текущий уровень игры с некоторой неопределенностью, выражаемой индивидуальным стандартным отклонением S (далее просто – отклонение). Отклонение S задает доверительный интервал (R – 2S, R + 2S) такой, что вероятность попадания в него истинного значения силы игры для подавляющего числа игроков примерно равна 95%.

Шкала рейтингов имеет максимальное верхнее значение в 3000 пунктов, которое соответствует идеальному игроку, а снизу шкала ограничена значением 0 (уровень новичка – 30 кю). Ранги от 30 до 20 кю соответствуют значениям рейтингов 0, 60, 120 и т.д. – из расчета 60 пунктов рейтинга на один кю традиционной шкалы рангов. Ранги от 20 кю до 1 дана соответствуют значениям рейтингов 600, 675, …, 2025, 2100 – из расчета 75 пунктов рейтинга на кю. Ранги выше 1 дана укладываются в интервал 2100–3000 с шагом 100 пунктов на один дан.

Игроки в самом первом своём турнире выступают с рейтингом, задаваемым экспертно, с максимально возможным отклонением. В результате участия в рейтинговых турнирах игроки получают текущие значения рейтингов и отклонений, которые используются в качестве стартовых значений в следующем турнире. При пересчетах отклонений учитывается поведение производной рейтинга по времени, отражаемое во флаге нестабильности F – для растущих игроков F < 0 и отклонение не снижается. Рейтинг-листы хранятся в электронном виде в сетевой базе данных по игрокам и турнирам (БД ТИГР и сайт РФГ). 

 

2. Корректировка отклонений перед пересчетом. Учет времени неучастия в турнирах

Отклонение S характеризует степень недостоверности рейтинга и поэтому должно увеличиваться с ростом времени неучастия игрока в турнирах. Время T неучастия учитывается в месяцах, начиная с 31 дня перерыва в выступлениях (т.е. 30 дней с момента последнего выступления не засчитываются в этот срок). Формула для нового стартового в текущем турнире отклонения ST, учитывающая время неучастия T, имеет вид:

ST = S · {1 + K·[(S*/S)2 - 1]}1/2,

где

S – отклонение на момент завершения последнего (предыдущего) турнира с участием данного игрока;

S* – максимальное отклонение в РС (для игроков 1 дана принято значение 100, для остальных уровней − по линейной интерполяции так, что для 20 кю это значение равно 220);

K = min {1, 0.001·(3000 - R)·(T/24)} - коэффициент, определяющий рост неопределенности рейтинга со временем.

Коррекция отклонений по времени неучастия делается всегда перед всеми расчетами по рейтингу в данном турнире и для всех игроков, сыгравших хотя бы одну партию. Параметры коррекции по времени выбраны так, что игрок дан-уровня теряет достоверность рейтинга за два года, игрок с рейтингом 1000 теряет достоверность за год, игроки ближе к 30 кю – примерно за 8 мес., при этом отклонение достигает максимально допустимой величины S*. Чем ближе S к S*, тем быстрее, динамичнее изменяется рейтинг игрока и тем меньше влияние его партий на рейтинг других игроков. При длительном неучастии (К > 0.5) флаг нестабильности F обнуляется (информация о поведении производной теряется).

 

3. Базовая схема пересчета рейтингов. Принцип Эло

Рейтинги и отклонения игроков пересчитываются по итогам каждого рейтингового турнира. В основе пересчета заложен следующий

Принцип А. Эло: Изменение рейтинга пропорционально разнице результата и вероятностного прогноза.

Этот принцип выражается в виде формулы Эло

(1)   DR = R' - R = Kдин·DN,

где

R' - рейтинг после турнира;

DN - разница между набранными очками и вероятностным прогнозом;

Kдин - коэффициент динамичности, являющийся индивидуально вычисляемой функцией отклонений рейтингов игрока и его соперников, а также прогнозов результатов в каждой из учитываемых встреч:

(2)   Kдин = S*/[(S*/S)2 + Db], ограничивается снизу  минимальным значением 10 для данов, а для остальных нижняя граница Kдин увеличивается линейно при снижении уровня игрока так, что для 20 кю она становится равной 70.

В коэффициент динамичности входят:

S - текущее отклонение рейтинга игрока (перед турниром, с учетом коррекции по времени неучастия, см. п.1),

S* - максимальное отклонение, а также дисперсия результатов

(3)   Db = ∑j=1,...,N B2j·pj·(1 - pj),

где

N - число учитываемых партий игрока,

Bj – коэффициент неопределенности рейтинга j-того соперника:

1/B2j = 1 + 3·[Sj/(3.141593·S*j)]2,

pj = P(DRj,Dj) - прогнозы результатов (условные априорные математические ожидания набираемых турнирных очков):

P(DR,D) = max {0, min {1, 0.5 + DR/D}} – для игроков дан-уровня; для остальных

P(DR,D) = max {0, min {1, 0.5 + DR/1000}};

DRj = Bj·(R - Rj + Hj) - разница в рейтингах с учетом неопределенности рейтинга соперника и форы;

Rj - рейтинг j-того соперника;

Hj - фора, пересчитанная в пункты рейтинга, т.е. число пунктов рейтинга вычисляется в соответствии с шагом шкалы (см. самое начало описания), причем фора положительна, когда данный игрок ее получает, и отрицательна - в противном случае;

Dj - среднее квадратичное расстояние рейтингов игрока и соперника от рейтинга идеального игрока (3000):

D2j = 0.5·[(3000 - R)2 + (3000 - Rj)2].

Разница набранных и ожидаемых очков (DN) также учитывает неопределенность рейтингов и имеет вид:

(4)   DN = ∑j=1,...,N Bj·(rj - pj),

где     rj - результаты партий (0 - поражение, 1 – победа, 0.5 - ничья).

 

4. Корректировка стартового рейтинга при аномальном результате

Общая базовая схема пересчета состоит в последовательных от турнира к турниру относительно небольших коррекциях рейтинга, т.к. предполагается, что на старте очередного турнира рейтинг игроков уже достаточно адекватен, имеет какую-то достоверность и можно прогнозировать результаты с расчетом на небольшие отклонения от вероятностного прогноза. Однако в силу разных причин иногда уровень игрока в период между очередными турнирами скачкообразно повышается, что приводит к непрогнозируемым победам над более сильными соперниками и к неадекватным потерям ими очков рейтинга, которые забирает у них растущий. Чтобы предотвратить этот чрезмерный переток рейтинга, необходимо быстро скорректировать стартовый рейтинг игрока, заменив его на такое значение, которое более адекватно показанному в турнире результату.

В РС РФГ для выявления аномально растущих игроков используются два критерия аномальности: дисперсионный и вероятностный, которые применяются только для игроков с уровнем ниже 1 дана. В дисперсионном критерии проверяется неравенство для DN – набранных сверх прогноза очков:

(5)   Kан = |DN|/2 - 1 > 0.

При попадании результата игрока в критическую область (5) ищется такое новое значение стартового рейтинга, при котором в критерии возникает равенство, т.е. ищется минимальный рейтинг, при котором результат не аномален.

Суть вероятностного критерия состоит в том, что результат игрока признается аномальным, если в совокупности одержанные им в турнире победы имеют малую условную вероятность в предположении достоверности стартовых рейтингов. Условия применения вероятностного критерия аномальности включают специальную процедуру проверки существенности одержанных побед. Суть проверки состоит в том, что превышение набранных очков над прогнозом DN должно быть не менее 1.

Затем стартовый рейтинг проверяется на адекватность в соответствии со следующим критерием:

(6)   Kp = 1 - 16·Pw·KN > 0,

где

Pw = ∏rj = 1 Pmj – при не очень малых вероятностях побед это просто произведение вероятностных прогнозов в партиях, где одержаны победы (rj = 1), то есть Pmj = P(R - Rj + Hj,Dj), но  при малых вероятностях Pmj  берется не меньше, чем 0.5 в степени числа выигрышей, что ограничивает слишком большое влияние на критерий отдельной случайной победы над сильным соперником;

KN - коэффициент жесткости критерия, зависящий от общего количества сыгранных партий:

KN = 1, если число партий N < 5,

иначе KN = 20.5·(N - 4),

При попадании результата игрока в критическую область (6) , аналогично критерию (5), предварительно ищется такое новое значение стартового рейтинга, при котором в критерии возникает равенство. Затем вычисленное значение аномальной прибавки интерполяционно пересчитывается с коэффициентом интерполяции, пропорциональным превышению  DN над 1, т.е. коэффициент равен 1 при DN = 2 или большем значении и равен 0 при DN = 1. Аналогично, при  DN < 2 уменьшается и Kp

Критерии (5) и (6) применяются в указанной последовательности, и если дисперсионный критерий не выбрал весь потенциал роста, то вероятностный критерий может добавить еще, так как он срабатывает чаще в случае неоднородного состава соперников. При проверке двух критериев происходит автоматическая взаимная коррекция растущих игроков, если они встречались между собой.

Пример. Для пояснения критериев (5) и (6) рассмотрим случай, когда игрок с R = 1500 выиграл со счетом 4–0 у равных по рейтингу. Тогда KN = 1 и результат игрока строго соответствует границе критических областей, определяемых обоими критериями. Эта ситуация будет и для результатов 5-1, 6-2, 7-3 и т.д.

Рост числа партий ужесточает вероятностный критерий (6) на корень из 2 за каждую партию сверх 4 (добавляется в произведение), т.к. при дополнительных 50% побед совокупная вероятность побед Pw тоже уменьшается в среднем вдвое за две партии (т.е. как раз на корень из 2 за каждую дополнительно учитываемую партию). Если рейтинг игрока ниже, чем у равных соперников, то результат аномален и поправка будет как раз такой, чтобы рейтинги выровнять.

Величины Kан и Kp запоминаются и используются при корректировках отклонений после всех пересчетов, включая итоговую коррекцию рейтингов по базовой схеме (1). Флаг F у игроков с аномальным ростом (или при аномально плохом результате – хуже прогноза более чем на 2 очка) устанавливается отрицательным, что является признаком нестабильности и учитывается при пересчете отклонений.

 

5.  Пересчет рейтинга игроков и корректировка отклонений в базовой схеме. Флаг и его изменение

После коррекции отклонений по времени неучастия и проверки критериев аномальности делается общий пересчет рейтингов по схеме (1) в таком порядке: сначала пересчитываются все игроки ниже 1 дана, затем игроки дан-уровней. Итоговый пересчет отклонений в обоих случаях производится по формуле

(7)   S' = (Kдин·S*)0.5,

если только флаг F не отрицателен за счет постоянного роста в трех и более турнирах подряд, или при аномальном результате, в том числе и аномально плохом, хотя аномальная коррекция рейтинга в этом случае не делается. При аномальном результате применяется интерполяция с коэффициентом, вычисленным как сумма коэффициентов Kp, Kан, но не более 1. Интерполяционная формула имеет вид:

(8)   S' = S + Kа·(S* - S),

где

Kа = min {1, Kан + Kp}.

Стартовое значение флага для новых игроков – 0. Флаг уменьшается на 1 для растущих игроков и принимает значение 2 для снизивших свой рейтинг. Таким образом, после трех подряд сыгранных без потерь рейтинга турниров флаг становится отрицательным и отклонение перестает уменьшаться, повышая динамику изменения рейтинга для растущего игрока.

Отклонения не пересчитываются в сторону уменьшения, когда флаг F < 0, поскольку это означает, что либо игрок растущий, либо он показал резкое падение. В обоих случаях его рейтинг нельзя считать стабилизирующимся и снижать отклонение согласно формуле (7). Такой подход ускоряет подгонку рейтинга растущих игроков примерно вдвое, даже если они не показывают аномального роста. 

В заключение отметим, что все игроки с рейтингом ниже 100 получают дополнительно по 1 пункту рейтинга за каждую сыгранную партию независимо от результата, но не превышая при этом рейтинга 100. 

 

6. Корректировка входного рейтинга новых и внешних игроков

Новые российские игроки, впервые выступающие в рейтинговом турнире и поэтому отсутствующие в рейтинг-листе РФГ, а также внешние игроки, не включаемые по итогам турнира в рейтинг-лист РФГ, должны перед турниром получить экспертную оценку входного рейтинга (ЭО). Источником ЭО могут быть ранги и рейтинги из сторонних рейтинг-систем, с учетом возможной корректировки для согласования шкал, оценки, даваемые экспертами из состава оргкомитета турнира, оценки привлеченных экспертов. В крайнем случае допускается принятие ЭО по заявлению самого игрока или его тренера.

Эти входные рейтинги (ЭО), перед пересчетом рейтингов всех игроков по выше изложенным методикам, должны быть скорректированы с учётом результатов выступления в турнире. Это делается применением к таким игрокам вышеописанной методики пересчета рейтинга в предположении, что остальные игроки стабильны и их рейтинг фиксирован. При этом аномальные коррекции применяются во всем диапазоне рейтингов, а не только для кю-уровней. Также учитывается и аномально плохой результат (недобор на более чем 2 очка).

 

7. Ограничения и заключительные комментарии

Для игроков ниже 300 (25 кю) производится обрезание отрицательной составляющей изменения рейтинга так, что для игроков ниже 100 рейтинг может только расти. Для плавного перехода в зоне между рейтингами 100 и 300 при отрицательном изменении рейтинга Kдин в основной формуле Эло (1) домножается на понижающий коэффициент, не превосходящий 1 и пропорциональный расстоянию от точки 100:

Kдин = Kдин·(R – 100)/200.

Для снижения возможных колебаний, по всей шкале применяется ограничение на максимальное падение рейтинга за один турнир в 100 пунктов. Это ограничение, естественно, не касается предстартовой коррекции ЭО новых и внешних игроков.

В заключение ещё раз опишем общий порядок пересчета турнира:

Шаг 1. Корректируем отклонения по времени неучастия – всем игрокам (п. 1).

Шаг 2. Корректируем входные ЭО – новым и внешним игрокам (п. 6).

Шаг 3. Проверяем всем игрокам ниже 1 дана критерии аномальности (сначала – дисперсионный, потом – вероятностный) с одновременной коррекцией для каждого критерия (последовательно) стартовых рейтингов (п. 4).

Шаг 4. Пересчитываем рейтинги и отклонения всех игроков. 

Шаг 5. Сохраняем все новые рейтинговые параметры игроков в рейтинг-лист (рейтинги, отклонения, флаги, дату завершения турнира).

 

8. Модификации

8.1. С 1 сентября 2016 года внесены изменения, позволяющие пересчитывать турниры начинающих на доске 13х13. Суть модификации алгоритма состоит в том, что игроки от 20 кю (рейтинг 600) и выше в таких турнирах играть могут, но не пересчитываются (учитываются как внешние), а для игроков ниже 20 кю (рейтинг ниже 600) при пересчете применяется понижающий коэффициент 0.5. Кроме того, такие игроки не могут набрать в турнире на доске 13х13 рейтинг выше 599 (на 1 пункт ниже 20 кю).

8.2. С 1 января 2019 года сделана модификация шкалы, позволившая упростить пересчет вероятностей в зоне до 1 дана (линейная шкала в 10 пунктов рейтинга на 1% вероятности). Это также позволило упростить ряд вычислительных алгоритмов основной методики, в том числе отменена упрощенная методика, применявшаяся для игроков ниже 20 кю.