Описание рейтинг-системы РФГ

 

1. Общие положения

Рейтинг-система РФГ представляет собой автоматизированную систему сбора и обработки результатов турниров, признаваемых рейтинговыми. Она построена на основе статистических методов оценки уровня игроков го.

В рейтинг-системе (РС) каждому ее участнику присваивается индивидуальный рейтинг-коэффициент R (или просто – рейтинг), оценивающий текущий уровень игры с некоторой неопределенностью, выражаемой индивидуальным стандартным отклонением S (далее просто – отклонение). Отклонение S задает доверительный интервал (R – 2S, R + 2S) такой, что вероятность попадания в него истинного значения силы игры для подавляющего числа игроков примерно равна 95%.

Шкала рейтингов имеет максимальное верхнее значение в 3000 пунктов, которое соответствует идеальному игроку, а снизу шкала ограничена значением 0 (уровень новичка – 30 кю). Ранги от 20 кю и выше соответствуют значениям рейтингов 100, 200 и т.д. – из расчета 100 пунктов рейтинга на один дан или кю традиционной шкалы рангов. Ранги от 20 кю и ниже укладываются в интервал 0–100 с шагом 10 пунктов на один кю: 20 кю – 100, 21 кю – 90, 22 кю – 80, …, 30 кю – 0. Этот сжатый интервал в равномерной шкале рейтингов соответствует интервалу (–900, 100), который используется при вычислении вероятностных прогнозов и в других необходимых случаях.

Игроки в самом первом своём турнире выступают с рейтингом, задаваемым экспертно, с максимально возможным отклонением. В результате участия в рейтинговых турнирах игроки получают текущие значения рейтингов и отклонений, которые используются в качестве стартовых значений в следующем турнире. При пересчетах отклонений учитывается поведение производной рейтинга по времени, отражаемое во флаге нестабильности F – для растущих игроков F < 0 и отклонение не снижается. Рейтинг-листы хранятся в электронном виде в сетевой базе данных по игрокам и турнирам (БД ТИГР и сайт РФГ). 

 

2. Корректировка отклонений перед пересчетом. Учет времени неучастия в турнирах

Отклонение S характеризует степень недостоверности рейтинга и поэтому должно увеличиваться с ростом времени неучастия игрока в турнирах. Время T неучастия учитывается в месяцах, начиная с 31 дня перерыва в выступлениях (т.е. 30 дней с момента последнего выступления не засчитываются в этот срок). Формула для нового стартового в текущем турнире отклонения ST, учитывающая время неучастия T, имеет вид:

ST = S · {1 + K·[(S*/S)2 - 1]}1/2,

где

S – отклонение на момент завершения последнего (предыдущего) турнира с участием данного игрока;

S* – максимальное отклонение в РС, определяемое формулой

S* = (3000 - R)/10, если R < 2000;

иначе

S* = 50·{1 + [(3000 - R)/1000]2};

K = min {1, 0.001·(3000 - R)·(T/24)} - коэффициент, определяющий рост неопределенности рейтинга со временем.

Коррекция отклонений по времени неучастия делается всегда перед всеми расчетами по рейтингу в данном турнире и для всех игроков, сыгравших хотя бы одну партию. Параметры коррекции по времени выбраны так, что игрок дан-уровня теряет достоверность рейтинга за два года, игрок 11 кю теряет достоверность за год, игроки ближе к 20 кю – примерно за 8 мес., при этом отклонение достигает максимально допустимой величины S*. Чем ближе S к S*, тем быстрее, динамичнее изменяется рейтинг игрока и тем меньше влияние его партий на рейтинг других игроков. При длительном неучастии (К > 0.5) флаг нестабильности F обнуляется (информация о поведении производной теряется).

 

3. Базовая схема пересчета рейтингов. Принцип Эло

Рейтинги и отклонения игроков пересчитываются по итогам каждого рейтингового турнира. Пересчет начинающих игроков, не достигших уровня 3 юношеского разряда (рейтинг 300, 18 кю) производится по упрощённой методике «баланса», излагаемой ниже в пп.6 и 7, а здесь изложим методику для игроков от 18 кю и выше, в основу которой положен следующий

Принцип А. Эло: Изменение рейтинга пропорционально разнице результата и вероятностного прогноза.

Этот принцип выражается в виде формулы Эло

(1)   DR = R' - R = Kдин·DN,

где

R' - рейтинг после турнира;

DN - разница между набранными очками и вероятностным прогнозом;

Kдин - коэффициент динамичности, являющийся индивидуально вычисляемой функцией отклонений рейтингов игрока и его соперников, а также прогнозов результатов в каждой из учитываемых встреч:

(2)   Kдин = max {10, S*/[(S*/S)2 + Db]}.

В коэффициент динамичности входят:

S - текущее отклонение рейтинга игрока (перед турниром, с учетом коррекции по времени неучастия, см. п.1),

S* - максимальное отклонение, а также дисперсия результатов

(3)   Db = ∑j=1,...,N B2j·pj·(1 - pj),

где

N - число учитываемых партий игрока,

Bj – коэффициент неопределенности рейтинга j-того соперника:

1/B2j = 1 + 3·[Sj/(3.141593·S*j)]2,

pj = P(DRj,Dj) - прогнозы результатов (условные априорные математические ожидания набираемых турнирных очков):

P(DR,D) = max {0, min {1, 0.5 + DR/D}};

DRj = Bj·(R - Rj + Hj) - разница в рейтингах с учетом неопределенности рейтинга соперника и форы;

Rj - рейтинг j-того соперника;

Hj - фора, пересчитанная в пункты рейтинга, т.е.

Н = 50 (один камень), 150, 250, ..., 850 (девять камней), причем фора положительна, когда данный игрок ее получает, и отрицательна - в противном случае;

Dj - среднее квадратичное расстояние рейтингов игрока и соперника от рейтинга идеального игрока (3000):

D2j = 0.5·[(3000 - R)2 + (3000 - Rj)2].

Разница набранных и ожидаемых очков (DN) также учитывает неопределенность рейтингов и имеет вид:

(4)   DN = ∑j=1,...,N Bj·(rj - pj),

где     rj - результаты партий (0 - поражение, 1 – победа, 0.5 - ничья).

 

4. Корректировка стартового рейтинга при аномальном результате

Общая базовая схема пересчета состоит в последовательных от турнира к турниру относительно небольших коррекциях рейтинга, т.к. предполагается, что на старте очередного турнира рейтинг игроков уже достаточно адекватен, имеет какую-то достоверность и можно прогнозировать результаты с расчетом на небольшие отклонения от вероятностного прогноза. Однако в силу разных причин иногда уровень игрока в период между очередными турнирами скачкообразно повышается, что приводит к непрогнозируемым победам над более сильными соперниками и к неадекватным потерям ими очков рейтинга, которые забирает у них растущий. Чтобы предотвратить этот чрезмерный переток рейтинга, необходимо быстро скорректировать стартовый рейтинг игрока, заменив его на такое значение, которое более адекватно показанному в турнире результату.

В РС РФГ для выявления аномально растущих игроков используются два критерия аномальности: дисперсионный и вероятностный. В дисперсионном критерии проверяется неравенство для DN – набранных сверх прогноза очков:

(5)   Kан = |DN|/DNан - 1 > 0,

где

DNан = 2KD,

KD = 1, если R < 2000, иначе

KD = {1 + 6 [(R - 2000)/1000]2}0.5.

Смысл коэффициента KD в том, что выше 1 кю критерий плавно ужесточается с ростом превышения рейтинга игрока над 2000. При попадании результата игрока в критическую область (5) ищется такое новое значение стартового рейтинга, при котором в критерии возникает равенство, т.е. ищется минимальный рейтинг, при котором результат не аномален.

Суть вероятностного критерия состоит в том, что результат игрока признается аномальным, если в совокупности одержанные им в турнире победы имеют малую условную вероятность в предположении достоверности стартовых рейтингов. Условия применения вероятностного критерия аномальности включают специальную процедуру проверки существенности одержанных побед. Суть проверки состоит в том, что превышение набранных очков над прогнозом DN должно быть не менее KD, который определен выше.

Затем стартовый рейтинг проверяется на адекватность в соответствии со следующим критерием:

(6)   Kp = 1 - 16·Pw·KN·K> 0,

где

Pw = ∏rj = 1 Pmj – при не очень малых вероятностях побед это просто произведение вероятностных прогнозов в партиях, где одержаны победы (rj = 1), то есть Pmj = P(R - Rj + Hj,Dj), но  при малых вероятностях Pmj  берется не меньше, чем 0.5 в степени числа выигрышей, что ограничивает слишком большое влияние на критерий отдельной случайной победы над сильным соперником;

KN - коэффициент жесткости критерия, зависящий от общего количества сыгранных партий:

KN = 1, если число партий N < 5,

иначе KN = 20.5·(N - 4),

При попадании результата игрока в критическую область (6) , аналогично критерию (5), предварительно ищется такое новое значение стартового рейтинга, при котором в критерии возникает равенство. Затем вычисленное значение аномальной прибавки интерполяционно пересчитывается с коэффициентом интерполяции, пропорциональным превышению  DN над KD, т.е. коэффицент равен 1 при DN = 2KD или большем значениии и равен 0 при DN = KD. Аналогично, при  DN < 2KD уменьшается и Kp

Критерии (5) и (6) применяются в указанной последовательности, и если дисперсионный критерий не выбрал весь потенциал роста, то вероятностный критерий может добавить еще, так как он срабатывает чаще в случае неоднородного состава соперников. При проверке двух критериев происходит автоматическая взаимная коррекция растущих игроков, если они встречались между собой.

Пример. Для пояснения критериев (5) и (6) рассмотрим случай, когда игрок с R = 1500 (6 кю) выиграл со счетом 4–0 у равных по рейтингу.Тогда KD = 1, KN = 1 и результат игрока строго соответствует границе критических областей, определяемых обоими критериями. Эта ситуация будет и для результатов 5-1, 6-2, 7-3 и т.д.

При увеличении рейтинга KD растет и становится больше 2 для 7 данов и выше. Рост числа партий ужесточает вероятностный критерий (6) на корень из 2 за каждую партию сверх 4 (добавляется в произведение), т.к. при дополнительных 50% побед совокупная вероятность побед Pw тоже уменьшается в среднем вдвое за две партии (т.е. как раз на корень из 2 за каждую дополнительно учитываемую партию). Поэтому результаты 4-0, 5-1 и т.д. с равными по рейтингу соперниками для игрока выше 1 кю уже не будут соответствовать границе аномальных областей. Если рейтинг игрока ниже, чем у равных соперников, то результат аномален и поправка будет как раз такой, чтобы рейтинги выровнять.

Величины Kан и Kp запоминаются и используются при корректировках отклонений после всех пересчетов, включая итоговую коррекцию рейтингов по базовой схеме (1). Флаг F у игроков с аномальным ростом (или при аномально плохом результате – хуже прогноза более чем на 2KD очков) устанавливается отрицательным, что является признаком нестабильности и учитывается при пересчете отклонений.

 

5. Корректировка отклонений в базовой схеме. Флаг и его изменение

После коррекции отклонений по времени неучастия и проверки критериев аномальности делается общий пересчет рейтингов по схеме (1). Затем производится пересчет отклонений по формуле

(7)   S' = (Kдин·S*)0.5,

если только флаг F не отрицателен за счет постоянного роста в трех и более турнирах подряд, или при аномальном результате, в том числе и аномально плохом, хотя аномальная коррекция рейтинга в этом случае не делается. При аномальном результате применяется интерполяция с коэффициентом, вычисленным как сумма коэффициентов Kp, Kан, но не более 1. Интерполяционная формула имеет вид:

(8)   S' = S + Kа·(S* - S),

где

Kа = min {1, Kан + Kp}.

Стартовое значение флага для новых игроков – 0. Флаг уменьшается на 1 для растущих игроков и принимает значение 2 для снизивших свой рейтинг. Таким образом, после трех подряд сыгранных без потерь рейтинга турниров флаг становится отрицательным и отклонение перестает уменьшаться, повышая динамику изменения рейтинга для растущего игрока.

Отклонения не пересчитываются в сторону уменьшения, когда флаг F < 0, поскольку это означает, что либо игрок растущий, либо он показал резкое падение. В обоих случаях его рейтинг нельзя считать стабилизирующимся и снижать отклонение согласно формуле (7). Такой подход ускоряет подгонку рейтинга растущих игроков примерно вдвое, даже если они не показывают аномального роста.

 

6. Пересчет рейтинга игроков от 30 до 18 кю

Поскольку недостоверность рейтингов в данной области слишком высока, то в указанной части шкалы применяется упрощённая методика пересчета, в основе которой лежит баланс Bp, рассчитываемый по результатам партий с учётом разницы рейтингов в партии с j-тым соперником

DRj = R – Rj + Hj,

где учитывается даваемая или получаемая фора (см. выше п.3), а рейтинги берутся по однородной шкале (–900,100), отмеченной во вводном п.1. Победа дает

bj = 100 – 10 DRj / 100 (10 очков за каждый лишний ранг в DRj, но не менее 20).

Поражение – аналогично, но с минусом у 100:

bj = – 100 – 10 DRj / 100 (не более –20 и не менее –200).

Таким образом, за выигрыш с положительным балансом рейтинга (соперник с учетом форы «слабее») уменьшение от 100 очков вниз по 10 за каждые 100 пунктов разницы рейтингов, с отрицательным балансом – увеличение по 10 очков на ранг разницы, а за проигрыш в баланс условных очков идет –100 с увеличением по 10 очков на ранг за проигрыш «более сильному» или уменьшением по 10 за проигрыш «более слабому». Ограничение понижения не более чем на 200 очков означает, что допускается случайный проигрыш значительно более «слабому», рейтинг которого может быть существенно занижен. Последовательно складывая очки за все партии, получаем итоговый баланс игрока

(9)   Bp = ∑j=1,...,N bj,

который является аналогом приращения рейтинга в базовой методике п.3, если принять там высокий коэффициент динамичности

Kдин = 200

и упрощённо вычислять прогноз, прибавляя или вычитая от 0.5 по 0.05 за один ранг в разнице рейтингов. Далее к рейтингу игрока баланс прибавляется, если он положителен, иначе оставляем рейтинг без изменений. Учитывая завышенное изменение прогноза для рассматриваемой зоны рейтинга (по 5% за ранг в разнице рейтингов), это приближённо подобно симметричной схеме Эло с подходящей компенсацией в очках рейтинга за сыгранные партии.

В заключение все игроки ниже 20 кю получают дополнительно по 10 пунктов в равномерной шкале (где 30 кю соответствует –900), или по 1 пункту сжатой шкалы (где 30 кю – 0), за каждую сыгранную партию независимо от результата, но не превышая при этом рейтинга 100 (20 кю). Суть ограничения заключается в том, что первую квалификационную ступень (18 кю или 3 юношеский разряд, рейтинг 300 ) игрок должен преодолевать только с помощью побед. Уровня же 20 кю можно формально достичь и проигрывая все партии, однако в этом случае, начиная например с 30 кю, потребуется сыграть 100 партий.

 

7. Корректировка входного рейтинга новых и внешних игроков

Новые российские игроки, впервые выступающие в рейтинговом турнире и поэтому отсутствующие в рейтинг-листе РФГ, а также внешние игроки, не включаемые по итогам турнира в рейтинг-лист РФГ, должны перед турниром получить экспертную оценку входного рейтинга (ЭО). Источником ЭО могут быть ранги и рейтинги из сторонних рейтинг-систем, с учетом возможной корректировки для согласования шкал, оценки, даваемые экспертами из состава оргкомитета турнира, оценки привлеченных экспертов. В крайнем случае допускается принятие ЭО по заявлению самого игрока или его тренера.

Эти входные рейтинги (ЭО), перед пересчетом рейтингов всех игроков по выше изложенным методикам, должны быть скорректированы с учётом результатов выступления в турнире. Конкретно, каждому игроку с ЭО вычисляется баланс (9) с использованием ЭО в качестве стартового рейтинга. Затем для игроков ниже 18 кю баланс просто прибавляется к ЭО, а для остальных используются следующие ограничения.

При ЭО выше 11 кю (рейтинг 1000) используется понижающий коэффицент

K = (3000 – R)/2000,

на который домножается баланс (9). При этом для всех игроков выше 18 кю, если баланс отрицателен, то ЭО корректируется как и для нижней части шкалы, а при положительном балансе коррекция не должна превышать максимального отклонения S*, вычисленного для входной ЭО. Это обосновано тем, что у игрока, показывающего существенный прирост по балансу в зоне от 18 кю и выше, скорее всего итак сработает аномальная коррекция рейтинга в базовой схеме пересчета, которая точнее подправит стартовую ЭО.

 

8. Ограничения и заключительные комментарии

Поскольку методики пересчета для игроков ниже 18 кю и остальных сильно различаются, особенно в части обрезания отрицательного изменения рейтинга для нижних кю, то для плавного перехода от одной методике к другой в зоне между 18 и 11 кю (рейтинги 300 и 1000 соответственно) при отрицательном изменении рейтинга Kдин в основной формуле Эло (1) домножается на понижающий коэффициент, не превосходящий 1 и пропорциональный расстоянию от 18 кю:

Kдин = Kдин·(R – 300)/800.

Для снижения возможных колебаний, по всей шкале применяется ограничение на максимальное падение рейтинга за один турнир в 100 пунктов. Это ограничение, естественно, не касается предстартовой коррекции ЭО новых и внешних игроков, и несущественно для игроков из нижней части шкалы, где рейтинги вообще не снижаются.

И ещё одно ограничение касается явно завышенных входных ЭО. Если новый или внешний игрок не выиграл ни одной партии, то после корректировки ЭО по п. 7, из полученного стартового рейтинга вычитается удвоенное текущее значение максимального отклонения S*. Это будет являться сдерживающим фактором против такого вредного для РС явления, как завышение ЭО для новых игроков. С другой стороны, не выигравший ни одной партии не имеет оценки своего рейтинга снизу, и поэтому не должен существенно влиять на других игроков, что и обеспечивается резким снижением стартовой ЭО в таком случае.

В заключение ещё раз опишем общий порядок пересчета турнира:

Шаг 1. Корректируем отклонения по времени неучастия – всем игрокам (п. 1).

Шаг 2. Корректируем входные ЭО – новым и внешним игрокам (п. 7).

Шаг 3. Проверяем всем игрокам критерии аномальности (сначала – дисперсионный, потом – вероятностный) с одновременной коррекцией для каждого критерия (последовательно) стартовых рейтингов (п. 4).

Шаг 4. Пересчитываем рейтинги игроков ниже 18 кю, в том числе и с ЭО выше 18 кю, но оказавшихся ниже после предыдущих шагов.

 

Шаг 5. Пересчитываем рейтинги по базовой методике с учетом всех ограничений (п. 3, п. 8) – для игроков от 18 кю и выше.

Шаг 6. Пересчитываем отклонения (п. 5) – для игроков от 18 кю и выше. Остальные игроки сохраняют максимальное отклонение до тех пор, пока находятся в этой зоне.

Шаг 7. Сохраняем все новые рейтинговые параметры игроков в рейтинг-лист (рейтинги, отклонения, флаги, дату завершения турнира).

 

9. Модификации

9.1. С 1 сентября 2016 года внесены изменения, позволяющие пересчитывать турниры начинающих на доске 13х13. Суть модификации алгоритма состоит в том, что игроки от 20 кю и выше в таких турнирах играть могут, но не пересчитываются (учитываются как внешние), а для игроков ниже 20 кю (рейтинг ниже 100) при пересчете применяется понижающий коэффициент 0.5. Кроме того, такие игроки не могут набрать в турнире на доске 13х13 рейтинг выше 99 (на 1 пункт ниже 20 кю).