Все это относится к механическому игроку, который не обучается в ходе игры. Однако ничто не мешает ему научиться играть более разумно. С этой целью он должен сохранять в своей памяти записи прошлых игр. Затем в конце каждой игры или каждой серии игр определенного типа его механизм должен перестраиваться на совершенно иной образ действий.

При формировании показателя эффективности (оценочной функции) в него вводятся некоторые константы, которые можно выбирать различным образом. Так, например, соотношение констант, соответствующих относительной силе фигур, их подвижности и эквивалентному числу, может составлять 10:3:2 вместо 9:4:4. Новый способ применения регулируемой машины состоит в изучении проведенных игр, с тем чтобы, учитывая их исход, найти соответствующие им показатели эффективности (оценочные функции), отражающие динамику этих игр.

Таким образом, оценочная функция подвергается непрерывной переоценке, при которой более высокое значение этой функции присваивается позициям, характерным для выигранных партий, и меньшее значение – позициям, свойственным большей частью проигранным партиям. Игра должна продолжаться уже с новым значением оценочной функции, которая может быть определена различными способами, отличающимися лишь в деталях. В результате этого игровой автомат будет непрерывно преобразовываться в некую отличную от исходной машину в соответствии с историей развертывающейся игры. В этом случае как для машины, так и для ее противника – человека будут иметь значение их прошлые опыт и успех.

При игре с такой машиной, которая часть своей игровой индивидуальности перенимает от своего противника, эта игровая индивидуальность не остается абсолютно неизменной. Противник может вдруг обнаружить, что стратегии, которые в прошлом приводили к успеху, оказываются несостоятельными. Машина может вырабатывать, таким образом, своеобразную бесхитростную хитрость.



15 из 58