Симулятор «Ультиматум» (Популяции)
Размер батча обучения (для Градиента):
45
Меньше = быстрее адаптация, Больше = точнее расчет
Сила шума SGD (Sigma):
5
Разброс случайного поиска (Exploration)
⏯ Старт / Пауза
↺ Сброс и Применить
Управление Мануальными агентами (если добавлены):
Предлагать (Offer):
5
Принимать мин (Min):
3
Раунд: 0
Агентов: 0
Легенда графика
Сплошной столбик:
Средний доход за ВСЁ время (накапливает историю неудач).
Контурный столбик:
Текущая скорость (среднее за последние 150 кругов). Показывает, насколько хорошо агент играет
прямо сейчас
.
Стратегии
Жадный:
Рационал. Предлагает 1$, принимает всё.
Адаптивный:
Принимает всё. Мгновенно подстраивает предложение. Если его предложение приняли — снижает его. Если отвергли — повышает.
Градиент (SGD):
Стохастический градиентный оптимизатор. Ищет оптимум методом тыка и матанализа.
Рандом:
Полный хаос.
Судья:
Честный (50/40). Наказывает жадных.
Конформист:
Ищет лидера по "текущей скорости" и ставит параметры на 1-2 выше.