Статистические основы тестирования
Статистические основы тестирования
Правильное тестирование учитывает статистические концепции, влияющие на прогностические возможности тестов и присущие им ограничения. Неправильное тестирование может сделать вас чересчур доверчивыми там, где нет оснований воспринимать результаты тестов в качестве прогноза. Оно может дать даже совершенно неверные ответы.
В главе 11 мы изучили все основные факторы, низводящие историческое моделирование на уровень грубого наброска будущего. Эта глава расскажет о том, как улучшить прогнозную составляющую тестов и узнать хоть и приблизительные, но максимально вероятные варианты развития событий.
Область статистики, связанная с формированием выборки из совокупности, является также основой для прогнозного потенциала тестов с использованием исторических данных. Основная идея заключается в том, что при достаточно большой выборке вы можете в определенных пределах применять результаты расчетов по ней для оценки всей совокупности. Поэтому если при выработке стратегии вы посмотрите на достаточно большую выборку прошлых сделок, то сможете сделать заключение о вероятном будущем развитии этой системы. Это тот же раздел статистики, который используют организации, изучающие общественное мнение. Например, опрашивая 500 случайно выбранных людей из разных штатов, имеющих право голоса, можно сделать вывод о настроениях всех голосующих жителей США. Аналогичным образом ученые оценивают действие лекарства для лечения какой-либо болезни на небольшой группе пациентов, так как для этого есть статистическая основа.
Два основных фактора, влияющих на статистическую достоверность предположений, основанных на изучении выборки, – это размер выборки и степень, в которой выборка является репрезентативной по отношению ко всей совокупности. Многие трейдеры и тестеры систем понимают смысл размера выборки на концептуальном уровне, однако полагают, что размер относится лишь к количеству сделок в тестовом исследовании. Они не понимают, что статистическая достоверность тестов может быть снижена даже при изучении тысяч сделок в случаях, когда правила или концепции применяются только к некоторым характеристикам сделок.
Также они часто игнорируют необходимость репрезентативности выборки относительно всей совокупности – и в этих случаях исследование становится запутанным, а измерения затрудняются без проведения субъективного анализа. Трейдер, тестирующий систему, предполагает, что прошлое в определенной степени представляет то, что принесет будущее. Если это действительно так, а выборка является достаточной, мы можем взять некоторые черты прошлого и применять их для оценки будущего. Если выборка нерепрезентативна, тестирование бесполезно и ничего не скажет нам о возможном будущем поведении тестируемой системы. Таким образом, предположение о репрезентативности является критически важным. Если считать, что репрезентативная выборка из 500 человек достаточна для того, чтобы определить с точностью до 2 процентов, кто может быть следующим президентом США, хватит ли опроса 500 участников Демократического национального собрания (органа, избирающего кандидата на должность президента от Демократической партии США) для получения картины по стране в целом? Конечно, нет – выборка не будет репрезентативной с точки зрения всего населения. Она будет состоять только из демократов, в то время как голосующее население США состоит также из республиканцев, не включенных в выборку. Возможно, республиканцы будут голосовать не за тех кандидатов, которые определились в вашем опросе. Если вы делаете ошибки такого рода в выборке, то в результате получите ответ, возможно, желаемый, но неправильный.
Социологи знают, что вопрос соответствия выборки совокупности является основным. Результаты опросов, проводимых с нерепрезентативной выборкой, являются неточными, и за проведение таких опросов увольняют. В трейдинге это тоже является ключевым вопросом. К сожалению, в отличие от социологов, которые в целом понимают статистику выборки, большинство трейдеров ее не понимают. Часто можно наблюдать, как трейдеры тестируют только недавние периоды. Это все равно что проводить опрос членов Демократического собрания о следующем президенте США.
Проблема тестов, проводимых на небольших интервалах, состоит в том, что за время такого интервала рынок может находиться в одном из двух состояний, описанных ранее в главе 2, например в состоянии стабильности (отсутствия тренда) и волатильности – в этих случаях хорошо работают стратегии торговли против тренда и учет отклонений от среднего значения. Однако если рынок изменяет свое состояние, методы тестирования становятся неприменимыми; их использование в этом случае приведет к потере денег. Поэтому тестирование должно проводиться таким образом, чтобы увеличить шансы на репрезентативность с точки зрения будущего сделок, включенных в тест.
Более 800 000 книг и аудиокниг! 📚
Получи 2 месяца Литрес Подписки в подарок и наслаждайся неограниченным чтением
ПОЛУЧИТЬ ПОДАРОКДанный текст является ознакомительным фрагментом.
Читайте также
Тактики тестирования новых бизнес-идей
Тактики тестирования новых бизнес-идей Предлагаю вам быстрые и недорогие способы протестировать свои идеи.• Поговорите с потенциальными клиентами. Не стоит спрашивать своих друзей и родственников, что они думают о вашем бизнесе. Они скажут вам то, что, по их мнению,
Три задачи тестирования
Три задачи тестирования Тестирование торговой системы на исторических ценовых данных позволит вам добиться двух вещей. Во-первых, разобраться с тем, насколько подходит вам торговая система. Это означает не выявление степени доходности торговой системы, а, скорее,
Работа с программой для тестирования торговых систем
Работа с программой для тестирования торговых систем Компьютерная программа для тестирования торговых систем на исторических ценовых данных является в определенном смысле шагом вперед по сравнению с тестированием в ручном режиме. Она не пользуется известностью, и
Три важных практических совета по поводу тестирования
Три важных практических совета по поводу тестирования Есть одно существенное различие между трейдерами, которые никак не могут добиться стабильных результатов, и теми, кто с завидным постоянством изымает деньги с рынка. Все еще не обретшие стабильности трейдеры, как
3. Начните с тестирования
3. Начните с тестирования Прежде чем переходить к работе с реальными деньгами, необходимо протестировать свои методы, и это так важно, что разговор об этом заслуживает отдельного раздела. Трейдинг весьма увлекательное занятие. Велик соблазн ринуться в бой, когда вы еще не
Методика тестирования КИСП аудитором
Методика тестирования КИСП аудитором Наиболее точным методом оценки средств контроля, встроенных в программное обеспечение бухгалтерского учета, является либо непосредственное изучение аудитором программных алгоритмов, либо изучение алгоритмов с использованием
5. Инструменты для тестирования
5. Инструменты для тестирования Во многих компаниях тесты используются в качестве основного компонента при приеме на работу. Вы и лидеры вашей организации должны обладать достаточным интеллектом, чтобы самостоятельно определить, кого следует брать на работу, а кого нет,
Период тестирования
Период тестирования Для всех систем тестирование проводилось с использованием данных за период с января 1996 по июнь 2006
ЛЕКЦИЯ № 4. Статистические ряды распределения и статистические таблицы
ЛЕКЦИЯ № 4. Статистические ряды распределения и статистические таблицы 1. Статистические ряды распределения В результате обработки и систематизации первичных данных статистического наблюдения получают группировки, называемые рядами распределения.Статистические
ИНТЕРПРЕТАЦИЯ РЕЗУЛЬТАТОВ ТЕСТИРОВАНИЯ
ИНТЕРПРЕТАЦИЯ РЕЗУЛЬТАТОВ ТЕСТИРОВАНИЯ Два основных метода интерпретации результатов теста – это применение норм или нормальной
5. Установите сроки тестирования концептуальной процедуры
5. Установите сроки тестирования концептуальной процедуры Определите сроки, чтобы при отсутствии результатов можно было снова вернуться к обсуждению и выбрать новый вариант для внедрения. Как минимум вы должны следить за наличием или отсутствием результатов на
Измерение результатов тестирования объявлений
Измерение результатов тестирования объявлений Отчет об эффективности – один из многих, доступных в системе AdWords. Он показывает все объявления и связанные с ними показатели. Для простоты отображения предположим, что вы используете инструмент отслеживания конверсий AdWords
Ценность бета-тестирования
Ценность бета-тестирования Прежде чем говорить о способах проведения хорошего бета-тестирования, обсудим, в чём вообще его польза. Не понимая ценности бета-тестирования или не веря в её существование, вы никогда не выделите достаточно времени и средств, чтобы провести
Типы программ бета-тестирования
Типы программ бета-тестирования Программа бета-тестирования обычно состоит из нескольких фаз. Каждая последующая фаза включает в себя все большую группу пользователей, и результатом её является все более сложный и стабильный продукт. Несмотря на отсутствие формального
Элементы программы бета-тестирования
Элементы программы бета-тестирования Мы проанализируем ключевые элементы бета-тестирования и рассмотрим, что необходимо сделать для максимального повышения эффективности этого процесса в группе.Начало программы бета-тестированияПрежде чем приступать к набору первых
Менеджер бета-тестирования
Менеджер бета-тестирования Курирует бета-тестирование и управляет её исполнением. Поскольку программы бета-тестирования зачастую масштабны и сложны, эту работу должен выполнять штатный специалист. Это может показаться чересчур для такой работы, но с учётом ценности