Статистическая ошибка позволяет судить о надежности полученных результатов, т. е. о том, достаточное ли количество случаев при данной величине изменчивости было получено, чтобы по части характеризовать целое. В практике биометрического анализа используется относительная ошибка измерений – "показатель точности опыта" или "показатель точности оценки параметров" – отношение ошибки средней к самой средней арифметической, выраженное в процентах: . Чем точнее определена средняя, тем меньше будет ε, и наоборот. Точность считается хорошей, если ε меньше 3%, и удовлетворительной при 3% < ε < 5%. Если относительная ошибка превышает 5%, полученные данные следует уточнить (повторить опыт, собрать дополнительный материал и т. д.). В разобранном выше примере определения характеристик массы тела для выборки бурозубок показатель точности составил ε = (0.11/ 9.3) ∙100 = 1.2%, что говорит о достаточной надежности выборочной оценки. Оптимальный объем выборки
В биологических исследованиях, при планировании экспериментов, для определении величины подопытных и контрольных групп часто заранее требуется установить число наблюдений, достаточное для получения правильного представления о явлении в целом (получить репрезентативные оценки генеральной совокупности). Можно говорить о двух разных подходах для непрерывных и дискретных признаков. Идея первого метода состоит в том, чтобы, используя известные соотношения (все формулы были представлены выше) между средней, стандартным отклонением, ошибкой средней, плотностью вероятности распределения Стьюдента (на их основе вычисляется коэффициент вариации, показатель точности оценок, доверительный интервал), найти число степеней свободы, соответствующее доверительному интервалу для средней при уровне значимости α = 0.05. Иными словами, решается задача, прямо противоположная рассмотренной в предыдущем разделе. Объем выборки, достаточной для получения результата заданной точности, находят по формуле: , где п – объем выборки, T – граничное значение из таблицы распределения Стьюдента (табл. 6П), соответствующее принятому уровню значимости при планируемом объеме выборки (в крайнем случае можно взять значение T = 1.96 для df = ∞), CV – приблизительное значение коэффициента вариации (%), ε – планируемая точность оценки (погрешности) (%). Рассчитаем необходимый объем условной выборки, обеспечивающий хорошую точность ε = 3%, для уровня значимости α = 0.05 (T = 1.98, для df ≈ 100) и для коэффициента вариации CV = 12% (такова относительная изменчивость многих размерно-весовых признаков животных): ≈ 63 экз. Определим объем выборки, необходимый для определения среднего веса землероек-бурозубок при условии, что доверительный уровень вероятности должен составить 99% (α = 0.01), показатель точности оценки 3% при сохраняющемся уровне изменчивости CV = 10%. По таблице Стьюдента (табл. 6П) в соответствии с заданным уровнем значимости (α = 0.01) и для того же числа наблюдений находим T = 2.62. Далее вычисляем необходимый объем выборки: ≈ 75 экз. Если исследуется фенотипическое (видовое) разнообразие, может возникнуть задача определения минимального объема выборки, в которой будет присутствовать хотя бы один экземпляр с определенным фенотипом (Животовский, 1991). С позиций теории вероятности задача ставиться так: определить объем выборки, в которой с вероятностью P можно ожидать присутствие особи с признаком, частота которого в генеральной совокупности составляет π. Предлагается следующая формула: . В первом приближении значение π можно определить приблизительно по имеющимся данным. Что же касается вероятности P, то ее уровень довольно сильно влияет на величину необходимого объема выборки. Для большей надежности следует брать P = 0.99, но тогда возрастет объем работ; не столь высокие требования (P = 0.95) могут и не позволить найти искомый фенотип. В частности, при уровне вероятности P = 0.95 и предположительной частоте фенотипа в популяции π = 0.05 потребуется = 58.4 ≈ 59 экз., чтобы отловить хотя бы одну особь с этим дискретным признаком. Нетрудно рассчитать небольшую таблицу, содержащую оценки необходимых объемов выборок для разной вероятности отлова и различных частот фенотипов в популяции.
В случае исследования нескольких фенотипов существует достаточно сложный метод расчета объема выборки, в которой с вероятностью P присутствуют все фенотипы, частоты которых в популяции не меньше, чем πmin. Фрагмент такой таблицы может оказаться полезным для примерного определения нужных объемов выборок.