НАУЧНО-ПРОИЗВОДСТВЕННОЕ ОБЪЕДИНЕНИЕ ИМ. КУЗНЕЦОВА
ИВАНОВ А. И.
МЕТОДЫ ОЦЕНКИ НАРКОСИТУАЦИИ УЧЕБНОЕ ПОСОБИЕ ДЛЯ СЛУЖАЩИХ ГОСУДАРСТВЕННОГО АППАРАТА УПРАВЛЕНИЯ
САНКТ-ПЕТЕРБУРГ 2004
2
НАУЧНО-ПРОИЗВОДСТВЕННОЕ ОБЪЕДИНЕНИЕ ИМ. КУЗНЕЦОВА
ИВАНОВ А. И.
МЕТОДЫ ОЦЕНКИ НАРКОСИТУАЦИИ УЧЕБНОЕ ПОСОБИЕ ДЛЯ СЛУЖАЩИХ ГОСУДАРСТВЕННОГО АППАРАТА УПРАВЛЕНИЯ Под редакцией канд. биол. наук, проректора по науке Национального института здоровья Р.С. Минвалеева
САНКТ-ПЕТЕРБУРГ 2004
3
РЕЦЕНЗЕНТЫ: О.А. Малафеев д-р физ.-мат. наук, проф. факультета прикладной математики – процессов управления СПбГУ А.Н. Покровский д-р физ.-мат. наук, проф. НИИ вычислительной математики и процессов управления им. В.И. Зубова при СПбГУ Г.А. Секамова капитан юстиции, начальник отдела Следственного Управления при УВД Центрального района Санкт-Петербурга Т.В. Сергеева врач 17-ой (Александровской) городской больницы СПб
Иванов А.И. Методы оценки наркоситуации. Учебное пособие для служащих государственного аппарата управления / Под ред. Р.С. Минвалеева. – СПб: НПО им. Кузнецова, 2004. Настоящее учебное пособие является изложением некоторых классических прикладных методов анализа и обработки результатов наблюдений на минимальной аналитической основе, применимых к решению задач научной оценки наркоситуации в России. Пособие рассчитано на служащих Государственного аппарата Российской Федерации, по долгу службы имеющих непосредственное отношение к решению задач контроля и управления. Работая над книгой, автор ставил перед собой две цели. Первая - на примерах, в основном содержательных, а не узко иллюстративных, продемонстрировать возможности применения математического моделирования при решении задач оценки наркоситуации в России. Вторая - познакомить читателя с простейшими приемами и методами оценки наркоситуации, выполненной с использованием достижений современной науки. Пособие может быть рекомендовано как для госслужащих РФ, так и для работников оперативных, следственных и силовых государственных структур, врачей, преподавателей, студентов и аспирантов.
С автором и редактором книги можно связаться по телефонам: (812) 269 00 51 – Анатолий Иванович Иванов (812) 176 41 28 – Ринад Султанович Минвалеев E-mail:
[email protected] Web: www.realyoga.ru (раздел: Физиология йоги) Все права защищены. Вместе с тем, автор разрешает воспроизведение любой части книги при наличии ссылок на настоящее издание
4
Посвящается светлой памяти моего Учителя, великого русского ученого, основателя факультета прикладной математики – процессов управления СПбГУ Владимира Ивановича Зубова (1930 -2000)
5
СОДЕРЖАНИЕ Предисловие редактора Введение §1. Разные подходы к оценке наркоситуации и вытекающие из них трудности §2. О математическом моделировании в естествознании. 1.Краткая историческая справка. 2.Математическая модель и этапы ее поиска. §3. О мере оценки наркоситуации. 1.Противоречие между тем, что кажется и тем, что существует на самом деле. 2.Знакомство с вероятностной мерой. §4. Применение элементов комбинаторного анализа при оценке наркоситуации. 1.Основные определения. 2.Решение задач оценки наркоситуации применением общедоступных формул комбинаторного анализа. §5. Первые модели оценки случайных событий. 1.Краткая историческая справка. 2.Формула Бернулли. 3.Закон Пуассона. Наркомания живет по законам военного времени. §6. О сфере применимости закона нормального распределения при оценке наркоситуации. 1.Краткая историческая справка. 2.Случайные величины. 3.Об иллюзиях в оценке вероятностей. 4.Простейшие критерии согласия. 5.Дополнительные сведения о нормальном законе распределения. 6.Критерии асимметрии и эксцесса. §7. Оценка значения вероятности по результатам наблюдений и экспериментов. Интервальный метод. 1.Постановка задачи. 2.Доверительный интервал вероятностей, как мера оценки наркоситуации. 3.Упрощенный метод вычисления доверительного интервала для вероятности события.
6
4.Можно ли считать, что количество больных наркозависимостью в России возросло? §8. Кинематическая модель наркоситуации в России. 1.Предварительные замечания. 2.Линейная модель развития наркоситуации в России. 3.Экспоненциальная модель развития наркоситуации в России. 4.Логистическая модель развития наркоситуации в России. 5.Модель «Один наркоман против 145 миллионов россиян». Наркоман начинает и выигрывает. Модель «Один наркоман против 43 миллионов российской молодежи». Наркоман начинает и выигрывает. 6.О более точных моделях наркоситуации. 7.Применение к оценке наркоситуации математических моделей сообществ, борющихся за общую пищу. ЗАКЛЮЧЕНИЕ........................................ ЛИТЕРАТУРА........................................ Приложение 1...................................... Приложение 2...................................... Приложение 3...................................... Приложение 4...................................... Дополнение: Отзыв д. ф.- м. н. проф. Малафеева О.А. Отзыв д. ф.- м. н. проф. Покровского А.Н. Отзыв капитана юстиции Секамовой Г.А. Воспоминания проф. Покровского А.Н. о проф. Зубове В.И.
7
ПРЕДИСЛОВИЕ РЕДАКТОРА Идите вперед, а понимание придет потом! Ж.Л. Даламбер Актуальность учебного пособия "Методы оценки наркоситуации", написанного А.И. Ивановым, подтверждается тем, что существующая наркоситуация в России уже не может быть с требуемой для решения задач государственного контроля и управления наркоситуацией точностью охарактеризована субъективными и неоднозначными экспертными оценками, принятыми в настоящее время. Новизна предложенных в учебном пособии методов оценки наркоситуации состоит в том, что А.И. Ивановым, взамен приблизительных, опирающихся на субъективный опыт экспертов оценок наркоситуации, предложено и обосновано применение статистических оценок и оценок, найденных методом математического моделирования, рекомендованных в Государственных стандартах России для оценки результатов научных исследований. По моему мнению, особый интерес представляют найденные А.И. Ивановым модели, позволяющие не только оценить текущую стадию эпидемии, но и с высокой точностью решать задачи прогноза. Найденный результат может быть применен при решении задач доказательной медицины, организации здравоохранения, для повышения эффективности мероприятий государственных административных и силовых структур. Веским доводом в пользу адекватности найденных А.И. Ивановым прогностических моделей является то, что первая модель А.И. Иванова, найденная им в 1972 году, полностью подтвердилась – все мы знаем, что Советский Союз распался. Вместо «полной победы коммунизма» мы получили полную алкоголизацию всей страны. И распад Советского Союза, и поголовная пивная алкоголизация была предсказана А.И. Ивановым еще в 1972 году. Согласно расчетам А.И. Иванова распад СССР должен был произойти в 1989 году. Ошибка составила меньше трех лет. Подробное описание модели изложено во Введении. В настоящее время применением изложенной в § 8 книги модели «Один наркоман против всей российской молодежи. Наркоман начинает и выигрывает» доказано, что к 2015 году вся российская молодежь, в 100%, будет обязательно принимать наркотики. Поясним предсказанный результат. Много ли у вас есть таких знакомых, кто никогда, ни при каких обстоятельствах, ни в каких самых мизерных количествах не употребляет алкоголь? Ни пиво в жару, ни шампанское в Новый год, ни ритуальный бокал в день рождения… Вместе с тем известно, что алкоголь отнесен
8
Всемирной Организацией Здравоохранения к наркотикам (см., например, соответствующую статью в Большой Советской Энциклопедии). Так сколько же у нас в стране людей, не употребляющих наркотики?! Если читатель думает, что А.И. Иванов сгущает краски, то вот, что произошло совсем недавно. С некоторых пор наркотики в России не запрещены почти также как и алкоголь. А именно, с мая 2004 года Государственная Дума России приняла закон, согласно которому любой желающий имеет полное право не только употреблять любые наркотики, какие только пожелает, но и хранить у себя их запасы, и даже торговать ими. Разрешенные депутатами Государственной Думы «дозы» в пересчете на 1-ого человека составляют: героин – до 1 грамма, так называемые «легкие» наркотики, марихуана и т. п. – до 20 грамм. Иными словами, каждому гражданину Российской Федерации дано не только законодательное, но и моральное право и принимать, и распространять наркотики. Фактически решением Госдумы уже законодательно подтверждена правильность модели А.И. Иванова «Один наркоман против всей российской молодежи. Наркоман начинает и выигрывает», согласно которой к 2015 году вся молодежь России будет в обязательном порядке употреблять наркотики, как сейчас «шампанское в Новый год»! И в день рождения…. И в Рождество Христово…. И в день Независимости России! Однако предположим, что Госдума приняла бы противоположный закон, направленный на то, чтобы тем или иным способом запретить наркотики. Читатели знают, что в нашей недавней истории пример подобного решения уже есть – «горбачевский сухой закон». И вспомните, стали ли пить меньше? Поэтому решение «народных избранников» о фактической легализации наркотиков в нашей повседневности можно если не поддержать, то хотя бы понять. Но хохма (евр. ‘мудрость’) состоит в том, что если бы и был принят закон о запрете наркотиков, то полная наркотизация всей молодежи России все равно бы произошла к 2015 году. Вот почему модель А.И. Иванова названа «Один наркоман против всей российской молодежи. Наркоман начинает и выигрывает»! Иными словами, сколько нужно спичек, чтобы сжечь Вашу квартиру? Разве одной мало? А вообще, при чтении книги следуйте рецепту великого Даламбера: «Идите вперед, а понимание придет потом»! Кандидат биологических наук, проректор по науке Национального института Здоровья Р.С. Минвалеев
9
ВВЕДЕНИЕ Настоящее учебное пособие имеет целью ознакомить читателя с современными научными методами оценки наркоситуации как во всей России в целом, так и в ограниченных, подвергаемых специальному исследованию группах. Известно, что в настоящее время существует немало книг, учебников и учебных пособий, в которых изложены современные методы обработки результатов измерений и экспериментов, а также методы математического моделирования интересующих читателя явлений. Среди этих книг немало таких, содержание которых ориентировано на ознакомление с методами применения современного математического аппарата для решения прикладных задач в специализированных областях. Например, книги Солодовникова А.С. с соавт. "Математика в экономике" [77], Гланца С. "Медико-биологическая статистика" [78] и др. Однако до сих пор в России и, возможно, в мире нет книг, содержание которых специализировано на ознакомление читателя с современными количественными методами оценки наркоситуации. Первой, к сожалению не опубликованной работой автора по оценке наркоситуации в России была статья, написанная в начале 70-х годов XX века во время учебы автора на факультете прикладной математики процессов управления Ленинградского Государственного Университета им. А.А. Жданова. В статье была изложена математическая модель развития алкогольной ситуации в СССР. Остановимся подробнее на ключевых моментах модели. Известно, что в период развитого социализма в СССР, результаты любого научного исследования, в той или иной мере касающиеся общественных явлений, непременно должны были быть подкреплены соответствующими цитатами из произведений классиков марксизмаленинизма. Справедливости ради отметим, что в многотомных собраниях сочинений К. Маркса, Ф. Энгельса и В.И. Ленина всегда находилось достаточное количество высказываний практически по любым вопросам и обществоведения, и философии, и всего естествознания в целом. Поэтому, вооружившись 55-томным полным собранием сочинений В.И. Ленина, потратив необходимое для нахождения нужной цитаты время, в 43-ем томе собрания автор нашел: "... в отличие от капиталистических стран, которые пускают в ход такие вещи, как водку и прочий дурман, мы этого не допустим, потому что, как бы они ни были выгодны для торговли, но они поведут нас назад, к капитализму, а не вперед к коммунизму..." (Ленин В.И. Полн. собр. соч., т.43, с.326). После этого автор задал себе
10
вопрос о том, каким именно количеством потребления алкоголя, в пересчете на чистый этиловый спирт, характеризуется капиталистическое общество, целью которого является порабощение и эксплуатация трудящихся масс. В результате были найдены цифры, согласно которым в 1906-1910 годах душевое потребление алкоголя в пересчете на чистый спирт составляло во Франции - 22.9 литра, Италии - 17.3, Швейцарии 13.7, Испании - 10.8, Бельгии - 10.6, Австрии - 7.8, Венгрии - 7.6 литров. Замечание. Данные об употреблении количеств алкоголя на душу населения здесь заимствованы из книги Ф.Г. Углова "Из плена иллюзий" [76]. Вычислив среднее арифметическое из напечатанных выше количеств потребления алкоголя, находим, что оно равно 9.6 литра. Получалось, что как только количество выпитого алкоголя на душу населения в СССР превысит 9.6 литра, так сразу же страна, желая того или не желая, повернет с пути к светлому будущему - коммунизму на путь проклятого капитализма. Больше того, именно изменением употребления спиртного россиянами и объяснялось, по мнению автора, возникновение условий для Великой Октябрьской Социалистической Революции 1917 года, освободившей трудящихся от капиталистической эксплуатации. Рассмотрим статистические данные употребления спиртного на душу населения в России по спиртовому эквиваленту в виде 100% спирта. 1863-66 годы 1873 год 1883 1893 1894
- 4.55 литра, - 4.18 литра, - 3.32, - 2.46, - 2.98,
1906 1910 1913 1915-24
- 3.41, - 3.41, - 4.7, - 0 литров!
Получалось, что Великая Октябрьская Социалистическая Революция произошла если не по причине, то как минимум, на фоне сухого закона, изданного российским правительством вследствие начала в 1914 году Первой Мировой Войны. Получалось, что внезапно отрезвевшее сознание трудящихся, вследствие отрезвления, поняло бесчеловечность капиталистической системы и в октябре 1917 года, наконец, оторвало капиталистов-эксплуататоров от рычагов власти.
11
С другой стороны, автора тогда, в начале 70-х годов XX века, озаботил рост потребления количества алкоголя в спиртовом эквиваленте на душу населения в СССР. Приведем цифры. 1965 год 1966 1967 1968
- 4.56 литра, - 5, - 5.4, - 5.8,
1969 1970 1971
- 6.26, - 6.75, - 7.1 литра.
Квалификации студента-математика Ленинградского государственного университета было предостаточно, чтобы, используя эти данные найти математическую модель, применение результатов которой позволяло не только связать имеющиеся цифры единой формулой, но и выполнять прогноз роста употребления количества алкоголя в обозримом будущем. Считая за временную характеристику величину t и присваивая значения величины t для 1965 года t = 0, для 1966 года t = 1 и т. д., воспользовавшись найденной автором моделью Y(t) = 0.416t + 4.6
(*)
нетрудно вычислить количество алкоголя, употребляемого "в среднем" одним жителем в СССР в любой год. Например, для 1972 года t = 7. Подставив значение t = 7 в формулу (*) находим, что y(t) = 7.5 литров. Применив формулу (*) при t = 13, соответствующем 1978 году находим, что для 1978 года употребление алкоголя в спиртовом эквиваленте на душу населения в СССР становится равным 10 литрам, т. е. превышает 9.6 литров, необходимых для начала перехода развития страны из русла строительства коммунизма в русло возвращения к капитализму. Замечание. Косвенным подтверждением правильности прогноза автора послужило создание в СССР в 1976 году самостоятельной наркологической службы. До этого момента задачи наркологии в СССР решались в рамках психиатрии. Однако найденного результата показалось мало: если примерно с 1978 года в СССР незаметно начнутся процессы, направленные на переориентацию страны в сторону реанимации капиталистического строя, то примерно когда социалистический строй рухнет и снова будет объявлен ненавистный капитализм? Автор был уверен, что если капитализм и воскреснет, то Россия непременно станет ведущей страной мира капиталистического. Поэтому, вычислив среднее количество употребляемого спиртового эквивалента на душу населения в развитых
12
капиталистических странах Европы - Франции, Швейцарии, Австрии и Бельгии автор пришел к результату: (22.9 + 13.7 + 10.6 + 7.8)/4 = 13.75 литра. Применив модель (*) нетрудно было вычислить, что такое количество употребления спирта на душу населения приходилось на 1987 год. Итак, в 1973 году - году апогея развития мировой социалистической системы, студент пришел к заключению о том, что примерно в 1987 году СССР как социалистическая страна перестанет существовать! Нетрудно догадаться, какой была тогда реакция идеологических лидеров построения коммунизма на результаты математических прогнозов студента... В 1980 году, автор применил модель (*) для расчета на 1980 год. Получилось 10.84 литра. Трудно сказать, какие именно чувства испытал автор, обнаружив в 1981 году почти такую же цифру - 10.83 литра (отличие на сотую долю) в одном из официальных государственных статистических источников! До вычисленной в 1973 году даты разрушения СССР оставалось 6 лет... И вдруг - 1985 год. На всю страну прозвучало постановление правительства "О мерах по преодолению пьянства и алкоголизма". Начались времена "горбачевского сухого закона". Кривая употребления спиртного на душу населения в СССР резко сорвалась вниз. К сожалению, мы до сих пор не располагаем точными цифрами изменения употребления количества алкоголя в те годы. Но волна прошла и в 1990 году мы вышли на прогнозируемые применением формулы (*) 15 литров спиртового эквивалента на душу населения. Любознательный читатель легко заметит, что для применения формулы (*) 1990 год соответствует характеристике t = 25. Подставит, сосчитает, и получит зарегистрированную в статистических источниках цифру 15 литров. Применение найденной в 1973 году формулы продолжило оставаться актуальным и в 1990 году, вопреки осмеянному в настоящее время "горбачевскому сухому закону". Ниже на рисунке помещен график функции (*), на котором точками обозначено зафиксированное в статистических источниках количество спиртового эквивалента, употребляемого в год на душу населения в СССР.
13
На рисунке: по оси абцисс - годы, считая 1965 год за нулевой, 1966 - за первый и т. д. По оси ординат - употребление алкоголя в год на душу населения в СССР в литрах спиртового эквивалента. Воспользовавшись моделью (*), вычислим количество употребленного спиртового эквивалента на душу населения в России в 2000 году. Для 2000 года значение t = 35, следовательно, y(t) = 19.16 литров. Однако мы не знаем и вряд ли когда-нибудь узнаем о том, сколько литров спиртового эквивалента употребил за 2000 год "среднестатистический" россиянин: известно, что в 2000 году немалую долю спиртного составили импортные продукты, в том числе и контрабандные. Поэтому ограничимся пусть и не научным, но достойным источником информации об употреблении спиртных напитков: в одной из телепередач "Синие страницы" выступал Пивной Король России. По его утверждению, в 2000 году "в среднем" одним Россиянином выпито около 200 литров пива. Теперь, считая крепость пива за 6º, выполним пересчет: 200 · 0.06 = 12 литров стопроцентного спирта. Скорее всего, недостающая доля до вычисленных выше 19.16 литров набралась за счет вина, водки и других крепких напитков. Отметим, что согласно опубликованным в руководстве для врачей [79] данным, страны, с преимущественным употреблением алкоголя в виде пива, в спиртовом эквиваленте употребляют чистого алкоголя на душу населения почти в два раза больше, чем страны с преимущественным потреблением крепких спиртных напитков.
14
Напомним, что согласно решению Всемирной Организации Здравоохранения (ВОЗ) алкоголь является наркотиком (см., например, соответствующую статью в Большой Советской Энциклопедии [1]). Применив формулу (*) нетрудно заметить, что год от года потребление алкоголя на душу населения в России должно расти. До каких пор? Когда наступит предел потребления, после которого "больше не выпить?" И что стоит за ним? Увы, поиск ответов на поставленные вопросы уже не актуален. Мы знаем на них ответ - наркотики. По этой причине и написано настоящее пособие - "Методы оценки наркоситуации". В целях удобства читателя приведем краткую аннотацию книги. Пособие состоит из введения, восьми параграфов основного текста, заключения, списка использованной при написании пособия литературы и приложений. В §1 помещены определения наркотиков и наркомании, принятые в современной науке. Доказана актуальность создания специализированного учебного пособия для государственных служащих по оценке наркоситуации в России. Доказано, что методы интуитивно-эвристических и синоптических оценок наркоситуации являются устаревшими, так как найденные их применением решения не соответствуют государственным требованиям к точности решений, необходимой для обеспечения оптимального государственного контроля и управления наркоситуацией. Вместо устаревших методов экспертных оценок предложено применение методов оценок, рекомендуемых в государственных стандартах России. Доказано, что только методы оценок, опирающиеся на применение результатов математического моделирования, позволяют найти оценки наркоситуации, точность которых удовлетворяет современным требованиям, предъявляемым в России к результатам научных исследований. В §2 изложена краткая справка по истории возникновения и этапах математического моделирования. Перечислены цели математического моделирования. По замыслу автора, в целом содержание §1 и §2 должно способствовать преодолению расхожего мнения о том, что результатами математического моделирования могут пользоваться только профессиональные математики. В §3 в качестве меры оценки наркоситуации предложено применение вероятностной меры, рекомендованной в государственных стандартах. Проиллюстрирована недостаточность точности распространенной процентной оценки наркоситуации при решении государственных задач.
15
В §4 изложены типичные ситуации, возникающие при оценке наркоситуации в группах ограниченного объема. В качестве метода решения задач предложено применение результатов комбинаторного анализа. Изложены методы решения типичных задач. Содержание §5 ориентировано на ознакомление читателя с исторически первыми моделями случайных событий и методами их применения при оценке наркоситуации. Изложены методы применения моделей Бернулли и Пуассона при решении задач оценки наркоситуации. Продемонстрирована возможность применения методов математического моделирования при решении задач повышения эффективности контроля над действиями наркомафии и планирования методов борьбы с наркомафией. Содержание §6 знакомит читателя с методами применения одного из часто используемых законов распределения случайных величин - закона нормального распределения. Изложен метод использования свойств случайных величин, распределенных по нормальному закону при решении задач оперативно-следственных и силовых государственных инфраструктур, в сферу полномочий которых входит борьба с организованной преступностью, в частности, наркомафией. Изложены начальные сведения по исследованию операций и планированию. В §7 развивается общий подход к описанию наркоситуации количественными характеристиками, найденными применением изложенных в §1 - 6 методов. Этот подход состоит в расширении найденных точечных оценок характеристик до интервальных оценок, находимых с заданными государственными требованиями значениями надежности. Доказано, что применение интервальных оценок характеристик является более адекватным решением задачи оценки наркоситуации, чем применение точечных оценок. В целях создания систем оптимального государственного контроля и управления, обосновано применение предложенных автором пособия и апробированных при оценке наркоситуации (см. в отчете по НИР [10]) пессимистических и оптимистических оценок развития наркоситуации. В §8 изложены примеры применения разных математических моделей к решению задач оценки и прогноза наркоситуации в России. Доказана целесообразность и своевременность мер по контролю над наркоситуацией, предпринятых президентом и правительством России. Решена задача прогноза наркоситуации в России на ближайшие десятилетия. Предложенные модели выбраны вследствие того, что при чрезвычайно ограниченном объеме исходных данных - всего двух: 315 тысяч количестве наркоманов, зафиксированных в России в 1998 году и
16
340 тысяч - количестве наркоманов, зафиксированных в России в конце 2002 года, требовалось найти модели, допускающие временную экстраполяцию. В интересах читателя в конце параграфов помещены типичные задачи, возникающие при оценке наркоситуации. В целях удобства изучения читателем методов нахождения научно обоснованных оценок, все задачи снабжены ответами и решениями. В пособии применено два вида нумерации: для аналитических выражений использована сквозная нумерация, для определений и замечаний нумерация, в которой первая цифра обозначает номер параграфа, вторая - порядковый номер внутри параграфа. Список литературы состоит из 82 наименований. В приложении 1 помещено содержание файла NARKSIT. MTH, предназначенного для облегчения вычислительной части самостоятельных занятий читателя. В приложении 2, в учебно-методических целях, помещены значения среднесуточных температур приземного слоя окружающего воздуха в Санкт-Перербурге за 10 января с 1865 года. Список значений предназначен для самостоятельных упражнений по вычислению характеристик случайных величин. В приложениях 3 и 4 помещен вывод отдельных формул и моделей, примененных в пособии. В целях облегчения изучения материалов пособия, все предложенные в пособии методы оценки наркоситуации изложены на минимальной аналитической основе, сложность которой не превосходит сложности математического аппарата, изучаемого в средней общеобразовательной российской школе. Тем не менее, для читателя, испытывающего трудности, рекомендуется при первом чтении пособия ограничиться только общим, поверхностным знакомством с его содержанием и результатами вычислений. Более глубокое изучение методов оценки наркоситуации читатель может получить посредством посещения лекционных циклов, читаемых автором пособия. В целях полноты изложения сообщим сведения о том, как удалось издать столь неугодную и для потребителей, и для распространителей популярных наркотиков книгу. В процессе подготовки рукописи к печати мы обратились к ряду известных специалистов с просьбой дать письменный отзыв на книгу. В результате мы получили отзывы д. ф. - м. н., проф. Покровского А.Н., д. ф. - м. н., проф. Малафеева О.А. и капитана юстиции Секамовой Г.А., которые мы публикуем в Дополнениях к книге с разрешения авторов. Поддержку в издании нам оказал Гаврилов Д.С., отзыв которого мы помещаем на обложку книги.
17
Мы обратились за отзывом к известному своим категорическим отношением к алкоголю и наркотикам академику РАМН Углову А.Ф. Академик Углов А.Ф. дал согласие написать отзыв, попросив неделю на ознакомление с содержанием книги. Через неделю рукопись была нам возвращена без отзыва и каких-либо комментариев. Мы обратились за отзывом к главному наркологу СПб к. м. н. Николаенко В.Н. Он попросил время на ознакомление с содержанием книги и обещал дать письменный отзыв. Мы ждали полгода и вынуждены опубликовать книгу без каких-либо комментариев главного нарколога Комитета по Здравоохранению Администрации Санкт-Петербурга к. м. н. Николаенко В.Н. Автор считает своим долгом выразить глубокую благодарность д. ф. - м. н., проф. Покровскому А.Н., д. ф. - м. н., проф. Малафееву О.А. и капитану юстиции Секамовой Г.А. за внимательное ознакомление, ценные замечания и письменные отзывы. Автор выражает благодарность к. б. н. Р.С. Минвалееву за научное редактирование книги. В работе над книгой огромную помощь мне оказали также консультации врача 17-ой (Александровской) городской больницы СПб Сергеевой Т.В. Особую благодарность автор выражает Гаврилову Д.С., поддержавшему издание книги.
18
§1. РАЗНЫЕ ПОДХОДЫ К ОЦЕНКЕ НАРКОСИТУАЦИИ И ВЫТЕКАЮЩИЕ ИЗ НИХ ТРУДНОСТИ Изложим противоречивую ситуацию, сложившуюся при решении задач оценки наркоситуации в России. В целях полноты исследования приведем фрагмент статьи из Большой Советской Энциклопедии (в дальнейшем - БСЭ.- А.И.) [1]. «Наркомания (от греч. narke - оцепенение и мания), наркоманическая зависимость (человека от приема наркотика), заболевание, которое выражается в том, что жизнедеятельность организма поддерживается на определенном уровне только при условии постоянного приема наркотического вещества, и ведет к глубокому истощению физических и психических функций. Резкое прекращение приема наркотика вызывает нарушение многих функций организма - абстиненцию. Один из наглядных признаков наркомании - неудержимое влечение к опьянению, эйфории, достигаемой посредством приема наркотического вещества, что послужило основанием названию болезни. С течением болезни способность к эйфорическим ощущениям (эйфоризирующий эффект) падает, и влечение определяется лишь потребностью в наркотике как необходимом условии относительно удовлетворительного физического и психического состояния. Возможно пристрастие к какому-либо одному наркотическому веществу мононаркомания (морфинизм, героинизм, кодеинизм, гашишизм, кокаинизм, алкоголизм и пр.) или к их сочетанию - полинаркомания (опийно-барбитуровая, опийно-наксироновая, алкогольно-барбитуровая, опийно-алкогольная и пр.). Обычно полинаркомания оказывается следствием мононаркомании: по мере ослабления эйфорических ощущений наркоман в поисках эйфории начинает добавлять и другие наркотические средства. Результат постоянной наркотической интоксикации расстройство деятельности многих органов и систем организма, различные в зависимости от вида употребляемого наркотика. Особенно тяжелые последствия наблюдаются при полинаркоманиях. Таким образом, даже при регулярном приеме необходимой дозы наркотика больной наркоманией со временем становится неработоспособным, и его состояние благополучно лишь в сравнении с абстинентным синдромом. Чем сильнее выражен эйфоризирующий эффект вещества, тем скорее наступает формирование привыкания. Решающее условие развития наркомании - непонимание человеком опасности приема наркотиков. У молодежи наркомания может неразумного возникать как результат «экспериментирования», любопытства. Возможно развитие наркомании вследствие приема
19
наркотических веществ как обезболивающих, снотворных. Опасность заболеть наркоманией возрастает при эмоциональной неустойчивости, у людей, не владеющих своими побуждениями, психически незрелых, отвергающих общесоциальные нормы. Распространению наркомании способствует неправильное воспитание, дурной пример и давление нездоровой микросоциальной среды, отсутствие у человека интеллектуальных и социально-положительных установок, недостаточность просветительской работы; особую роль играют отсутствие строгого контроля над производством и потреблением наркотических веществ в обществе, существование черного рынка. На злоупотребление наркотическими средствами во всех обществах, в том числе и первобытных, накладывался нравственный запрет; с появлением государства начинается борьба с их незаконным производством, распространением, торговлей, поскольку наркомания наносит вред не только больному, но и обществу в целом. Заболевший исключается из созидательной деятельности, так как становится физическим и психическим инвалидом и его интересы сосредоточены на одном - как достать очередную порцию наркотического вещества; наступающее снижение психических функций и ситуация социального конфликта, в которой оказывается наркоман (необходимость лжи, противозаконного добывания наркотика), ведут к глубокой нравственной деградации личности заболевшего и преступному поведению» (конец фрагмента). В исламе строгий запрет на употребление наркотиков возведен в ранг религиозного догмата. В Коране [3] находим слова о том, что нарушившему запрет грозит смертный приговор по закону Шариата. В целях полноты изложения отметим, что в христианстве отсутствует запрет на употребление наркотиков. Больше того, некоторые из психотропных веществ, признанных Всемирной Организацией Здравоохранения (ВОЗ) наркотиками, например, алкоголь, рекомендуются к употреблению в ежедневных обрядах (например, в таинстве причастия). Подробную информацию по истории алкоголизации России и ее последствиям можно найти в книге Ф.Г. Углова «Из плена иллюзий» [76], по распространению наркомании и ее последствиям - в книге Ф.Г. Углова «Ломехузы» [13]. Сведения о действии галлюциногенов и других наркотических веществ заинтересованный читатель может найти в «Справочнике по психиатрии» [5] и др. специальной литературе. В «Справочнике практического врача» [80] наркомания определена как заболевание, обусловленное употреблением различных веществ,
20
вызывающих состояние опьянения. Указано, что список наркотиков утверждается комитетом экспертов по наркотикам ВОЗ. Известно, что до того, как перекочевать в Россию, волны наркомании успели поглотить значительную часть территории планеты. Так, еще в прошлом веке (28.3.1973) в послании президента Р. Никсона конгрессу США о борьбе с наркоманией отмечено: «Злоупотребление наркотиками один из самых опасных и разрушительных факторов, подрывающих сегодня саму основу американского общества... Общее число наркоманов в Соединенных Штатах - людей, которые сами тяжело страдают и причиняют страдания бесчисленному множеству других, - по-прежнему достигает сотен тысяч». Перейдем к краткому описанию наркоситуации в современной России. Только в 1975 году Коллегия Министерства здравоохранения СССР приняла решение о создании самостоятельной наркологической службы. Решение было вызвано тем, что действовавшая до него в СССР наркологическая сеть в рамках структуры психиатрической службы перестала в достаточной мере справляться со своими задачами. Это объяснялось все возрастающей потребностью в лечебно-профилактической помощи больным алкоголизмом. Отсутствие единого методического центра обусловило значительные различия в подходе врачей к выявлению больных наркоманией и алкоголизмом, как разновидностью наркомании, активному курсовому, поддерживающему и противорецидивному лечению, динамическому учету и медико-социальному контролю за состоянием больных в период терапевтической ремиссии. Организационной основой наркологической службы стало введение приказом Министерства здравоохранения СССР №131 от 05.02.76 в номенклатуру лечебнопрофилактических учреждений учреждения нового типа, называемого наркологический диспансер. До сих пор наркологические диспансеры являются основным звеном организации наркологической помощи населению, построенной по территориальному признаку. Это максимально приближает специализированную наркологическую помощь к населению. Известно и напечатано, например в [2, с.21], что в последние годы Россия начала играть роль крупного рынка сбыта наркотиков. В геополитическом плане страна оказалась на путях мировых потоков наркотиков, а также стала пограничной страной по отношению к тем странам и регионам, в которых наркобизнес является одним из основных средств получения денег на оружие, ведение войн, осуществление террористических актов. В самой России и граничащих странах СНГ появились опасные наркозоны - Чечня, Таджикистан, Казахстан и др., что влияет на распространенность наркотиков в масштабах всей страны.
21
Известно, что с учетом актуальности проблем распространения наркомании в России, особенно среди детей и молодежи, приказом Министерства образования Российской Федерации от 23.03.99 №718 вопросы организации работы по предупреждению злоупотребления психоактивными веществами в образовательной среде признаны приоритетными в деятельности Минобразования России, органов управления образованием субъектов Российской Федерации. Приказом от 17.12.99 № 1226 утвержден план основных мероприятий Минобразования России по выполнению федеральной целевой программы «Комплексные меры противодействия злоупотреблению наркотиками и их незаконному обороту на 1999-2001 годы». Известно, что в вышедшем в 2001 г. подготовленном Министерством образования Российской Федерации «Сборнике методических материалов по проблеме профилактики злоупотребления психоактивными веществами среди несовершеннолетних и молодежи» [2] частично изложена наркотическая ситуация среди детей и молодежи. С другой, в том же сборнике [2] и других работах, описывающих современную наркоситуацию в России, отсутствуют количественные оценки, позволяющие государственному чиновнику хотя бы приближенно судить о том, какова наркотическая ситуация в масштабе реального времени как в отдельно взятом регионе, так и стране в целом. Например, в [2, с.20] читаем: «По данным Минздрава России количество потребителей наркотиков на первое полугодие 1999 г. составило 315 тыс. человек. По мнению экспертов, реальная численность потребителей наркотиков в стране превышает этот показатель в 8-10 раз». Возникает вопрос: «Сколько же в нашей стране в 1999 г. было наркоманов, 315 тыс. или 3 миллиона 150 тысяч и могут ли масштабы принимаемых правительством, министерствами и ведомствами мер эффективно противостоять масштабам распространения наркомании?» В новейших данных, опубликованных в [66] читаем: «К началу 2003 года в стране было зарегистрировано более 340 тысяч больных наркоманией, однако реально эта цифра в 6-8 раз больше. Число потребителей наркотиков составляет около четырех миллионов человек, или три процента населения России», - заявил Виктор Черкесов. Выполним расчет: 340 тыс. × 8 = 2 млн. 720 тыс. человек. Непонятно, откуда взялась цифра – 4 миллиона? И из каких численных оценок наркоситуации нужно исходить чиновникам «на местах», чтобы принять конструктивные решения? К настоящему моменту времени точность результатов численных оценок наркоситуации в России, предоставляемых нам экспертами оставляет желать лучшего. Даже в рамках одних и тех же публикаций, например, [66], [67], результаты численных оценок наркоситуации в
22
России значительно отличаются друг от друга. Например, в публикациях [66], [67] можно найти разные, но одинаково обоснованные заключения. С одной стороны, опираясь на опубликованные результаты экспертных оценок можно утверждать, что в настоящее время в России около 2 млн. 700 тыс. больных наркозависимостью, с другой стороны, в тех же публикациях утверждается, что больных наркозависимостью в России более 4 миллионов. Но из той же статьи мы узнаем, что только среди молодых людей России ¼ больны наркоманией, а это уже больше 13 миллионов. Результаты деятельности экспертов не только не отражают хотя бы приблизительную оценку наркоситуации в России, но и дезинформируют государственных чиновников, делая невозможным принятие ими решений, адекватных фактической наркоситуации. Изложенная противоречивая ситуация ставит нас перед необходимостью нахождения динамической модели развития наркоситуации в России применением научно-обоснованных и закрепленных государственным стандартом РФ методов математического моделирования. Более точные численные оценки, пусть и не всей наркоситуации, но в большей степени поддающейся учету, находим в медицинских источниках. Например, в публикации [66] со ссылкой на медицинские источники заявлено, что к началу 2003 года на учете в России состояло примерно 340 тысяч больных наркозависимостью. Известно, что в настоящее время описанию пагубного влияния наркотиков и нахлынувшей на страну эпидемии наркомании посвящена многочисленная литература - от научной до научно-популярной, популярной и «бульварной». Однако до сих пор в распоряжении и специалистов-наркологов и государственных чиновников нет цифр, с требуемой точностью характеризующих наркоситуацию, а приводимые в разных источниках экспертные оценки не только не отличаются точностью, но и противоречивы. Приведем отдельные примеры. С одной стороны, в газете «Известия» в январе 1998 г. напечатано сообщение о том, что «... 1 доллар, вложенный в операции с наркотиками, приносит 12240 долларов» прибыли (процитировано по [6]. - прим. авт.). С другой, в том же источнике [6] находим, что по мнению экспертов «Рентабельность наркобизнеса - 10000 процентов. Рубль, вложенный в наркобизнес, приносит 1000 рублей прибыли». Возникает вопрос: «Если рентабельность наркобизнеса 10000 процентов, то почему вложенный рубль приносит всего 1000 рублей прибыли, а не 10000 рублей и какие научные заключения можно сделать, воспользовавшись приведенной экспертной оценкой?» В
23
том же источнике [6] читаем: «Для того, чтобы торговля наркотиками перестала приносить прибыль, из оборота необходимо изымать 75% поступающих туда веществ. Для высокоразвитых стран этот показатель не превышает сегодня 15% (в российской прессе назывались данные для нашей страны - от 0.1 до 1%)». Выполним простейший расчет. Если рентабельность наркобизнеса в России 1000% (в целях наглядности мы взяли наименьшую цифру), то при изымании органами правопорядка 75% незаконно изготовленных наркотиков прибыль от незаконного распространения наркотиков упадет с 1000% до 250%. Можно ли в этом случае считать, что торговля наркотиками перестанет приносить прибыль? В другом источнике [66] находим заявление о том, что «... только в прошлом году на южных рубежах страны перехвачено 96% всего героина, предназначавшегося российским потребителям». Как эта цифра - 96% изъятия сочетается с заявлением о том, что: «Для того, чтобы торговля наркотиками перестала приносить прибыль, из оборота необходимо изымать 75% поступающих туда веществ?» Автором внимательно прочтены десятки публикаций, специализированных на оценке наркоситуации в России и за рубежом. В частности, изучен информационный пакет «Drugbox» [19], состоящий из серии (9 шт.) отпечатанных на глянцевой бумаге брошюр размером 17.5×21 см. по 20-128 стр. Названия брошюр: «Наркотики: информация для учителей и других специалистов», «Аргументы», «Алкоголь», «Марихуана», «Табак», «Экстази», «Кокаин и другие психостимуляторы», «Растворители и клей», «Героин и другие опиаты». На внутренней стороне обложки каждой из брошюр напечатано: «Информационный пакет «Drugbox» рекомендован специалистами, работающими в сфере Межведомственной комиссией по профилактики наркомании, противодействию злоупотреблению наркотическими средствами и их незаконному обороту Администрации Санкт-Петербурга» (в целях точности текст воспроизведен дословно с сохранением порядка слов и орфографии. - А.И.). На последней странице каждой из брошюр напечатано, что текст брошюр составлен журналистом. На той же странице напечатано предупреждение: «Копирование запрещено. Брошюра охраняется авторским правом. Нарушения преследуются по закону». Рекомендуем заинтересованному читателю самостоятельно ознакомиться с содержанием пакета «Drugbox». В результате изучения литературы, излагающей наркоситуацию, нами найдено, что все содержащиеся в ней оценки основаны на заключениях экспертов, в результате чего численные значения оценок в разных источниках могут отличаться в десятки раз. В работе [20] в качестве
24
численных оценок наркоситуации взяты проценты опрошенных, утверждающих, что они употребляют или не употребляют наркотики. Какие из оценок считать в большей мере соответствующими действительности, остается решать чиновнику государственного аппарата, планирующему мероприятия по пресечению незаконного распространения наркотиков. На какие же цифры опираться в своих действиях врачам, учителям, родителям, сотрудникам правоохранительных и антинаркотических учреждений? Ответ будем искать в естествознании. Известно, что, приступая к изучению любого явления, мы не владеем и не можем владеть всей полнотой информации. По этой причине мы вынуждены ограничиться тем и только тем, что нам известно о явлении или объекте, т. е. умышленно упростить механизм явления. Такой подход в естествознании известен как моделирование. В БСЭ, в статье «Моделирование» читаем: «Моделирование, исследование объектов познания на их моделях, построение и изучение моделей реально существующих предметов и явлений (живых и неживых систем, инженерных конструкций, разнообразных процессов - физических, химических, биологических, социальных) и конструируемых объектов (для определения, уточнения их характеристик, рационализации способов их построения и т. п.). Моделирование, как познавательный прием неотделимо от развития знания. ... Моделирование ныне приобрело общенаучный характер и применяется в исследованиях живой и неживой природы, в науках о человеке и обществе». В статье «Модель» находим: «Модель (в широком понимании) - образ (в т. ч. условный или мысленный изображение, описание, схема, чертеж, график, план, карта и т. п.) или прообраз (образец) какого-либо объекта или системы объектов («оригинала» данной модели), используемый при определенных условиях в качестве их «заместителя» или «представителя». Так, Моделью Земли служит глобус, а моделью различных частей Вселенной (точнее - звездного неба) - экран планетария. ... Единая классификация видов моделирования затруднительна в силу многозначности понятия «модель» в науке и технике». При решении прикладных задач удобной оказалась классификация видов моделирования, предложенная в монографии «Математическое моделирование динамических систем» [7]. В настоящее время в теории моделирования систем различают три уровня моделирования: 1) концептуальный, 2) концептуально-структурный, 3) математический.
25
Дадим краткую характеристику изложенных уровней моделирования. По мере накопления знаний о некоторой совокупности явлений человек выдвигает различные принципы (концепции), позволяющие более кратко и просто и в более доступной форме объяснить наблюдаемые явления. Концептуальные модели состоят из словесных описаний исследуемого явления. Пример концептуальной модели: по мнению экспертов количество лиц, употребляющих наркотики год от года растет. Классическим примером концептуально-структурной модели является геоцентрическая модель Птолемея, согласно которой Земля является центром Вселенной; Солнце, звезды и планеты вращаются вокруг Земли. Известно, что геоцентрическая модель Птолемея просуществовала в качестве доктрины мироздания в христианском мире почти 16 веков и только в 1543 г. Н. Коперник в работе «О вращении небесных сфер» [8] предложил новую, гелиоцентрическую концептуально-структурную модель динамики Солнечной системы. Всему миру известны трагические судьбы последователей Н. Коперника. Характерным свойством концептуальных и концептуальноструктурных моделей является отсутствие в них доказательности. Последнее следует из того, что в концептуальных и концептуальноструктурных моделях отсутствует численная мера сравнения. На практике концептуальные и концептуально-структурные модели могут оказаться как правильными, так и неправильными. Однако отсутствие численной меры сравнения не позволяет в рамках концепций доказать правильность или неправильность модели. Что можно возразить, например, против модели: жизнь стала лучше, жизнь стала веселее! Доподлинно известно только то, что найдена эта модель применением результатов экспертных оценок. Известно и напечатано, например в энциклопедии [9], что свойства доказательности модель приобретает только тогда, когда объем знаний об исследуемом предмете достигает уровня количественной зрелости. В этом случае модель становится математической, доказательной. Языком математической модели являются аналитические выражения, т. е. формулы, уравнения, системы уравнений и т. п. объекты. По мнению автора, примером успешного применения результатов математического моделирования является зародившаяся на наших глазах доказательная медицина. Примером успешного применения методов математического моделирования при решении задачи оценки наркоситуации в Санкт-Петербурге может служить отчет о научно-исследовательской работе «Здоровое питание как элемент психосоматической профилактики наркомании» [10].
26
Подводя итог, отметим, что из специализированной по методам оценок научной литературы, например из справочника [11] известно, что экспертные оценки являются оценками, найденными методами концептуально-структурного моделирования. Вместе с тем доказано и опубликовано, например в [11], [12, с.155] и др. источниках, что наибольшей адекватностью описания исследуемых явлений обладают модели математические. Поэтому применение результатов, заявленных экспертами, но не доказанных аналитически, неизбежно приводит к ошибкам в оценке наркоситуации. В свою очередь это препятствует эффективной организации антинаркотических мероприятий и последующего контроля их результатов. По мнению автора, сложившаяся практика концептуально-структурного моделирования (т. е. так называемых экспертных оценок) динамики наркоситуации в России фактически не в состоянии отразить реальную эпидемиологическую ситуацию распространения наркомании. Назрела необходимость прекратить устаревшую практику неограниченного доверия оценкам избранных экспертов и перейти к научно-обоснованным методам математического моделирования эпидемиологии наркоситуации как в России в целом, так и в отдельных регионах. В настоящее время существует и распространено мнение о том, что математическое моделирование прерогатива математиков-профессионалов. На самом деле, это не совсем так, а точнее, совсем не так. Приведем пример. Известно, что материальный достаток многих современных пенсионеров России ниже официального значения прожиточного минимума. Вспомним ситуацию, при которой каждый из нас почти наверняка присутствовал, закупая продукты питания. В магазин входит бабушка, которая в состоянии сделать закупку не больше, чем на 50 рублей. Перечислим некоторые из возможностей, которые перед ней открываются. 1. Проиграть 50 рублей в игровом автомате. 2. Купить 2 бутылки «Пепси-колы». 3. Купить 1 бутылку «Пепси-колы» и упаковку «Чипсов». Каждая из возможностей 1-3 есть математическая модель расхода финансов. Нетрудно догадаться что бабушка, возможно и малограмотная, их отклоняет, выбирая четвертую модель: купить понемногу разных овощей, чуть-чуть какого-нибудь дешевого мясного продукта, немного жира, четвертинку хлеба. Что сделала, причем «в уме», бабушка?
27
1. Нашла несколько возможных математических моделей расхода ограниченных финансовых средств, т. е. нашла множество решений задачи расхода. 2. Выбрала из найденного множества решений такое решение, которое максимизирует решение задачи выживаемости при условии ограниченности средств, т. е. оптимальное в смысле выживаемости решение. ЗАДАЧИ К §1. Задача 1.1. Среди некоторых категорий лиц распространено мнение: существует ложь, наглая ложь и статистика. Можно ли считать такую модель доказательной? Решение. Изложенная модель может быть классифицирована как концептуальная. Концептуальные модели не обладают качеством доказательности, так как в них отсутствует мера сравнения. Ответ. Модель нельзя считать доказательной. Задача 1.2. Можно ли считать доказательной модель: если бы не было чиновников-бюрократов, жизнь была бы значительно лучше? Решение. Как и в задаче 1.1 изложенная модель является моделью концептуальной. Следовательно, бездоказательной. Ответ. Модель нельзя считать доказательной. Задача 1.3. Можно ли считать доказательным утверждение: больше спишь - меньше видишь, меньше видишь - меньше знаешь, меньше знаешь - крепче спишь! Решение. Несмотря на использование в модели математических соотношений меньше-больше, модель нельзя считать доказательной так как: 1) отсутствуют определения понятий меньше-больше; 2) отсутствует аналитическое выражение (формула или уравнение) описывающее зависимость между элементами модели; 3) практическая проверка результатов модели (верификация) представляется затруднительной вследствие неопределенности используемых в модели понятий. Задача 1.4. Если путь, пройденный телом обозначить через S, время пути через t, а скорость движения тела через v, то значение пути можно вычислить, воспользовавшись формулой S = v·t.
28
Решение. Формула для вычисления пути S = vt известна из школьного учебника элементарной физики, где доказано, что такое соотношение действительно имеет место при равномерном движении тела. Аналитическое выражение S = v·t есть математическая модель равномерного движения тела, проверенная многочисленными экспериментами. Ответ. Модель доказательная. Замечание 1.1. Математическая модель не считается верной и доказательной, если при ее нахождении или записи допущена ошибка. По этой причине математическая модель, записанная нагромождением формул и уравнений, скорее может оказаться ошибочной, нежели модель, допускающая запись в виде простых аналитических выражений.
29
§2. О МАТЕМАТИЧЕСКОМ МОДЕЛИРОВАНИИ В ЕСТЕСТВОЗНАНИИ 1. Краткая историческая справка В одной из лекций в Санкт-Петербургском государственном университете великий русский ученый В.И.Зубов (1930-2000) [9] сообщил о том, что одна из первых дошедших до наших дней математических моделей изложена в работе Архимеда (ок. 287-212 г. до н. э.) "О плавании тел в жидкостях". Работы Архимеда намного опередили свое время и были правильно оценены только в эпоху создания дифференциального и интегрального исчисления, начавшуюся со второй половины XYII в. и продолжающуюся и в наши дни. Однако создателем современной научной методологии часто считают Ф. Бэкона (1561-1626), изданная в книге "О принципах и началах" [15] классификация наук которого была принята французскими энциклопедистами. По мнению автора следует упомянуть и однофамильца Ф. Бэкона - Роджера Бэкона (1214-1292), который хоть и числился монахом францисканского ордена, но главными считал две вещи: математику и опыт. Р. Бэкон предугадал большое значение математики, без которой, по его мнению, не может существовать ни одна наука. Заинтересованный читатель в БСЭ в статье "Бэкон Роджер" может найти информацию о том, что Р. Бэкон предсказал многие открытия и изобретения XIX-XX вв., которые будут сделаны благодаря развитию математики: телефона, транспортных средств, не использующих живую тягловую силу, летательных аппаратов и т. д. Одним из первых ключевые принципы математического моделирования изложил Я. Бернулли (1654-1705) в работе "О законе больших чисел" [14]. В целях ознакомления читателя сообщим эти принципы в формулировке Я. Бернулли. 1. Догадкам не место в тех вещах, где можно достигнуть полной достоверности. 2. Не достаточно взвешивать один или другой довод; но нужно добавить все, которые могут дойти до нашего сведения и которые покажутся годными в каком-либо отношении для доказательства предположения. 3. Следует не только рассматривать доводы, приводящие к утверждению, но и все те, которые могут привести к противоположному заключению, дабы после должного обсуждения тех и других стало ясно, которые перевешивают.
30
4. Для суждения о вещах общих достаточны доводы отдаленные и общие, но для суждения о частных вещах следует присоединять также доводы более близкие и специальные, если только такие имеются. 5. В обстоятельствах неясных и сомнительных наши действия должны приостанавливаться, пока не прольется больший свет; но если необходимость действия не терпит отлагательства, из двух исходов нужно всегда избирать тот, который кажется более подходящим, безопасным, разумным или надежным, хотя бы ни один таковым на деле не был. 6. Что в некотором случае полезно, но ни в каком не вредно, следует предпочитать тому, что никогда не приносит ни пользы, ни вреда. 7. Не следует оценивать поступки людей по их результатам. Этот неоднозначно трактуемый в рамках разного менталитета принцип Я. Бернулли комментирует: "Ибо иногда самые безрассудные поступки сопровождаются наилучшим успехом, разумнейшие же, наоборот, - наихудшим. ... Так, если кто-нибудь собирается тремя костями с первого же раза выбросить три шестерки, то, хотя бы он и выиграл, однако должен считаться безрассудным. Напротив, следует отметить превратное суждение толпы, которая считает кого-либо тем более выдающимся, чем он счастливее, и у которой даже удачное и счастливое преступление большей частью называется добродетелью". 8. В суждениях наших следует остерегаться, чтобы не приписать вещам более, чем следует, и не считать самим, а равно и не навязывать другим, за безусловно достоверное нечто такое, что только вероятнее другого. 9. Однако, так как только в редких случаях можно достичь полной достоверности, то необходимость и обычай требуют, чтобы нравственно лишь достоверное считалось безусловно достоверным. Было бы поэтому полезно, если бы властью Правительства были установлены для нравственной достоверности известные пределы, например, если было бы определено, достаточно ли для достижения ее 99/100 или требуется 999/1000 достоверности. Замечание 2.1. К сожалению ни одна из опубликованных экспертных оценок наркоситуации в современной России не удовлетворяет перечисленным требованиям 1 - 9, принятым в науке еще в XYII в. Больше того, ни одна из изученных автором работ по оценке наркоситуации не соответствует действующим в настоящее время в России требованиям, законодательно закрепленным в ГОСТ 7.32.91.
31
С 8 августа 1900 г. и до настоящего времени в Мировой науке за ключевой принцип не только математического моделирования, но и всего естествознания в целом принята Основная аксиома Гильберта о разрешимости в широком смысле слова всякой математической задачи: "... вот проблема, или решение. Ты можешь найти его с помощью чистого мышления; ибо в науке не существует Ignorabimus! ("мы не будем знать")". Заинтересованный читатель может ознакомиться с проблемами Гильберта, воспользовавшись "Математическим энциклопедическим словарем" [9, с.151]. 2. Математическая модель и этапы ее поиска В целях точности изложения воспользуемся статьей о математических моделях из книги [9]. Определение 2.1. Математическая модель - приближенное описание какого-либо класса явлений внешнего мира, выраженное с помощью математической символики. Анализ математических моделей позволяет проникнуть в сущность изучаемых явлений. Математическое моделирование - мощный метод познания внешнего мира, а также прогнозирования и управления. Процесс математического моделирования, т. е. изучения явления с помощью математической модели, можно подразделить на четыре этапа. Первый этап - формулирование закона, связывающего основные объекты модели. Этот этап требует широкого знания фактов, относящихся к изучаемым явлениям, и глубокого проникновения в их взаимосвязи. Эта стадия завершается записью в математических терминах сформулированных качественных представлений о связях между объектами модели. Второй этап - исследование математических задач, к которым приводят математические модели. Основным вопросом здесь является решение прямой задачи, т. е. получение в результате анализа модели выходных данных (теоретических следствий) для дальнейшего их сопоставления с результатами наблюдений изучаемых явлений. На этом этапе важную роль приобретает математический аппарат, необходимый для анализа математической модели, и вычислительная техника - мощное средство для получения количественной выходной информации как результата решения сложных математических задач. Третий этап - выяснение того, удовлетворяет ли принятая гипотетическая модель критерию практики, т. е. выяснение вопроса о том, согласуются ли результаты наблюдений с теоретическими следствиями
32
модели в пределах точности наблюдений. Если ошибки найденных применением модели решений выходят за пределы точности наблюдений, то модель не может быть принята. Четвертый этап - последующий анализ модели в связи с накоплением данных об изучаемых явлениях и модернизация модели. В процессе развития науки и техники данные об изучаемых явлениях все более и более уточняются и наступает момент, когда выводы, получаемые на основании существующей математической модели не соответствуют нашим знаниям о явлении. Возникает необходимость построения новой, более совершенной математической модели. Типичным примером, иллюстрирующим характерные этапы в построении математической модели, является модель Солнечной системы. Наблюдения звездного неба начались в глубокой древности. Первичный анализ этих наблюдений позволил выделить планеты из всего многообразия небесных светил. Т. е. первым шагом было выделение объектов изучения. Определения объектов изучения и их взаимосвязей являются исходными положениями - своеобразными аксиомами гипотетической модели. Вторым шагом явилось нахождение закономерностей движений небесных светил. Модели Солнечной системы в процессе своего развития прошли через ряд последовательных усовершенствований. Первой была модель Птолемея, исходившая из положения, что планеты и Солнце совершают движения вокруг Земли и описывающая эти движения с помощью правил (формул), многократно усложнявшихся при накоплении наблюдений. Развитие мореплавания поставило перед астрономией новые требования к точности наблюдений. Н. Коперником в 1543 г. была предложена принципиально новая основа законов движения планет, полагающая, что планеты вращаются вокруг Солнца по окружностям. Это была качественно новая, но еще не математическая модель Солнечной системы. Однако не существовало параметров системы (радиусов окружностей и угловых скоростей движения), приводящих количественные выводы теории в должное соответствие с наблюдениями, так что Н. Коперник был вынужден вводить все новые и новые поправки в движения планет по окружности. Следующим шагом в развитии математической модели Солнечной системы были исследования И. Кеплера в начале XVII в., который сформулировал новые законы движения планет. Положения Н. Коперника и И. Кеплера давали кинематическое описание движения каждой планеты обособленно, не затрагивая того, что обусловливает эти движения. Принципиально новым шагом были работы И. Ньютона, предложившего во
33
второй половине XYII в. динамическую модель Солнечной системы, основанную на законе всемирного тяготения. Динамическая модель И. Ньютона полностью согласовывалась с кинематической моделью И. Кеплера, но развивала ее применением закона всемирного тяготения. Законы И. Кеплера логически вытекали из модели И. Ньютона. К 40-м гг. XIX в. выводы динамической модели И. Ньютона вошли в противоречие с накопленными к тому времени наблюдениями: наблюдаемое движение Урана уклонялось от теоретически вычисленного движения. В 1846 г. У. Леверье расширил систему наблюдаемых планет новой гипотетической планетой, названной им Нептуном, и, пользуясь новой математической моделью Солнечной систелы, вычислил массу и нашел закон движения новой планеты так, что в новой системе противоречие в движении Урана было снято. Позже планета Нептун была открыта в месте, предсказанном У. Леверье. Аналогичным методом, используя расхождения в теоретической и наблюдаемой траектории Нептуна, в 1930 г. была открыта планета Плутон. Математическая модель Солнечной системы и ее частей продолжает интенсивно развиваться. Подготовленный читатель может ознакомиться с некоторыми ее результатами, изучив работу В.И. Зубова "Теория физической либрации Луны" [17]. В настоящее время в естествознании метод математического моделирования, сводящий исследование внешнего мира к математическим задачам, занимает наиболее приоритетное место среди других методов исследования. Итак, резюмируя, можно сказать, что математическая модель нужна: 1) для того чтобы понять, как устроен конкретный объект: какова его структура, основные свойства, законы развития и взаимодействия с окружающим миром; 2) для того, чтобы научиться управлять объектом (или процессом) и найти наилучшие способы управления при заданных целях и критериях; 3) для того чтобы прогнозировать прямые и косвенные последствия реализации заданных способов и форм воздействия на объект. В целях облегчения труда читателя приведем из книги [16] некоторые весьма интересные высказывания известных ученых о математическом моделировании. В каждой науке ровно столько истины, сколько в ней математики. И. Кант.
34
Гипотез не измышляю. И. Ньютон. Он стал поэтом. Для математика у него не хватило воображения. К. Гаусс. Если человек не понимает проблемы, он пишет много формул, а когда поймет, в чем дело, их останется в лучшем случае две. Н. Бор. ЗАДАЧИ К §2 Предлагаемые задачи рассчитаны для лиц, владеющих знанием математики в объеме 8-9 классов Российской средней школы. По мнению автора, лица с меньшим фактическим образованием вряд ли смогут внести личный существенный вклад в решение Государственных задач оценки наркоситуации в России. Пожалуй, единственный разумный выход для тех, кто упорно не желает вспомнить школьную математику - не заниматься самостоятельно оценкой наркоситуации, а обратиться за помощью к специалистам-математикам. По мнению автора, единственный метод научиться решать задачи - это учиться их решать. Опираясь на личный опыт преподавания в вузах, автор пришел к заключению, что при попытке решения задач учащийся чаще всего сталкивается со следующей трудностью: с одной стороны, прочтенный теоретический материал кажется полностью понятным, и это действительно так - проверка знаний учащегося подтверждает наличие у него новых знаний, с другой стороны, простейшие задачи учащийся решить не может. В таких случаях автор рекомендовал выучить решения 10-20 типичных задач. Автором замечено, что после того, как студент выучивал решения 10-20 типичных задач, он успешно справлялся и с другими задачами. Все задачи, предложенные в пособии, даны с решениями. В интересах читателя и в целях более глубокого усвоения читателем материала, решения некоторых из задач пособия изложены не сразу после их формулировок, а в последующих параграфах пособия. По мнению автора, такой подход позволил использовать решения задач и в качестве иллюстраций и в качестве связующих звеньев предыдущего теоретического материала с последующим. Задача 2.1. В вузе 1000 учащихся. Из них специалистами обследовано 100 учащихся. Выявлено, что среди 100 обследованных студентов 10 систематически употребляют наркотики.
35
Можно ли считать, что 10% студентов данного вуза наркоманы? Решение. О количестве процентов студентов вуза, употребляющих наркотики, мы вправе судить, обследовав всю 1000 студентов. Выборочное обследование, заканчивающееся вычислением 10/100 = 0.1 = 10% не является нахождением математической модели. В рамках такого подхода задача не имеет решения. Ответ. Утверждение о том, что около 10% студентов вуза наркоманы ошибочно. Замечание 2.2. Изложенная задача может быть решена только применением методов математической статистики, которые будут изложены позже. Задача 2.2. Одной из простых моделей роста численности наркоманов среди населения является модель y(t) = Ce-kt + b, где C, k, b - константы, e ≈ 2.718, t - время (в годах), y(t) - процент доли наркоманов. Построить график зависимости роста численности наркоманов от времени при C = -2, k = -0.1, b = 1. Оценить, примерно, через сколько лет страна достигнет уровня наркотизации, превышающего 96% населения. Решение. Самым простым методом построения графиков является метод построения графиков по точкам. Подставив в заданное условием задачи аналитическое выражения значения постоянных C = -2, k = -0.1, b = 1, e ≈ 2.718 находим: y(t) = -2 ⋅ 2.718-0.1t + 1. Составим таблицу 1 значений функции y(t) при разных значениях аргумента t. Например, при t = 0, 5, 10, 15, 20, 30, 40. ТАБЛИЦА 1 ЗНАЧЕНИЯ ФУНКЦИИ y(t) t y(t)
0 -1
5 -0.21
10 0.264
15 0.55
20 0.73
30 0.9
40 0.96
Замечание 2.3. В целях удобства вычислений при вычислении значений функции y(t) при разных значениях аргумента t рекомендуется воспользоваться инженерным калькулятором или компьютером с установленным удобным для непрофессионального пользователя программным обеспечением. Например, системой символьной математики DERIVE. Доступное описание правил применения DERIVE можно найти в справочнике [18] и др.
36
Воспользовавшись численными значениями аргумента t и соответствующими им значениями функции y(t) из таблицы 1, помечаем на плоскости точки, соответствующие напечатанным в таблице координатам. Найденные точки соединяем кривой. В результате находим кривую, изображенную на рис. 1.
Рис.1. Из результатов вычислений напечатанных в таблице следует, что при значениях t > 40 лет процент наркотизации населения превысит значение 96%. Задача 2.3. Найти график функции
y ( x) =
1 e σ 2π
−
( x−a)2 2σ 2
при a = 0, σ = 1. Решение. Воспользовавшись методом нахождения графиков функций, изложенным в задаче 2.2, вычислим значения функции y(x) при значениях параметров a = 0, σ = 1 и при значениях аргумента x = -3, -2, -1, 0, 1, 2, 3. Вычисленные значения расположим в таблице 2.
37
ТАБЛИЦА 2 ЗНАЧЕНИЯ ФУНКЦИИ y(x) x y(x)
-3 0.0044
-2 0.054
-1 0.241
0 0.389
1 0.241
2 0.054
3 0.0044
Воспользовавшись численными значениями аргумента x и соответствующими им значениями функции y(x) из таблицы 2, помечаем на плоскости точки, соответствующие напечатанным в таблице координатам. Найденные точки соединяем кривой. В результате находим кривую, изображенную на рис. 2.
Рис.2. Задача 2.4. (Решить самостоятельно.) записываемой аналитическим выражением
Найти
график
прямой,
y(x) = kx + b при k = 0.5, b = 1. Замечание 2.4. Читателю, не владеющему математическим аппаратом настолько, что решения предложенных задач для него очевидны, настоятельно рекомендуется уделить должное внимание задачам 2.2-2.4, т. к. они широко применимы при решении задач оценки наркоситуации.
38
§3. О МЕРЕ ОЦЕНКИ НАРКОСИТУАЦИИ Я предпочитаю найти одну истину, хотя бы и в незначительных вещах, нежели долго спорить о величайших вопросах, не достигая никакой истины Галилей [24,с.143]. 1. Противоречие между тем, что кажется и тем, что существует на самом деле Очевидно, что прежде чем приступить к решению задачи оценки наркоситуации, необходимо в первую очередь иметь точную формулировку самой задачи. Таково требование, законодательно закрепленное в России и изложенное в ГОСТ 7.32-91 [21,с.5]. Замечание 3.1. На с.20 [21] напечатано: "Настоящий стандарт разработан методом прямого применения международного стандарта ИСО 5966-82. Взамен ГОСТ 7.32-81". Известно, что невыполнение требований, изложенных в Государственных стандартах, преследуется законодательными актами России. Известно, что в России изучение методов правильной и научно обоснованной формулировки задачи входит в программы дисциплин, преподаваемых в вузах. Среди многочисленной литературы, авторы которой претендуют на решение задачи оценки наркоситуации, нам не удалось найти работ, удовлетворяющих изложенным в ГОСТ 7.32-91 требованиям, а также требованиям, изложенным в государственных рекомендациях по стандартизации Р.50.1.037-2002 [23] и др. В целях точности изложения приведем фрагмент статьи из БСЭ. Задача. 1) поставленная цель, которую стремятся достигнуть. 2) Поручение, задание. 3) Вопрос, требующий решения на основании определенных знаний и размышления (математическая задача, шахматная задача, логическая задача). Вследствие того, что решение задачи оценки наркоситуации должно удовлетворять требованиям доказательности, мы имеем дело с задачей математической. Утвержденное в России требование к наличию математической формулировки при решении задач естествознания известно и изложено, в частности, в справочно-методических пособиях.
39
Например, в справочно-методическом пособии [22,с.110] читаем: "Здесь необходимо привести математическую модель объекта исследования, описать ее особенности (отличия от ранее использованных), обосновать принятые допущения и кратко охарактеризовать методы анализа (например, методы решения системы уравнений, если математическая модель представлена в виде системы уравнений)". Прежде чем приступить к изучению научных методов оценки наркоситуации рассмотрим типичный случай, возникающей при попытках экспертов дать оценку наркоситуации в целом применением данных, найденных в результате обследования групп ограниченного объема. Пример 3.1. В специальном государственном учреждении содержится 1000 лиц. Из них произвольно выбрали 100 и провели их тщательное обследование. Выяснили, что 10 из обследованных принимают наркотики. Требуется оценить наркоситуацию в учреждении. Как авторы многочисленных работ по экспертной оценке наркоситуации в большинстве случаев решают такую задачу? - Выполняют действие - 10/100 и пишут ответ: около 10% содержащихся в учреждении лиц употребляют наркотики. Нетрудно догадаться, что если такое решение считать правильным, то задача оценки наркоситуации в России не актуальна - метод решения прост и общеизвестен, результат очевиден, необходимость в государственных структурах, ориентированных на решение задачи, сомнительна. Разберем задачу подробнее. Во-первых, в условии не сказано о том, что является мерой оценки и можно ли считать проценты такой мерой. Во-вторых, не указаны требования к точности оценки. В-третьих, отсутствуют указания о том, что именно хочет заказчик, что означает "оценить наркоситуацию". Может быть, достаточно ответа "Наркоситуация в пределах нормы?" Кроме того, возникает целый ряд дополнительных вопросов, которые, казалось бы, выходят за рамки решения конкретной задачи, но без знания точных ответов на которые решить задачу невозможно. Например, является ли пожелание заказчика исследования наркоситуации объективным критерием ее оценки? Знает ли сам заказчик о существовании критериев, прописанных в Государственных стандартах? Например, в ГОСТ 2.105. Как видите, читатель, уже на стадии постановки задачи требуется весьма широкая науковедческая образованность не только специалиста-исполнителя, но и заказчика. Вернемся к примеру 3.1. При его решении эксперт выполнил правильное с его точки зрения действие - исходя из результатов того, что
40
из 100 отобранных для опроса человек 10 оказались наркоманами эксперт, воспользовавшись знанием арифметики, поделил 10 на 100 и получил 10%. Однако, что бы произошло, если бы из 100 человек не 10, а 11 или 9 оказались наркоманами. В этих случаях эксперту, исходя из его личного опыта, пришлось бы одиннадцать поделить на сто и получить в результате 11% наркоманов или девять поделить на сто и получить 9%. С одной стороны найденные новые оценки наркологической ситуации почти такие же, как и в первом случае. С другой стороны - другие. Некоторые из экспертов, назовем их "избранными", вследствие природной смекалки предпочтут дать ответ: в обследованном коллективе 9-11% наркоманов. Представим ситуацию: администрация нашего учреждения, из лучших гражданских побуждений озабоченная неблагоприятной наркоситуацией в доверенном ей учреждении, сразу же после первого обследования наркоситуации обратилась к государственным чиновникам с запросом об уточнении оценок. В свою очередь чиновники, также из лучших гражданских побуждений озабоченные неблагоприятной наркоситуацией, выделили из государственного бюджета новые деньги для нового обследования. Привлекли новых экспертов и они, снова отобрав из 1000 тех же самых подозреваемых 100, но уже других, провели новое исследование. Оказалось, что среди этих 100 других всего 2 наркомана. Поэтому в результате новой экспертной оценки выяснилось, что наркоманов не 9-11%, а всего 2%. Какая из экспертных групп права? вопрос риторический. Но на столах выделивших деньги чиновников появился новый отчет, в котором наркоситуация оценена в 2-11%. И чиновники, с полным на то основанием, написали уже в своих отчетах: "Результаты проводимых оценок наркоситуации значительно отличаются друг от друга и требуют уточнений". Чиновники снова "находят деньги", назначают дополнительное исследование, привлекают новых экспертов "избранных из избранных" - из-за границы. Выполнено новое исследование. Из 100 опрошенных 20 оказались наркоманами. В строках нового отчета (естественно, уже не на русском языке.- А.И.) читаем: "В результате исследования повышенной точности группа международных экспертов пришла к заключению о том, что количество наркоманов катастрофически растет и составляет 2 - 20% населения страны". Читатель без особого труда сам найдет немало таких примеров, познакомившись в общедоступной литературе с отчетами и публикациями по исследованию наркоситуации. И так, избегнув утомительных математических доказательств, в примере 3.1 мы продемонстрировали, что оценка среднего
41
арифметического процента не является приемлемой для наших целей. Необходима какая-то другая, удовлетворяющая современным требованиям российских и международных стандартов оценка. Доказано и известно, что для таких случаев подходит вероятностная оценка. Однако, для ее правильного применения и умения правильно трактовать результаты, излагаемые с помощью вероятностной оценки, необходимо ознакомиться с понятием вероятности, употребляемом не в бытовом, а в научном смысле. 2. Знакомство с вероятностной мерой Говоря словами П. Лапласа (см., например, в книгах [47], [44, с.863]) одного из основоположников применения вероятностной меры к оценке разных ситуаций, в том числе и юридических, и общественнополитических: "... теория вероятностей есть в сущности не что иное, как здравый смысл, сведенный к исчислению; она заставляет оценивать с точностью то, что справедливые умы чувствуют как бы инстинктом, часто не умея отдавать себе в этом отчета. Если принять во внимание аналитические методы, которые возникли из этой теории, истинность принципов, служащих ей основанием, утонченную и изящную логику, которой требует применение к решению задач, учреждения общественной пользы, опирающиеся на нее, и распространение, которое она получила и может поучить при применении ее к важнейшим вопросам естествознания и нравственных наук; если затем заметить, что даже в таких областях, которые не могут быть подчинены исчислению, она дает самые верные взгляды, которые могут нами руководить в наших суждениях, и что она нас учит предохранять себя от иллюзий, которые нас часто сбивают с пути, мы увидим, что нет науки, более достойной наших размышлений, и что было бы очень полезно ввести ее в систему народного просвещения. ...Аналитическая теория вероятностей, входящая в область прикладной математики, существенно отличается от других приложений чистого анализа. Анализ вероятностей подвергает рассмотрению и численной оценке явления, зависящие от причин не только совершенно неизвестных нам, но которые даже, по нашему неведению, не подлежат никаким предположениям. Тонкие, глубокомысленные умозаключения, приводящие к этой цели, составляют в совокупности надежный путь, если не для открытия безусловной истины, то, по крайней мере, для возможного приближения к ней. И когда примем в соображение, что при таком важном назначении, математическое учение о вероятностях обнимает в своих приложениях предметы физического и нравственного мира, то утвердительно можем сказать, что эта теория есть создание ума, наиболее
42
возвышающее человека, и указывающее на предел ведений, за которые ему не дано перейти". В целях наглядности рассмотрим пример. Пример 3.2. Бросается монета. Будем считать, что монета без изъянов и бросающий ее - не шулер. Известно, что в результате такого действия монета упадет вверх либо "орлом", либо "решкой". Случай, в котором монета оказывается вставшей на ребро рассматривать не будем прибережем его для экспертов, которые и монету заставят упасть на ребро. Какова вероятность того, что на монете выпадет "решка"? Не торопитесь. Ответ 50% - неправильный! Просим извинения у читателя, но и вопрос неправильный: мы еще не сообщили о том, что называется вероятностью. Определение 3.1. Вероятностью P события A называется число P(A), соответствующее событию A и принимающее значение от 0 до 1 включительно. Нетрудно увидеть, что процентная мера не является мерой вероятности, т.е. вероятность выпадения "решки" в примере 3.2 равна 0.5, а не 50%. Приведем пример другой часто встречающейся ошибки. Пример 3.3. Выполнен опыт: в течение декабря наблюдалось число дней, которое шел снег. Снег шел 20 дней. Чему равна вероятность того, что в произвольно выбранный день декабря произойдет снегопад? Часто встречающееся решение P1 = 20/31 = 0.645 является неправильным, т.к. не удовлетворяет напечатанному выше определению вероятности. Предположим, наблюдение проводилось бы в какой-то другой год, и количество снегопадов было бы не 20, а 15. Следуя тому же методу вычисления вероятности, находим: P2 = 15/31 = 0.48. Получилось, что одно и тоже событие происходит с разной вероятностью, что противоречит определению 3.1. Смекалистый эксперт решит, что нужно сложить количество дней со снегопадами, т. е. 20 + 15 и поделить на сумму дней в двух декабрях: (20 + 15)/(31 + 31) = 0.565. Однако заявление о том, что вероятность снегопада в декабре равна 0.565 также неправильное - прибавив результаты наблюдений еще в одном декабре и разделив количество дней со снегопадами на общее количество дней наблюдений, мы, скорее всего, получим какое-то новое число. "Избранный" эксперт посоветует провести наблюдение много декабрей и оставит за собой право заключения о том,
43
чему равно это "много". Забегая вперед, сообщим читателю, что, если проводить наблюдения за снегопадами в течение 100 декабрей, то и в этом случае мы не сможем ответить на вопрос о значении вероятности снегопада в декабре. Поскольку всегда можно потребовать 101 год наблюдений, 102, ... , 200 и т. д. Какова же вероятность того, что в назначенный день декабря пойдет снег? Предложенная задача не решается методом деления количества дней в декабрях (сколько бы их не наблюдали), в которые шел снег на общее количество дней в наблюдаемых декабрях. Частное от такого деления не есть вероятность, т. к. противоречит определению 3.1. Пример 3.4. Бросается монета. Требуется найти вероятность того, что выпадет "решка". Решение. Если исходить из распространенного мнения о том, что значение вероятности можно вычислить делением количества испытаний, при которых выпала решка на общее количество испытаний, то найденные результаты окажутся противоречивыми. Например, мы можем 100 раз подбросить монету и в результате такого опыта "решка" может выпасть 60 раз. Разделив 60 на 100, находим, что вероятность выпадения "решки" равна 0.6. Последнее противоречит здравому смыслу. Решение ошибочно. Известно, что К. Пирсон (1857-1936) [9, с.737] - английский математик, в начале XX в. 24000 раз подбросил монету и не получил таким методом желанной вероятности 0.5. Из истории математики известно, что первая попытка оценить искомое значение вероятности отношением количества исследуемых событий к общему количеству событий восходит к VII в. В настоящее время такое отношение называют относительной частотой события или точечной оценкой вероятности события. Определение 3.2. отношения
Величина
p*,
вычисляемая
применением
m n где n - количество опытов, m - количество появлений исследуемого события за n опытов, называется точечной оценкой вероятности p. Довольно часто число n называют общим числом исходов испытания, m - числом благоприятных (т. е. тех, которые мы исследуем) исходов испытания. Доказано, что при бесконечно большом увеличении числа n точечная оценка вероятности p* действительно приближается к значению вероятности p, т. е. p* =
44
n = lim p* = p n →∞ m n →∞ При любых конечных n p* ≠ p, т. е. значение точечной оценки вероятности p* не равно значению вероятности p и наглядный пример тому - опыт К.Пирсона, подбросившего монету 24000 раз и так и не получившего вероятность 0.5 делением m/n. Тем более невозможно оценить вероятность обнаружения наркомана в обследованной выборке из 100 человек, зафиксировав в ней, например, 20 наркоманов и поделив 20 на 100. В некоторых, относительно редких случаях, значение вероятности p известно заранее, до начала опытов, например, из общефизических соображений. К таким редким случаям относится бросание монеты без изъянов - и до опыта интуитивно понятно, что вероятность выпадения "решки" равна 0.5, бросание правильного кубика с написанными на его гранях числами от 1 до 6 - из условий опыта можно принять вероятность выпадения какого-либо из чисел от 1 до 6 одной шестой. lim
Определение 3.3. Будем называть полной группой событий такое множество равновозможных событий, которое состоит из всех возможных исходов исследуемого явления и сумма вероятностей всех равновозможных исходов равна 1. Применение вычисляемой по формуле (1) точечной оценки вероятности p* вместо вероятности p возможно в тех и только в тех случаях, в которых заранее известны все равновозможные исходы испытания. Например, если в колоде 36 карт и 4 из них тузы, то вероятность вытащить туз действительно равна 4/36. Как же вычислить искомую вероятность p некоторого события, имея в распоряжении только результаты опытов, но, не имея достаточных оснований считать, что значение p известно? Ответ на этот вопрос математики искали много веков, но нашли в 30-х годах XX века и то далеко не для всех возможных случаев. К счастью, для изучаемого нами случая оценки наркоситуации, решение известно. Подведем итог параграфу. 1. Вероятность события A есть число P(A) такое, что 0 ≤ P(A) ≤ 1. 2. Точечной оценкой p* вероятности p называется число, определяемое аналитическим выражением p* = m/n, где n - общее
45
количество возможных исходов испытания, m - количество благоприятных исходов. 3. Вероятность p равна точечной оценке p* тогда и только тогда, когда известна полная группа событий. ЗАДАЧИ К §3
Задача 3.1. В обследованной группе из 100 чел. обнаружено 20 наркоманов. Какова вероятность того, что случайно взятый из группы человек наркоман? Решение. Все возможные исходы исследуемого явления известны: в данной группе 20 чел. наркотики употребляют, 80 не употребляют, т.е. полная группа событий известна. Применив определение полной группы событий, приходим к заключению, что т. к. в нашем случае мы имеем полную группу событий, то сумма вероятностей полной группы событий, состоящей из 100 возможных исходов равна 1. Следовательно, вероятность того, что один из случайно взятых людей из обследованной группы наркоман равна 20/100 = 0.2. Замечание 3.1. Найденный результат - вероятность обнаружения наркомана в обследованной группе из 100 чел. равна 0.2 правилен только для данной группы и не распространяется даже приближенно на любую другую группу из 100 чел. Задача 3.2. В учреждении 1000 чел. Из них наугад выбрали 100 чел. и провели их обследование. Оказалось, что из 100 обследованных 20 наркоманы. Какова вероятность того, что наугад взятый из учреждения человек окажется наркоманом? Решение. По результатам обследования наугад выбранных 100 человек из 1000 возможных мы пока не можем сделать никакого доказательного заключения о том, какова вероятность того, что взятый наугад один из 1000 чел. окажется наркоманом. Задача 3.3. В консультативно-диагностической палате многопрофильной городской больницы находятся два обследуемых. Известно, что один из обследуемых употребляет героин, второй алкоголь. К палате подошел пьяный санитар и наугад взял на осмотр одного из обследуемых. После осмотра обследуемого вернули в консультативнодиагностическую палату. Пришел другой санитар, тоже пьяный, снова наугад взял на осмотр одного из содержавшихся в палате. Найти вероятность того, что хотя бы один раз на осмотр был доставлен субъект, употребляющий героин.
46
Изложим один из вариантов решения. Полная группа событий состоит из следующих событий: 1) субъект, употребляющий героин не доставлен ни одного раза, 2) доставлен один раз, 3) доставлен 2 раза. Следовательно, возможно всего 3 исхода. Два из них содержат событие - потребитель героина доставлен. Следовательно, вероятность того, что произойдет событие "субъект доставлен хотя бы один раз" равна 2/3. Замечание 3.3. Изложенное решение перечисленные события 1-3 не равновозможны.
неправильное,
т. к.
Изложим правильное решение. Решение. Обозначим через А событие, заключающееся в том, что на осмотр доставили алкоголика, через Г - субъекта, употребляющего героин. Найдем полную группу событий. Всего возможно 4 случая. Перечислим их. Первый случай - доставлен А и Г. Второй случай - Г и А. Третий случай - Г и Г. Четвертый случай А и А. Перечисленные случаи полностью описывают полную группу равновозможных событий. Из всех событий случай Г - на осмотр доставлен потребитель героина, встречается три раза: в событиях ГА, АГ и ГГ. Применив определение вероятности для случая полной группы событий, состоящей из 4-х событий, находим, что ¾=0.75. Ответ. Вероятность того, что хотя бы один раз на осмотр доставлен субъект, употребляющий героин, равна 0.75. Задача 3.4. Находящийся в консультативно-диагностической палате многопрофильной больницы пациент мечтает либо принять алкоголь, либо принять алкоголь и покурить марихуану. Найти вероятность того, что пациент мечтает: а) только об одном наркотике, т. е. либо принять алкоголь и потом еще принять алкоголь, либо покурить марихуану и потом еще покурить марихуану, б) о двух наркотиках: и принять алкоголь, и покурить марихуану. Решение. Обозначим через А - мечту о приеме алкоголя, через М мечту о приеме марихуаны. Тогда все возможные события, входящие в полную группу событий, есть события АА, ММ, АМ, МА. Всего 4 возможных элементарных события - 4 мечты. Из них мечта только об одном наркотике содержится в двух элементарных событиях АА и ММ , о двух наркотиках также в двух событиях АМ и МА. Следовательно, вероятности содержания мечтаний пациента одинаковы, т. к. и в том и в том случаях вероятность вычисляется, как 2/4=0.5. Ответ. Обе вероятности равны по 0.5. Замечание 3.4. Консультативно-диагностической палатой многопрофильной больницы называется специально оборудованное
47
изолированное помещение, предназначенное для временного содержания представляющих повышенную опасность для медицинского персонала пациентов с явно выраженным девиантным поведением. Задача 3.5. Из результатов многолетних (с 1865 г.) наблюдений за погодой в Санкт-Петербурге известно, что среднесуточная температура приземного слоя окружающего воздуха 10 января может колебаться от -350С до +30С. Разбив указанный интервал температур на отрезки значений по одному градусу, получим, что таких отрезков будет 37. Верно ли утверждение о том, что, рассматривая вероятность среднесуточной температуры как вероятность попадения ее значения в какой-либо из 37 отрезков мы можем считать, что множество событий, состоящее из всех возможных случаев попадания значения температура в какой-либо отрезок есть полная группа событий? Решение. Из результатов многолетних наблюдений известно, что есть значения среднесуточных температур, которые встречаются 10 января в СПб часто, например, -90С. Есть такие значения, которые встречаются редко. Например, -350С. Следовательно, рассматриваемые элементарные события не равновозможны и не могут считаться входящими в полную группу событий. Ответ. Изложенные условия, взятые из результатов наблюдений, противоречат тому, чтобы считать множество всех возможных температур полной группой событий. Замечание 3.5. По мнению автора, ошибочное рассмотрение множества возможных температур в качестве полной группы событий привело к некогда нашумевшей теории глобального потепления климата планеты, опровергнутой российскими учеными в работах [25], [26], [27] и др.
48
§4. ПРИМЕНЕНИЕ ЭЛЕМЕНТОВ КОМБИНАТОРНОГО АНАЛИЗА ПРИ ОЦЕНКЕ НАРКОСИТУАЦИИ 1. Основные определения
Пусть имеется множество, содержащее n элементов. Определение 4.1. Назовем множество упорядоченным, если между его элементами существует какое-либо отношение порядка. Пример 4.1. 1. Множество чисел 1, 2, 3, 4 упорядочено по возрастанию. 2. Множество чисел 4, 3, 2, 1 упорядочено по убыванию. Определение 4.2.Перестановкой из n элементов называется любое упорядоченное множество, в которое входят по одному разу все n различных элементов данного множества. Теорема. Число перестановок n различных элементов равно n!, т. е. Pn = n!.
(1)
Замечание 4.1. Доказано, что 0! = 1. Пример 4.2. Сколькими способами можно переставить числа 1, 2, 3? Решение. Из множества чисел 1, 2, 3 можно получить следующие множества: 1, 2, 3; 3, 2, 1; 1, 3, 2; 2, 1, 3; 2, 3, 1; 3, 1, 2. Итого 6 множеств. Применив формулу (2), избегая утомительного перебора, нетрудно вычислить: P6 = 3!= 3·2·1 = 6. Определение 4.3. Размещением из n элементов по m называется любое упорядоченное подмножество из m элементов множества, состоящего из n различных элементов. Теорема. Число размещений из n элементов по m можно вычислить, воспользовавшись формулой: n! (2) Am n = (n − m)! Кроме изложенных теорем при решении задач оценки наркоситуации могут оказаться полезными изложенные ниже правила. Правило умножения. Пусть требуется одно за другим выполнить какие-то k действий. Если первое действие можно выполнить n1 способами, второе действие - n2 способами и так до k-го действия, которое можно выполнить nk способами, то все k действий вместе можно выполнить n1·,n2·,nk способами.
49
Правило сложения. Если два действия взаимно исключают друг друга, причем одно из них можно выполнить m способами, а другое - n способами, то выполнить одно любое из этих действий можно n + m способами. Пример 4.3. В брошюрке 12 страниц. Необходимо на страницах брошюрки поместить 4 фотографии граждан, находящихся в тяжелом наркотическом опьянении. Сколькими способами это можно сделать, если ни одна страница брошюрки не должна содержать более одной фотографии? Решение. Первую фотографию можно поместить на любую из 12 страниц, т.е. 12 способами, вторую - на любую из оставшихся 11 страниц, т. е. 11 способами, третью - на любую из 10 оставшихся страниц, четвертую - на любую из оставшихся 9 страниц, т. е. девятью способами. Применив правило умножения, находим, что 4 фотографии можно разместить на 12 страницах 12 · 11 · 10 ·9 = 11880 способами. Применив формулу (3) можно найти решение значительно быстрее: для размещения фотографий следует отобрать 4 различные страницы газеты из 12 имеющихся. Затем, отобранные страницы необходимо упорядочить, не обращая внимания на их номера, т. е. определить, на какую страницу поместить первую фотографию, на какую вторую и т. д. Полученная упорядоченная совокупность страниц является согласно определению размещением из 12 элементов по 4, т. е. равно А412. Выполнив вычисления применением формулы (3) находим: n! 12! 4 (3) Am = А12 = = 11880. n = (n − m)! (12 − 4)! Ответ. 4 фотографии на 12 страницах можно расположить 11880 способами так, чтобы ни одна страница не содержала более одной фотографии.
Определение 4.4. Сочетанием из n элементов по m называется любое подмножество из m элементов, которое принадлежит множеству, состоящему из n различных элементов. Теорема. Число сочетаний из n элементов по m элементов можно вычислить, воспользовавшись формулой n! (4) Сm n = m!(n − m) Пример. 4.4. В целях лечения хронической наркомании 12 больным запланирована операция стереотаксической криоцингулотомии. В больнице есть две операционные, в одной из которых можно выполнить не
50
более пяти операций в неделю, в другой не более девяти операций в неделю. Сколькими способами группу из 12 больных можно разбить на две подгруппы, в одной из которых будет не более пяти, а во второй не более девяти больных. Решение. Первая подгруппа может состоять либо из трех, либо из четырех, либо из пяти больных. Подгруппу из трех больных можно выбрать C312 = 220 способами. Подгруппу из четырех больных – C412 = 495 способами, подгруппу из пяти больных – C512 = 792 способами. Учитывая, что выбор первой подгруппы однозначно определяет вторую, применив правило сложения, находим: C312 + C412 + C512 = 220 + 495 + 792 = 1507. Ответ. Разбиение группы из 12 наркоманов на две подгруппы при выполнении условий задачи можно осуществить 1507 способами. Теорема. Имеет место равенство
С 0n + C 2n + C3n + .... + C nn = 2 n
(5)
Пример 4.5. Для опроса о принадлежности к лицам, употребляющим наркотики, из класса отобрали 11 учащихся. Сколько существует вариантов опроса этих 11 учащихся за один сеанс опроса, если ни один из них не будет подвергнут опросу дважды и на сеансе может быть опрошено любое количество учащихся. Причем порядок, в котором опрашиваются учащиеся, безразличен? Решение. Опрашивающий специалист может не спросить ни одного из 11 учащихся, что является одним из вариантов. Этому случаю соответствует C011. Специалист может опросить только одного из учащихся. Таких вариантов C111. При опросе двух учащихся вариантов опроса будет C211, трех - C311 и т. д. Наконец, могут быть опрошены все учащиеся. Число вариантов в этом случае равно C1111. Тогда, применив правило сложения, находим, что число всех возможных вариантов опроса равно C011+C111+C211+C311+ ... +C1111 = 211 = 2048. Читатель без труда заметит, что применением результатов правил, теорем и определений настоящего и предыдущего параграфа можно вычислить вероятности того, что проведенный в исследуемом коллективе опрос в целях выяснения наркоситуации даст хоть какие-то значимые результаты. К сожалению, такие вероятности чрезвычайно малы.
51
Пример 4.6. Предположим в некотором коллективе из 100 чел. есть 2 наркомана. Какова вероятность того, что оба наркомана попадут в группу из 10 чел., наугад выбранную из 100 чел. в целях оценки наркоситуации в коллективе? Решение. Из 100 чел. группу объемом 10 чел. можно выбрать C10100 способами. Выполнив вычисления, находим: 100! С10 = 1.7303 ⋅ 1013 100 = 10!(100 − 10) Замечание 4.2. Автор не уверен, что все читатели знают, как называется в естествознании тринадцатизначное число. Число 1.7303 · 1013 - объем полной группы событий. Подсчитаем число исходов, благоприятствующих интересующему нас событию - среди 10 отобранных человек ровно 2 наркомана. Двух наркоманов можно взять из 2-х наркоманов C22 = 1 способом; при этом остальные 10 – 2 = 8 человек из группы в 10 человек должны быть не наркоманами; взять же 10 - 2 = 8 ненаркоманов из 100 – 2 = 98 ненаркоманов можно C10-2100-2 = C898 = 1.57366 · 1011 способами. Следовательно, число благоприятствующих исходов равно C22·C298 = 1 · 1.57366 · 1011. Искомая вероятность p того, что среди 10 отобранных человек окажется 2 наркомана, равна отношению числа исходов, благоприятствующих событию, к числу всех возможных элементарных исходов: p = (C22·C298 ) / C10100 = (1.57366 · 1011) / (1.7303 · 1013) = 0.0091. Вероятность p = 0.0091 весьма мала. Нетрудно догадаться, что в результате предложенного в задаче выборочного исследования вряд ли будет обнаружено, что в исследуемой группе из 100 человек есть наркоманы. Ответ. Вероятность того, что в исследуемой группе из 100 человек будут обнаружены наркоманы, равна 0.0091. Исследование нельзя считать научно обоснованным, так как применением его результатов невозможно адекватно интерпретировать имеющую место наркоситуацию. Вследствие некоторой громоздкости решений задач такого типа, но их частой встречаемости, избегая математических выкладок, приведем формулу для вычисления вероятности попадания k наркоманов в группу из
52
m обследуемых человек извлеченную из группы объемом N человек, если в группе из N человек n наркоманов. -k C kn ⋅ C m N-n (6) p= . Cm N По мнению автора, формула (6) может оказаться весьма полезной при решении задач оценки наркоситуации. Замечание 4.3. Подробнее с задачами комбинаторного анализа и методами их решений заинтересованный читатель может ознакомиться, воспользовавшись учебниками по математической статистике [28], [29] и задачником [30]. Прототипы изложенных задач и примеров заимствованы автором из книг [28], [29], [30] и др. В интересах читателя приведем типичный пример, иллюстрирующий возможности применения формулы (6). Пример 4.7. В учреждении содержатся 1000 человек. 10 из них наркоманы. В целях решения задачи оценки наркоситуации из 1000 человек выбрали наугад 100 человек и провели их обследование. Какова вероятность того, что все 10 наркоманов попадут в обследуемую группу? Решение. Применим формулу (6). В нашем случае N = 1000, n = 10, m = 100, k = 10. Подставив эти значения величин N, n, m и k в формулу (6) и, выполнив вычисления, находим: -k C kn ⋅ C m N -n
10 100 −10 ⋅ С1000 С10 −10
10 90 ⋅ С990 С10
1 ⋅ 4.19602 ⋅ 10129 = = = = 6.57163 ⋅ 10 −11. p= m 100 100 139 CN С1000 С1000 6.38505 ⋅ 10 Ответ. Искомая вероятность оценивается числом несколько меньшим, чем число 7·10-11, т. е. ничтожно мала, практически равна 0. С такой вероятностью мы обнаружим наркоманов в обследуемом коллективе. Иначе говоря, уже до начала предлагаемого обследования понятно, что такое обследование не может способствовать решению задачи оценки наркоситуации в учреждении. Право принятия решения о том, финансировать такое обследование или нет, оставим государственным чиновникам. 2. Решение задач оценки наркоситуации общедоступных формул комбинаторного анализа
применением
Читатель, попытавшийся самостоятельно выполнить вычисления в рамках изложенных примеров наверняка заметил, что вычисление значений n! при больших значениях числа n весьма утомительно.
53
Например, уже вычисление 100! = 100 · 99 · 98 · ... · 2 · 1 ≈ 9.33262 · 10157 сталкивается со значительными трудностями. С одной стороны, можно воспользоваться инженерным микрокалькулятором, например марки fx-82TL, fx-115W, fx-350TL, fx-911W и др., в которых в силу частой встречаемости при решении инженерных задач вычисление числа сочетаний Cnm является встроенной функцией. Однако, большинство распространенных в России микрокалькуляторов не может отображать числа с более чем двухзначными степенями. Например, большинство конструкций микрокалькуляторов не могут оперировать с числом 10157 и не могут вычислить n! при n > 69, т. к. 69! ≈ 1.71122 · 1098, но уже 70! ≈ 1.19785 · 10100. Можно воспользоваться компьютером, но, во-первых, к сожалению далеко не на каждом компьютере установлено подходящее программное обеспечение, например пакет DERIVE [18]. Во-вторых, не всегда компьютер оказывается "под рукой". Замечание 4.4. Автор настоятельно рекомендует читателям установить на свой компьютер пакет математических программ DERIVE. Объем памяти, требующийся для установки пакета, ничтожен - в версии для DOS пакет в неархивированном виде помещается на одну дискету емкостью 1.44 МГб. Пользование пакетом столь просто, что автору без особого труда удавалось обучать ему школьников 6-7 класса. Задача вычисления значений n! для больших n возникла еще в средние века. Решена Д. Стирлингом (1692-1770). При решении прикладных задач достаточно применения приближенной формулы Стирлинга n
⎛n⎞ (7) n!= 2πn ⎜ ⎟ , ⎝e⎠ где e ≈ 2.718. Формально формула (7) справедлива только для очень больших значений числа n, т. е. при n→∞. Однако, даже при относительно небольших n применением формулы (7) можно найти вполне удовлетворительные результаты. Например, уже при n = 10 расчет значения 10! применением (7) приводит к ошибке меньшей 1%, при n = 50 меньшей 0.1%. В компьютерных программах для расчета значений n! при больших n применяется уточненная формула Стирлинга. Такой расчет приводит к еще меньшей ошибке. Применение формулы (6) позволяет найти решение задач оценки наркоситуации далеко не только в рамках рассмотренных в примерах случаях. В целях демонстрации возможностей применения формулы (6) изменим несколько требования, изложенные в примере 4.7.
54
Пример 4.8. В учреждении содержатся 1000 человек. 10 из них наркоманы. В целях решения задачи оценки наркоситуации из 1000 человек выбрали наугад 100 человек и провели их обследование. Какова вероятность того, что 9 наркоманов из 10 попадут в обследуемую группу? Решение. В этом случае значения величин, подставляемых в формулу (6) будут соответственно равны: N = 1000, n = 10, m = 100, k = 9. Следовательно, p=
-k C kn ⋅ C m N -n
Cm N
=
9 100 −9 С10 ⋅ С1000 −10 10 С100
≈ 6.5 ⋅ 10 −9.
Читателю предлагается самостоятельно выполнить вычисления в напечатанной выше формуле. В целях освоения применения формулы (6) в условиях примера 4.8 найдем вероятность того, что в обследуемую группу попадут не 9, а 8 наркоманов. Читателю предлагается самостоятельно выполнить вычисления. Ответ: искомая вероятность приближенно равна 2.858 ⋅ 10-7. Замечание 4.5. В целях удобства применения компьютера формула (6) после очевидных алгебраических преобразований может быть записана как
p=
m!n!( N − m )!( N − n )! . k! N !(m − k )!(n − k )!( N + k − m − n )!
(6*)
Вычисления применением формулы (6*) дают те же результаты что и вычисления, выполненные применением формулы (6). Формулу (6 5* 0) рекомендуется записать как подпрограмму для дальнейшего использования, дав ей мнемонически удобное имя. Например, NARKSIT. MTH. В целях помощи читателю в приложении 1 помещена распечатка файла NARKSIT. MTH, которым пользовался автор при написании пособия. Обратите внимание на ряд найденных значений вероятности: 6.57163 · 10-11, 6.5 · 10-9, 2.858 · 10-7. Как видите, с уменьшением числа наркоманов, случайно попавших в обследуемую группу, вероятность растет. Рекомендуем самостоятельно выполнить вычисление для числа k наркоманов, случайно попавших в обследуемую группу k = 7, 6, 5, 4, 3, 2, 1. Ответим на "крамольный" для экспертов вопрос: какова вероятность того, что в отобранную из 1000 человек группу из 100 человек не попадет ни одного наркомана, т. е. решим задачу при k = 0. Применив формулу (6) и выполнив вычисления, находим, что вероятность того, что в исследуемую группу не попадет ни одного наркомана, приблизительно равна 0.347, т. е.,
55
говоря словами экспертов, "почти 35%". Самое большое значение из всех вычисленных нами вероятностей! Избегнув громоздких математических выкладок в рамках рассмотренных примеров, мы нашли весьма интересный результат: с вероятностью почти 1 можно утверждать, что если в каком-то коллективе присутствуют наркоманы, то все они никогда не попадут в исследуемую экспертом случайную выборку. Подводя итог, сообщим читателю о том, что путем относительно несложных рассуждений и вычислений мы приблизились к возможности понимания одного из ключевых законов теории вероятностей и математической статистики - закона распределения Я. Бернулли, который можно успешно использовать при решении задачи оценки наркоситуации. ЗАДАЧИ К §4
Задача 4.1. а). В школе a учащихся употребляют наркотики и b учащихся не употребляют. Найти вероятность того, что два случайно опрошенных учащихся школы окажутся наркоманами. Решение. Обозначим через В событие, состоящее в том, что оба случайно опрошенных учащихся школы окажутся наркоманами. Вычислим количество элементов n, входящих в полную группу событий. n = Ca2+ b . Вычислим количество случаев m, благоприятных событию B. m = Ca2 . Следовательно, вероятность P(B), т. е. вероятность события B заключающегося в том, что оба случайно опрошенных учащихся школы наркоманы можно вычислить, воспользовавшись формулой Ca2 P( B) = 2 . Ca +b б) Применим найденный результат к оценке результативности экспертных оценок, доводимых до сведения администрации школы учащимися школы. Пусть в школе 1000 учеников и из них 300 употребляют наркотики. Кроме того, пусть в той же школе есть 100 учащихся, по их утверждению, не употребляющих наркотики, но знающих тех, кто употребляет и готовых добровольно сотрудничать с администрацией, своевременно и точно информируя ее о действиях учащихся, наркотики употребляющих.
56
Какова вероятность того, что два случайно вызванных на беседу администрацией учащихся поделятся информацией о наркоситуации в школе?
P( B) =
2 C100 2 C1000
=
4950 = 0.01. 4.995 ⋅ 105
Нетрудно заметить, что попытка сделать объективный вывод о наркоситуации в школе в целом исходя из заявлений отдельных учащихся, добровольно сотрудничающих с администрацией, сомнительна. Задача 4.2. В рамках условий задачи 4.1.б найти, как будет изменяться вероятность события B заключающегося в том, что k случайно вызванных на беседу администрацией учащихся поделятся информацией о наркоситуации в школе? Решение. При k случайно вызванных учениках найденная при решении задачи 4.1.а) формула изменится на формулу Ck P( B) = ka . Ca +b Приняв во внимание условие задачи 4.1.б находим
P( B) =
k C100 k C1000
.
(*)
Вычислим значения P(B) при k = 1, 2, 3,...,100 обозначив их соответственно через P(1), P(2), ... , P(100). Применив формулу (*) находим, что P(1) = 0.1, P(2) = 0.01, P(3) ≈ 0.001, P(4) ≈ 10-4, ..., P(10) ≈ 7·10-11,..., P(50) ≈ 10-56,..., P(100) ≈ 1.6·10-140. Нетрудно заметить, что с увеличением числа k количества учащихся, желающих добровольно сотрудничать с администрацией школы в качестве экспертов в целях оценки наркоситуации, вероятность получения администрацией объективной информации быстро уменьшается. Читателю рекомендуется самостоятельно сделать вывод о том, способствуют ли увеличению эффективности борьбы с наркоманией "послушные учащиеся, "за заслуженное поощрение" своевременно и точно информирующие" администрацию школы о наркоситуации.
57
§5. ПЕРВЫЕ МОДЕЛИ ОЦЕНКИ СЛУЧАЙНЫХ СОБЫТИЙ 1. Краткая историческая справка.
Трудно сказать что-либо определенное о том, когда именно предпринимались самые первые попытки использования вероятностных оценок ситуаций. В книге [31,c.113] можно найти заявление о том, что известные науке первые попытки восходят к 2238 г. до н. э. и были осуществлены в Древнем Китае. Размышления о случайном (например, золотые правила игроков в азартные игры) были уже в древнейшие времена, но математические вычисления вероятностей появляются в письменных источниках начиная лишь с XV века. Хотя сегодня теория вероятностей имеет столько же общего с азартными играми, как и геометрия - с измерениями площадей при земляных работах, тем не менее, первые попытки создания математического аппарата теории вероятностей возникли из результатов изучения популярных азартных игр. Едва ли не первой книгой по теории вероятностей, дошедшей до наших дней, является книга «De Ludo Aleae» Д. Кардано (1501-1576). Вместе с тем, первооткрывателем, пожалуй, первого закона в этой области знания является Я. Бернулли. Согласно сведениям, опубликованным в «Биографическом словаре деятелей в области математики» [32] значительный вклад в развитие естествознания внесли 9 ученых с фамилией Бернулли: Я. Бернулли (ум. в 1583 г.), Я. Бернулли (1654-1705), И. Бернулли (1667-1748), Н. Бернулли (1687-1759), Н. Бернулли (1695-1726), Д. Бернулли (1700-1782), И. Бернулли (1770-1790), И. Бернулли (1744-1807), Я. Бернулли (17591789). В нашем случае мы говорим о Я. Бернулли (1654-1705), написавшем известный труд «Ars conjectandi» («Искусство предположений»), фрагмент из которого изложен в §2 пособия. Известно, что во второй половине XVII в. модным гедонистическим времяпровождением считалось участие в азартных играх. Как и всегда в таких случаях кому-то из игроков везло больше, чем остальным. Как и сейчас некоторые из игроков обращались за разъяснением причин везения к образованной части населения. В то время развитый математический аппарат теории вероятностей еще не был создан и ученые, к которым обращались за разъяснением причин своих выигрышей и проигрышей высокопоставленные особы, оказывались в затруднительном положении: есть сведения, что тогда, как и сейчас, финансирование научных исследований определялось решениями чиновников. Возможно, это и
58
послужило одной из причин, по которой лучшие представители естествознания были вынуждены заняться изучением закономерностей, проявляющихся в азартных играх. 2. Формула Бернулли
Пожалуй, самой простой игрой, в которой в качестве судьи используется случай, является игра в угадывание, «орел» или «решка» выпадет при бросании монеты. Интуиция подсказывает, что исходы равновозможны, однако опыт показывает, что в некоторых случаях выпадение «орла» или «решки» следует одно за другим много раз подряд. На этом основании игроки часто уверены, что если правильная монета много раз выпадет «гербом», то вероятность выпадения «решки» возрастет. Следует отметить, что похожее суеверие имеет место и среди игроков на современных электронных игровых автоматах. Считается, что если на каком-то автомате долго не выпадал выигрыш, то вероятность выиграть на нем выросла. Плодами суеверия успешно пользуется обслуживающий автоматы технический персонал: информацию о том, на каком автомате долго не было выигрыша, тайно продают посетителям. Вернемся к опытам по угадыванию выпадения «орла» / «решки» при бросании монеты. Предположим, что правильная монета 10 раз подряд выпала «решкой». Есть ли основание считать, что вероятность выпадения «орла» возросла? Очевидно, что у монет нет памяти, поэтому они не знают, сколько раз они выпали «орлом» или «решкой». По этой причине шансы выпадения «орла» или «решки» при каждом бросании монеты равны ½, даже если монета уже выпала «орлом» тысячу раз подряд. Я. Бернулли во второй половине XVII в. доказал, что при очень большом числе бросаний «герб» выпадет приблизительно столько же раз, сколько и решка, но вся суть в том, что означает «приблизительно». Найденный Я. Бернулли результат впоследствии многократно проверялся. В учебном пособии [33,с.18] сказано о том, известный французский естествоиспытатель XVIII в. Ж. Бюффон бросил монету 4040 раз, К. Пирсон, в 20-х годах XX в. бросил монету 24000 раз. Ж. Бюффон пришел к заключению, что точечная оценка вероятности выпадения «герба» равна 0.50693, К. Пирсон, что точечная оценка вероятности равна 0.5005. Многие факты, подмеченные на этой частной схеме, впоследствии служили путеводной нитью при изучении более сложных схем. В частности, была дана современная формулировка независимости событий.
Определение 5.1. Событие В называется независимым от события А, если наступление события А не изменяет вероятности события В.
59
Схема независимых испытаний предложена описывается найденной им математической моделью.
Я. Бернулли
и
Предположим, что вероятность появления события известна точно из общефизических соображений. Например, при бросании монеты будем считать ее равной 0.5. Я. Бернулли доказал, что вероятность того, что при n испытаниях событие произойдет ровно m раз можно вычислить, применив формулу
Р( x = m ) = Cnm p m (1 − p )n − m =
n! p m (1 − p )n − m . m!(n − m )!
(8)
Символом P(x = m) в формуле (8) обозначена вероятность того, что событие произойдет ровно m раз. Закон, записанный аналитическим выражением (8), называется биномиальным законом распределения вероятностей. Пример 5.1. Монету бросили 10 раз. Найти вероятность того, что ровно 5 раз из 10 опытов выпадет «орел». Решение. Возможно, читателю покажется, что вероятность будет близка к 0.5. Сравним то, что кажется с тем, что имеет место на самом деле. В нашем случае общее количество опытов n = 10, количество выпадений «орла» - m = 5, вероятность выпадения «орла» - p = 0.5. Выполнив вычисления применением формулы (8) находим: Р ( x = 5) =
10! 0.55 (1 − 0.5)10−5 = 0.246. 5!(10 − 5)!
Ответ: вероятность того, что при 10 киданий монеты ровно 5 раз выпадет «орел» равно 0.246. В целях демонстрации возможностей применения формулы Бернулли рассмотрим задачу, на первый взгляд имеющую такой же результат решения, как в примере 5.1. Пример 5.2. Монету бросили 100 раз. Найти вероятность того, что ровно 50 раз из 100 опытов выпадет «орел». Решение. В рассматриваем случае n = 100, m = 50, p = 0.5. Применив формулу (8) находим: Р( x = 50 ) =
100! 0.550 (1 − 0.5)100 −50 = 0.0796. 50!(100 − 50 )!
Ответ: при 100 киданиях монеты вероятность выпадения «герба» ровно 50 раз равна 0.0796.
60
Обратим внимание на то, что вероятность выпадения «герба» ровно в половине случаев при 10 киданиях монеты не равна вероятности выпадения «герба» также в половине случаев при 100 киданиях монеты. Читателю рекомендуется самостоятельно, применением формулы (8), найти вероятность того, что при 1000 бросаниях монеты «герб» выпадет 500 раз (Ответ: P(x = 500) = 0.025). Формула Бернулли доказана еще в XVII в., правильна и может быть чрезвычайно полезной при решении некоторых задач оценки наркоситуации. Однако, знание правильной формулы не гарантирует правильности ее применения. Важно различать парадоксы и софизмы. Первые - это справедливые, хотя и неожиданные утверждения, в то время как вторые - ложные результаты, найденные с помощью рассуждений, формально кажущихся правильными. По мнению автора, и парадоксы, и софизмы очень интересны и поучительны. Примеры парадоксов из теории вероятностей и математической статистики изложены в книге [31]. В ней же даны их решения. Исследование софизмов в математике изложено в книге «Ошибки в математических рассуждениях» [36]. Приведем пример современного софизма, который в одном из учебников для вузов по психологии выдан за доказательство того, что каждый последующий год жизни человека короче предыдущего. Обоснуем, что с возрастом «годы жизни» не только кажутся, но и на самом деле становятся короче: известно, что каждый год вашей жизни - это ее 1/n часть, где n - число прожитых вами лет. Но n + 1 > n и 1/(n + 1) < 1/n. Следовательно, каждый следующий год вашей жизни короче предыдущего. Изложим придуманный автором пособия пример софизма неправильного применения формулы Бернулли при решении задачи оценки наркоситуации. Пример 5.3. Вернемся к примеру 4.7: в учреждении содержатся 1000 человек. 10 из них наркоманы. В целях решения задачи оценки наркоситуации из 1000 человек выбрали наугад 100 человек и провели их обследование. Какова вероятность того, что все 10 наркоманов попадут в обследуемую группу? Решение (неправильное). Известно, что в интересующей нас группе объемом 1000 человек 10 наркоманов. Таким образом, каждый человек из группы с какой-то вероятностью может оказаться либо наркоманом, либо не наркоманом. В нашем пространстве событий имеется 1000 событий. Т. к. мы имеем дело с полной группой событий, это дает нам право
61
вычислить вероятность того, что взятый наугад из группы человек наркоман. Количество благоприятных событий – m = 10, общее количество событий – n = 1000. Воспользовавшись формулой для вычисления вероятности p при наличии полной группы событий, находим: p = m/n = 10/1000 = 0.01. Найдем вероятность того, что при 100 испытаниях - случайном отборе из группы объемом 1000 человек группы объемом 100 человек все 10 наркоманов окажутся в отобранной группе объемом 100 чел. Воспользуемся формулой (8). В нашем случае n = 100, m = 10, p = 0.01. Выполнив вычисления, находим: Р( x = 10) =
100! 0.0110 (1 − 0.01)100−10 = 7 ⋅ 10 −8. 10!(100 − 10 )!
Ответ (неправильный!): p = 7 · 10-8. В примере 4.7 доказано, что искомая вероятность p = 6.57163 · 10-11. Найденная оценка наркоситуации – p = 7 · 10-8 отличается от результатов оценки той же наркоситуации – p = 6.57163 · 10-11 почти в 1000 раз! Предоставим читателю сделать самостоятельное обоснованное экспертное заключение о том, какова причина столь разных результатов оценки наркоситуации. Напомним, что правильное решение изложено в примере 4.7. Пример 5.4. Из российских источников, например из [6], публикующих результаты экспертных оценок наркоситуации в России известно, что только 0.1-1% наркотиков в России изымается из незаконного оборота правоохранительными органами. Найти вероятностную оценку успешности работы наркокурьера, если вероятность его задержания оценивается, как 0.001-0.01. Решение. Используем верхнюю границу оценки, заимствованную из [6]. Вычислим вероятность p успешного провоза наркотиков: p = 1 - 0.01 = 0.99. Применив формулу (8) вычислим вероятности того, что провоз наркотиков успешно осуществится в 1-м, 2-х, 3-х и т. д. случаях. Для таких случаев значения числа n в формуле (8) будут равны соответственно 1, 2, 3 и т. д. Значения числа m будут также равны 1, 2, 3 и т. д., то есть во всех случаях будет выполняться равенство n = m. Тогда формула (8) примет вид P(x = n = m) = pn , и значения вероятностей P(x = n =m) при n = 1,2,3... (с точностью до второго знака после запятой) соответственно будут равны 0.99, 0.98, 0.97 и т. д. Использовав нижнюю границу оценки p = 0.999, находим, что вероятности успешного провоза наркотиков при одной, двух, трех и т. д. попытках провоза будут равны
62
0.999, 0.998, 0.997 и т. д. В целях наглядности на рис. 3 помещены графики вероятностей успешного незаконного провоза наркотиков.
Рис.3. На рис. 3. По оси абсцисс - вероятности успешного незаконного провоза наркотиков, по оси ординат - количества случаев провоза. Нетрудно вычислить, что при вероятности успешного незаконного провоза p = 0.99 с вероятностью p = 0.9910 = 0.9 можно осуществить 10 успешных незаконных провозов. При оценке вероятности p = 0.999 нетрудно вычислить, что даже при 100 попытках незаконного провоза вероятность успеха превышает 0.9. Применение закона Бернулли (биномиального) на практике сопряжено с некоторой трудностью: для того, чтобы воспользоваться формулой (8) необходимо знание значения вероятности p. В некоторых случаях, например, при бросании монеты, значение вероятности p можно задать из общефизических соображений. Однако, такие случаи встречаются не так часто, как бы хотелось. В настоящее время известны методы математического моделирования, применение результатов которых позволяет оценить значение неизвестной вероятности p специальными
63
приемами обработки результатов опытов. Об этих приемах мы расскажем позже.
3. Закон Пуассона. Наркомания живет по законам военного времени Заимствуем из известного учебника [34] по теории вероятностей хрестоматийный пример. Опыт боевых действий во время Великой Отечественной войны (1941-1945) показал, что при выполнении некоторых условий самолет противника можно сбить из ручного пехотного оружия винтовки или автомата. Однако пулей самолет может быть подбит лишь при попадании в немногие уязвимые места - мотор, летчик, бензобаки и пр. Вероятность попадания в эти уязвимые места отдельным выстрелом весьма мала, но, как правило, по самолету вело огонь целое подразделение, и общее количество выстрелов, выпущенных по самолету, было значительным. В результате вероятность попадания хотя бы одной или двумя пулями имела значительную величину. Это обстоятельство было подмечено и чисто практически. Задолго до начала Второй Мировой войны С. Пуассоном (1781-1840) был найден вероятностный закон, применение результатов которого позволило найти научное объяснение (т. е. найти доказательную математическую модель) тому, что иногда, но все же обязательно, происходят почти невероятные явления. В целях изучения вероятностных моделей введем новое понятие. Определение 5.2. Пусть А - некоторое событие, которое может произойти с вероятностью P(A). Назовем подмножество всех событий, входящих в исследуемое множество событий, но не являющихся событием А противоположным событию А событием. Событие, противоположное событию А, будем обозначать, как событие Ā. Вероятность события Ā обозначим через P(Ā). Нетрудно заметить, что между вероятностью события и вероятностью противоположного события имеют место равенства: P(A) + P(Ā) = 1, P(Ā) = 1 - P(A).
(9)
Например, если вероятность события равна 0.2, то вероятность противоположного ему события равна 1 - 0.2 = 0.8. Вычисление вероятностей противоположных событий в некоторых случаях значительно упрощает решение прикладных задач. Вернемся к рассмотрению вероятностных законов, описывающих редкие явления.
64
Пример 5.5. Пусть вероятность p попадания в цель при каждом выстреле мала и равна 0.001. Найти вероятность попадания в цель одной и более пулями, если число выстрелов равно 5000. Решение. Первый способ. В нашем случае задачу можно решить, применив хорошо известную читателю формулу (8). Из условия задачи следует, что p = 0.001, n = 5000, m ≥ 01. Обозначим через P5000(0) вероятность события заключающегося в том, что ни одна из 5000 пуль не повредит самолет. Тогда противоположным событием будет событие, заключающееся в том, что либо одна, либо две, либо три и т. д. вплоть до всех 5000 пуль самолет подобьет. Нетрудно догадаться, что вероятность P5000(m ≥ 1) такого события описывается равенством P5000(m ≥ 1) = 1 - P5000(0).
(*)
Вычислим вероятность P5000(0). В этом случае величины, входящие в формулу (8) будут соответственно равны: n = 5000, m = 0, p = 0.001. Выполнив вычисления, находим, что P5000(0) = 0.007. Подставив найденное значение вероятности в равенство (*) находим, что P5000(m ≥ 1) = 1 - 0.007 = 0.993. Ответ. Вероятность того, что самолет будет сбит, равна 0.993. Как видите, читатель, вероятность весьма значительная. Однако тот же результат можно найти и применив закон, найденный Пуассоном.
Закон вероятности редких событий (закон Пуассона). Пусть вероятность p события чрезвычайно мала, т. е. p→0, а количество испытаний n чрезвычайно велико, т. е. n→∞. Обозначим через λ произведение λ = p·n. Тогда вероятность Pn(m) того, что при n испытаниях событие произойдет ровно m раз можно найти, воспользовавшись формулой
Pn (m) =
λm ⋅ e − λ m!
.
(10)
Замечание 5.1. В отличие от закона Бернулли, применение результатов которого гарантирует точное вычисление значения вероятности, применение закона Пуассона позволяет вычислить искомую вероятность приближенно. Однако ошибка, возникающая вследствие применения закона Пуассона вместо закона Бернулли, чрезвычайно мала и практически не влияет на точность результатов при решении прикладных задач. Что означают выражения «чрезвычайно мала» и «чрезвычайно велика» в общем случае решается отдельно для каждого конкретного случая. При решении
65
большинства прикладных задач достаточно точное значение искомой вероятности можно найти, если число p < 0.1, число n ≥ 100. Доказано, что во всех случаях применение закона Пуассона возможно при p10. Применим закон Пуассона для решения задачи, изложенной в примере 5.5. Решение. Второй способ. В нашем случае n = 5000, m = 0, p = 0.001. Откуда следует, что произведение λ = p · n = 0.001 · 5000=5. Подставив численные значения n = 5000, m = 0, λ = 5 в формулу (10) находим, что 5 0 ⋅ e −5 λm ⋅ e − λ = P5000 (0) = ≈ 0.0067. Pn (m) = 0! m! Применив формулу (9) для вычисления вероятности противоположного события находим, что P5000(m ≥ 1) = 1 - 0.0067 = 0.9933. Найденный результат практически совпадает с результатом, найденным применением закона (8) Бернулли. Вычисления, необходимые в случае применения закона Пуассона вместо закона Бернулли менее громоздки. В частности, при их использовании отпадает необходимость вычисления значений n! при больших n, создающие значительные вычислительные трудности. Например, необходимость применения формулы (7) Стирлинга. Если в рамках того же примера 5.5 заменить 5000 пуль на 5000 мелких, незначительных факторов, которые взятые по отдельности не могут причинить существенного вреда личности, а в качестве мишени не самолет, а человека, то, путем несложных рассуждений, применив закон Пуассона, нетрудно найти вероятностную математическую модель становления личности, для которой прием наркотиков сделался обязательным атрибутом социальной адекватности. Предлагаем читателю самостоятельно найти вероятностные математические модели, описывающие результаты воздействия на личность рекламы, конфессионально сектантской пропаганды, пропаганды гедонистического времяпрепровождения и т. п.
66
ЗАДАЧИ К §5
Задача 5.1. Предположим, что в некоторой силовой структуре, из многолетнего опыта работы N-ского подразделения известно, что в половине операций по задержанию дельцов наркомафии операции заканчивались успешно. Предположим, что в течение некоторого времени подразделение провело 11 операций, из которых 6 оказались успешными. Будет ли правильным доклад руководству о том, что бойцы подразделения стали проводить операции по задержанию успешнее, чем раньше? Решение. В нашем случае имеем схему независимых испытаний Бернулли. Значения величин, входящих в формулу (8), соответственно равны: n = 11, m = 6, p = 0.5. Подставив значения чисел n, p и m = 0, 1 , 2, 3,...,11 - количеств успешно проведенных задержаний в формулу (8), найдем вероятности того, что успех будет достигнут ни в одной, в одной, в двух и т. д., во всех 11 операциях. Выполнив вычисления, например применением подпрограммы NARKSIT. MTH или с помощью инженерного микрокалькулятора находим, что P(0) = 4.9 · 10-4, P(1) = 0.005, P(2) = 0.027, P(3) = 0.08, P(4) = 0.16, P(5) = 0.226, P(6) = 0.226, P(7) = 0.16, P(8) = 0.08, P(9) = 0.027, P(10) = 0.005, P(11) = 4.9 · 10-4. Найденный результат доказывает, что вероятность P(5) = 0.226 успешной операции по задержанию дельцов наркомафии в 5 случаях из 11 равна вероятности P(6) = 0.226 успешного задержания в 6 случаях из 11. Поэтому вывод о том, что бойцы подразделения стали работать успешнее, преждевременен, научно не обоснован и дезинформирует руководство силовой структуры. Задача 5.2. Начертить график, с помощью которого можно визуально проиллюстрировать изменение вероятности успешного задержания в зависимости от числа операций в задаче 5.1. Решение. Обозначив на плоскости точками координаты количеств успешных задержаний и соответствующих им вычисленных в решении задачи 5.1 вероятностей, соединим обозначенные точки кривой. Найденный график помещен на рис. 4.
67
Рис.4. На рис.4: по оси абсцисс - количества успешных задержаний, по оси ординат - вероятность успешного задержания. Задача 5.3. Рассчитана больше на проверку интуиции, чем на знания. Как вы думаете, чему равна площадь под кривой на рис.4? Ответ. Площадь под кривой равна 1. Задача 5.4. Ромео не употребляет наркотики. Однако в компании друзей Джульетты принято употреблять наркотики т. к. им известно, что многие модные музыканты, художники и диск-жокеи наркотики употребляют. Пусть вероятность того, что ради любимой Джульетты Ромео сменит свои убеждения и начнет употреблять наркотики, очень мала и равна 0.01. Какова вероятность того, что в течение года, общаясь с Джульеттой и ее друзьями, Ромео начнет принимать наркотики? Решение. Вероятность того, что Ромео начнет принимать наркотики, мала – p = 0.01, но число дней в году велико – n = 365. Пусть воспитанный в благополучной семье феодалов Ромео морально устойчив и вероятность того, что его антинаркотические убеждения пошатнутся, не изменится в зависимости от внешних обстоятельств. Таким образом, общение Ромео с наркоманами есть независимые испытания моральной устойчивости Ромео.
68
Следовательно, применима формула (10) Пуассона. Вычислим значение характеристики λ. λ = np = 365 · 0.01 = 3.65. Обозначим через P(0) вероятность события состоящего в том, что Ромео ни разу не примет наркотики. Для такого события значение числа m - количества раз, которое Ромео примет наркотики, равно нулю. Применив формулу (10) находим, что 3.650 ⋅ 2.718 −3.65 P(0) = = 0.028. 0! Вычислим вероятность противоположного события - «Ромео начнет принимать наркотики». 1 - 0.026 = 0.974. Ответ. Вероятность того, что Ромео начнет принимать наркотики, равна 0.974. Задача 5.5. Существует народная мудрость: «Зануда - это тот, кому легче уступить, чем доказать, что ты с ним не согласен». Какой математической моделью можно описать воздействие зануды на принятие решений его оппонентом? Ответ. Моделью Пуассона. Задача 5.6. Найти вероятность того, что подброшенная монета 1, 2, 3,...,n раз упадет «гербом» вверх. Решение. Вероятность выпадения «герба» не меняется от испытания к испытанию. Следовательно, мы имеем случай независимых испытаний, для которого применима формула (8) Бернулли. Известно, что вероятность p = 0.5 - вероятность выпадения «герба» при одном испытании. Известно, что общее число испытаний n. При этом в каждом из испытаний должен выпасть «герб». Следовательно, в нашем случае n = m - числу выпадений «герба». Подставив в формулу (8) значение m = n и выполнив алгебраические преобразования, находим, что Pn(n) - вероятность того, что при n испытаниях монета выпадет «гербом» n раз подряд, вычисляется по формуле Pn(n)=2-n. Выполнив вычисления, находим, что при n = 1, P1(1) = 2-1= 0.5, при n = 2, P2(2) = 2-2 = 0.25, при n = 3, P3(3) = 2-3 = 0.125. Продолжая вычисления, нетрудно найти, что монета, брошенная 10 раз, может выпасть десять раз подряд «гербом» с вероятностью P10(10) = 2-10 = 9.77·10-4. Найденный результат может быть применен к оценке вероятности правдивых ответов наркомана на вопросы эксперта. Известно и напечатано, например, в «Справочнике по психиатрии» [5], что: «...лживость наркоманов не знает границ». Предположим, что эксперту повезло, и он
69
беседует с «кристально честным» наркоманом. Пусть этот наркоман лжет всего в половине случаев. Тогда вероятность того, что наркоман ответил на 10 вопросов эксперта правдиво или правдиво заполнил анкету, состоящую всего из 10 вопросов, равна 9.77·10-4, т. е. чуть больше одной тысячной. Преобразовав формулу (8) для произвольного значения вероятности p, входящей в качестве параметра в (8), находим, что Pn(n) = pn. Например, если вероятность p того, что наркоман даст правдивый ответ на вопрос эксперта p = 0.1, то вероятность P10(10) того, что наркоман правдиво заполнит анкету из 10 вопросов P10(10) = 0.110 = 10-10, т. е. практически равна нулю. Такова оценка вероятности правильности результатов экспертных оценок.
70
§6. О СФЕРЕ ПРИМЕНИМОСТИ ЗАКОНА НОРМАЛЬНОГО РАСПРЕДЕЛЕНИЯ ПРИ ОЦЕНКЕ НАРКОСИТУАЦИИ Вероятность, основанная на ежедневном опыте или преувеличенная страхом и надеждою, поражает нас более, чем вероятность высшая, но являющаяся простым результатом исчисления. П. Лаплас 1. Краткая историческая справка
Замечено, что некоторые из случайных явлений происходят значительно чаще других, некоторые - реже, а некоторые - совсем редко. В силу исторических курьезов такая закономерность появления многих случайных событий была признана за некую норму. Поэтому, закон, описывающий вероятности их появления, был назван законом нормального распределения вероятностей. Термин "нормальное распределение" появился в естествознании относительно недавно - введен в XX веке К. Пирсоном (1857-1936). Считается что первым, кто нашел и начал использовать аналитическое выражение (формулу) закона нормального распределения был английский математик А. Муавр (1667-1754). Позже немецкий математик К. Гаусс (1777-1855) доказал и опубликовал в работе "Теория комбинации наблюдений, подверженных наименьшим ошибкам" [37] результаты, применение которых в отдельных случаях позволяет судить о величинах по их средним значениям. В связи с этим закон нормального распределения называют иногда законом Гаусса. Решения некоторых задач о границах применимости нормального закона найдены французским математиком П. Лапласом (1749-1827) и опубликованы в [45]. Поэтому одно из аналитических выражений, описывающих часто применяемый частный случай нормального закона называют функцией Лапласа. В дореволюционной России сочинения по теории вероятностей ведущих ученых Западной Европы многократно издавались в русских переводах. Например, был издан перевод книги П. Лапласа "Опыт философии теории вероятностей" [47]. Замечание 6.1. Самая старинная из книг по теории вероятностей, которую удалось найти и прочесть автору пособия - это монография
71
русского математика В.Я. Буняковского математической теории вероятностей" [46].
(1804-1889)
"Основания
Значительный вклад в исследования о применимости нормального закона внес основатель русской математической школы П.Л. Чебышев (1821-1894). Обобщением результатов Бернулли. Муавра, Гаусса, Лапласа и Чебышева служит центральная предельная теорема, доказанная русским математиком А.М. Ляпуновым (1857-1918) и опубликованная в 1899-1900 годах в работах "Об одной теореме теории вероятностей" и "Новая форма теоремы о пределе вероятности" [38]. По мнению автора, наиболее глубокое обобщение результатов работ перечисленных авторов в настоящее время можно найти в работе русского математика В.И. Зубова (1930-2000) "Аппроксимация и интерполяция функций в целом в равномерной метрике", опубликованной в книге [39]. В настоящее время результаты работ В.И. Зубова по интерполяции и аппроксимации вероятностных распределений развиваются его последователями и учениками. Например, в работах [40], [41], [42] и др. В целях сообщения о новых результатах публикуются новые работы [43], проводятся научные конференции. 2. Случайные величины
Приведем определения некоторых понятий, полезных для дальнейшего изложения. Определение 6.1. Под случайной величиной будем понимать переменную величину, принимающую то или иное значение в зависимости от исхода испытания. Случайные величины принято обозначать буквами греческого или латинского алфавита. Определение 6.2. Дискретной (прерывной) называют случайную величину, принимающую отдельные, изолированные возможные значения с определенными вероятностями. Число возможных значений случайной величины может быть конечным или бесконечным. Определение 6.3. Непрерывной называют случайную величину, которая может принимать все значения из некоторого конечного или бесконечного промежутка. Число значений непрерывной случайной величины не только бесконечно, но и несчетно. Замечание 6.2. Настоящие определения дискретной и непрерывной случайных величин не являются строгими в смысле выполнения требований, предъявляемых в современном естествознании к
72
определениям. Строгие определения заинтересованный читатель может найти в энциклопедии [44] и др. специальных источниках. Хрестоматийным примером дискретной случайной величины является величина с численным значением равным числу, написанному на грани кубика и случайно выпавшему при его бросании. Очевидно, что любому значению этой дискретной случайной величины соответствует вероятность 1/6. Примером дискретной случайной величины может служить число лиц, употребляющих наркотики и случайно попавших в обследуемую группу. Примером непрерывной случайной величины является температура приземного слоя окружающего воздуха: с одной стороны, каждое значение температуры может появиться с той, или иной вероятностью. С другой мы никогда не сможем измерить точно значение температуры, т. к. точность нашего измерения всегда будет ограничена точностью прибора, в данном случае термометра. Например, если точность термометра ±0.10 С, то температура 20.20 С и температура 20.2010 С будут для нас неразличимы. Большинство физических величин являются величинами непрерывными: длина, масса, температура, давление, яркость света и т. д. В наиболее полной мере случайные величины описываются законами распределения, которые называются функциями распределения и характеристическими функциями и изучаются в специальных дисциплинах. Замечание 6.3. Заинтересованный читатель, в зависимости от уровня своей естественнонаучной подготовки, может ознакомиться с методами нахождения и применения законов распределения, воспользовавшись учебниками разной сложности. По мнению автора, лиц со средним образованием, а также тех, кто не изучал математику в вузе, вполне удовлетворит учебник для средних специальных учебных заведений [28], имеющих начальное представление о математическом аппарате современной науки в рамках дисциплины "Высшая математика" - учебное пособие [29]. Для лиц с высшим техническим и университетским образованием можно рекомендовать учебник [34], пособия [48], [49] и др. 3. Об иллюзиях в оценке вероятностей
Почти все современные методы поиска закономерностей, применяемые при статистической обработке результатов наблюдений, в основе своей базируются на предположении о том, что найденные экспертами значения результатов опытов подчинены закону нормального распределения. Не вдаваясь пока в подробности того, какая именно случайная величина называется подчиненной нормальному закону и
73
забегая немного вперед, сообщим читателю прискорбную весть - на самом деле, обрабатывая результаты наблюдений, мы практически никогда не сталкиваемся с величинами, распределенными по нормальному закону. Однако формулы, которые принято применять при статистической обработке результатов экспериментов, выведены и доказаны только при условии, что исследуемое явление есть проявление нормальных законов. Поэтому, даже и при правильных результатах арифметических вычислений, эксперты вынуждены мириться с найденными таким способом результатами, весьма далекими от истинных значений оценок и являющихся по сути софизмами. О возможности появления ошибок такого рода в естествознании, в частности, среди медицинских и общественнозначимых оценок, предупреждал еще в начале XIX в. П. Лаплас. Замечание 6.4. В целях выполнения требований к точности результатов, предъявляемых в современной доказательной медицине и регламентированных Государственными стандартами России, в настоящем пособии излагаются методы оценки наркоситуации, свободные от принятия гипотезы о том, что результаты наших наблюдений и оценок непременно должны подчиняться нормальному закону. Напечатанный выше заголовок "Об иллюзиях в оценке вероятностей" заимствован автором пособия из книги П. Лапласа "Опыт философии теории вероятностей", вышедшей в Париже в 1814 г. В 1908 г. в России издан ее перевод [47]. По мнению автора, высказанные П. Лапласом в начале XIX в. замечания столь не утратили актуальности и сегодня, что вряд ли можно лучше начать изложение, чем переписав фрагмент из признанной в настоящее время классической книги [47] П. Лапласа. /Начало фрагмента./ ... Наши страсти, наши предрассудки и господствующие взгляды, преувеличивая благоприятствующие им вероятности и уменьшая противоположные, являются обильными источниками опасных иллюзий. Настоящее зло и причина, порождающая его, действуют на нас гораздо сильнее, чем воспоминания о зле, причиненном противоположной причиной; оно мешает нам справедливо оценить недостатки того и другого и вероятность тех средств, которые могли бы предохранить нас от них. Это и толкает поочередно к деспотизму и анархии народы, вышедшие из состояния покоя, к которому они и возвращаются всегда лишь после долгих и жестоких волнений. ... Одна из больших заслуг исчисления вероятностей - та, что оно учит не доверять первым впечатлениям. Так как в тех случаях, когда можно их
74
подвергнуть исчислению, оказывается, что они часто обманывают, то отсюда должно заключить, что и в других случаях следует на них полагаться лишь с крайней осмотрительностью. ... Существует при оценке вероятностей один ряд иллюзий, который, завися специально от законов устройства ума, требует для того, чтобы оградить себя от них, глубокого испытания этих законов. Желание проникнуть в будущее и отношение некоторых замечательных событий к предсказаниям астрологов, гадателей и жрецов, к предчувствиям и снам, к числам и дням, слывущим счастливыми или несчастливыми, породили массу предрассудков, еще и теперь очень распространенных. Совсем не думают о большом числе несовпадений, которые не произвели никакого впечатления или остались неизвестными; между тем как необходимо знать их, чтобы оценить вероятность причин, которым приписывают совпадения. Это знание без сомнения подтвердило бы то, что диктует нам разум относительно этих предрассудков. ... Все эти предрассудки и страх, внушаемый ими, зависят от физиологических причин, которые продолжают действовать и после того, как разум нас вывел из заблуждения. /Конец фрагмента./ Следуя рекомендациям П. Лапласа, углубим наше знание о том, как и какими методами, а также с какой достоверностью мы можем судить о значениях вероятности тех, или иных событий. Некоторое визуальное представление об исследуемой случайной величине можно получить, взглянув на ее гистограмму. Разъясним это понятие. С этой целью изложим необходимые определения. Определение 6.4. Множество всех возможных значений случайной величины называется генеральной совокупностью значений случайной величины или генеральной совокупностью. Определение 6.5. Выборочной совокупностью (выборкой) значений случайной величины называется множество, состоящее из случайно отобранных значений случайной величины. Как правило, мы не имеем в наличии генеральной совокупности значений случайной величины. Например, мы не знаем точно и вряд ли можем знать всех наркоманов и не наркоманов России. Выполняя исследование наркоситуации, мы почти всегда сталкиваемся с обследованием ограниченного контингента лиц. Например, ограничиваемся обследованием нескольких школ, вузов, дискотек, мест лишения свободы и т. д. Такое обследование всегда является выборочным,
75
а попавшие в него объекты - случайно отобранными. Вместе с тем, наша задача заключается в том, чтобы по результатам выборочного обследования сделать наиболее адекватные заключения о наркоситуации в целом. Для того, чтобы по данным выборки можно было достаточно уверенно судить об интересующем нас признаке генеральной совокупности, необходимо, чтобы объекты выборки правильно ее представляли. Другими словами, выборка должна правильно представлять пропорции генеральной совокупности. Такое требование к свойствам выборки называется требованием репрезентативности (представительности) выборки. При нахождении вероятностей событий используются понятия "выборка с возвращением" и "выборка без возвращения". Предположим, наш опыт состоит в вытаскивании наугад карты из колоды, состоящей из 36 карт. Очевидно, что т. к. в колоде 36 карт и из них 4 "туза", то мы имеем дело с полной группой событий, состоящей из 36 возможных событий, 4 из которых благоприятные. Таким образом, m = 4 - число благоприятных исходов, n = 36 - общее возможное число исходов и вероятность p вытащить "туза" мы вправе вычислить, как p = m/n = 4/36 = 1/9. Но можно ли из колоды карт, в которой всего 4 "туза" вытащить 5 "тузов"? Оказывается, можно. Для этого, после вытаскивания любой случайной карты, ее нужно возвратить в колоду. В таком и только в таком случае вероятность вытаскивания "туза" всегда будет оставаться постоянной и равной 1/9. Очевидно, что при таких условиях опыта "туз" можно вытащить и не только 5, но любое большее количество раз. Определение 6.6. Испытание, при котором извлеченный элемент после испытания возвращается в совокупность, называется испытанием, выполненным с использованием повторной выборки (выборки с возвращением). В противном случае мы имеем дело с выборкой без возвращения. Очевидно, что при выборке с возвращением вероятность исследуемого события не меняется. Например, сколько бы раз мы не вытаскивали произвольную карту из колоды, но если перед вытаскиванием следующей карты возвратим предыдущую в колоду снова, вероятность вытащить "туз" будет всегда постоянной и равной 1/9. Замечание 6.5. Только при выполнении условий опыта "выборка с возвращением" применение формулы Бернулли (8) легитимно. В противном случае, применение формулы (8) недопустимо, т. к. неизбежно приведет к ошибке. Случай ошибочного применения формулы Бернулли,
76
повлекший ошибку в вычислении значения вероятности, изложен в неправильном решении примера 5.3. Одним из средств визуализации результатов выборочного обследования является гистограмма. В целях доступности объяснения понятия "гистограмма" начнем с примера ее нахождения. В нашем распоряжении имеется база данных наблюдений за погодой в Санкт-Петербурге (СПб) с 1865 г. В приложении 2 пособия напечатаны результаты измерений среднесуточных температур приземного слоя окружающего воздуха в СПб за 10 января с 1865 г. Замечание 6.6. Те же данные температур применены при написании книги "Математические основы экологии" [50]. Из таблицы приложения 2 нетрудно увидеть, что вопреки распространенному мнению о том, что самые низкие зимние температуры в СПб (Ленинграде) были в годы гитлеровской блокады, самая назкая среднесуточная температура за 10 января в СПб была в 1987 г. и равнялась -33.6 50 0 С. Самая высокая - в 1971 г. и равнялась +3.8 50 0 С. Все остальные зарегистрированные значения среднесуточных температур находятся в интервале [-33.6, +3.8]. Определение 6.7. Назовем разбросом (размахом варьирования) выборочных значений случайной величины величину R, определяемую через аналитическое выражение R = xmax - xmin,
(11)
где xmax - наибольнее численное значение, xmin - наименьшее численное значение случайной величины из выборки ее значений. Размах является простейшей характеристикой рассеяния случайной величины. Для нахождения гистограммы величину размаха разбивают на несколько частичных интервалов длиной h и находят, сколько значений из выборки оказалось в каждом частичном интервале. В целях удобства перед нахождением гистограммы рекомендуется все имеющиеся выборочные значения случайной величины расположить в порядке неубывания. Определение 6.8. Упорядочивание выборки (невозрастанию) называется ранжированием (невозрастанию).
по по
неубыванию неубыванию
77
Пример 6.1. Дана выборка: 3, 3, 1, 9, 9, 9, 10, 7. Ранжировать ее по неубыванию и по невозрастанию и найти значение разброса. Решение. Применив определение ранжирования, находим, что ранжированная по неубыванию выборка будет 1, 3, 3, 7, 9, 9, 9, 10 . По невозрастанию – 10, 9, 9, 9, 7, 3, 3, 1. В рассматриваемой выборке xmax = 10, xmin = 1. Применив формулу (11) находим, что значение разброса равно R = 10 - 1 = 9. Элементы ранжированной выборки принято нумеровать. Например, первому элементу ранжированной по неубыванию выборки из примера 6.1 присвоим номер 1, второму - 2 и т.д. В общем виде, если ранжированная выборка содержит n элементов, то ее можно записать, как x1, x2, x3,..., xn. Вернемся к описанию процесса нахождения гистограммы. Пусть мы выбрали какую-либо длину частичных интервалов h, не превышающую значения разброса R и разбили весь интервал значений случайной величины на частичные интервалы h1, h2, h3 и т. д. Обозначим через ni - количество значений случайной величины, попавших в i-й интервал. Определение 6.9. Гистограммой будем называть ступенчатую фигуру, состоящую из прямоугольников, основаниями которых служат частичные отрезки длиной h и высоты которых равны отношению ni/n. Таким образом, если принять h = R, мы получим гистограмму, состоящую из одного прямоугольника, если принять за h = R/2 гистограмма будет состоять из 2-х прямоугольников, h = R/3 - из трех прямоугольников и т. д. Пример 6.2. Найти гистограммы значений среднесуточных температур приземного слоя окружающего воздуха в СПб за 10 января, состоящие из двух, трех, семи и десяти прямоугольников. Решение. Вычислим значение разброса температур. Воспользовавшись формулой (11) и значениями температур из приложения 2 находим: R = (+3.8) - (-33.6) = 37.4. Длины оснований прямоугольников для гистограмм, состоящих из двух, трех, семи и десяти прямоугольников будут соответственно равны: 37.4/2=18.7, 37.4/3=12.467, 37.4/7=5.34, 37.4/10=3.74. Высоты найденных прямоугольников нетрудно вычислить, воспользовавшись значениями температур, помещенными в таблице приложения 2 и сосчитав, сколько значений температур попало в каждый интервал, а затем поделив эти числа значений на n = 132 - объем выборки. Найденные гистограммы помещены на рис.5, 6, 7, 8.
78
Рис.5. На рис.5: гистограмма из двух столбцов.
79
Р Рис.6. На рис.6: гистограмма из трех столбцов. Нетрудно увидеть, что с увеличением количества столбцов гистограммы можно получить более детальное визуальное представление об элементах исследуемой выборки и их относительных количествах.
80
Рис.7. На рис.7: гистограмма из семи столбцов Замечание 6.7. В настоящее время процесс нахождения гистограмм полностью автоматизирован. На Российском рынке имеется огромное количество программных продуктов, применение которых сводит построение гистограммы к нажатию нескольких клавиш компьютера. К таким пакетам прикладных статистических программ относятся общеизвестные и общедоступные пакеты SPSS, STATISTICA, NCSS AND PASS и др. По вопросам применения пакетов издается постоянно обновляющаяся специальная литература. Примером такой литературы служит книга [51] и др..
81
Рис.8. На рис.8: гистограмма из десяти столбцов. К сожалению, прикладная ценность гистограммы незначительна. В некоторых изложениях можно найти заявления о том, что по форме гистограммы визуально можно оценить закон распределения изучаемой случайной величины. В частности утверждается, что если исследуемая гистограмма может быть "сглажена горкой", график которой является графиком функции − 1 y ( x) = e σ 2π
( x − а )2 2σ 2
,
(12)
где a и σ > 0 - некоторые постоянные числа, то исследуемая случайная величина распределена нормально. В целях иллюстрации такого заявления на рис.9 помещена гистограмма и "сглаживающая ее горка" функции y(x).
82
Рис.9. К сожалению, такое заявление не только не соответствует действительности, но и оказывает вредное влияние на достоверность предъявляемых научных результатов. Для решения задач о принадлежности исследуемых величин, численные значения которых являются результатами наших экспериментов к тому или иному закону распределения, в современной математической статистике применяются специальные критерии. Умение правильно пользоваться статистическими критериями требует от исследователя наличия высшего образования по специальности "Теория вероятностей и математическая статистика". Компетентный математик, подготовленный не по названной специальности, не склонен к заявлению о том, что он владеет аппаратом математической статистики в достаточном для решения научных задач объеме. Тем более заявления лиц, не имеющих математического образования, о том, что "ими выполнена статистическая проверка", звучат слишком торжественно.
83
Замечание 6.8. (Тем, кто не знаком с курсом математики в объеме технического вуза при чтении можно пропустить.) Нормально распределенной случайной величиной ξ называется величина, функция распределения F(x) которой задана аналитическим выражением x − (t − a ) 2 e 2σ
2
F ( x) =
1 σ 2π
∫
dt.
(12)
−∞
В целях соответствия результатов исследований требованиям к точности, предъявляемым в современном естествознании, В СССР и в России, правила использования статистических критериев и границы их применимости законодательно регламентированы Государственными стандартами. Проверку того, к какому именно закону распределения принадлежит исследуемая случайная величина, требуется выполнять, исходя из требований, изложенных в Государственном стандарте [52]. В частности, требования для проверки значений параметров a и σ нормально распределенных случайных величин изложены в Государственном стандарте [53]. В настоящее время Государственные стандарты [52], [53], в целях соответствия изложенным в них требованиям международных стандартов, модифицированы. В частности, модифицированные требования, содержание которых передано текстом, аутентичным международному стандарту, можно найти в документе [54] и в других Государственных документах. Теоретическое обоснование требований, регламентированных Государственными стандартами, заинтересованный читатель может найти в книге [55] и др. В целях ознакомления читателя с критериями, применение которых позволяет объективизировать наши представления о законах распределения, остановимся на самых простых в применении критериях. 4. Простейшие критерии согласия
Изложенные ниже критерии согласия не могут служить достаточным основанием для заключения о том, что найденные нами в результате экспериментов значения изучаемой случайной величины распределены нормально: современные требования, предъявляемые к результатам научных исследований и изложенные в Государственных стандартах значительно строже. Тем не менее, результаты проверки выборочных данных на соответствие нормальному закону распределения, выполненные применением самых простых критериев, могут пусть и поверхностно, но все же обоснованно указать направление дальнейших действий. Говоря
84
словами сыщиков: "Когда есть холодное тело, нужно сразу же искать по горячим следам". Пусть дана выборка значений результатов некоторого эксперимента или результатов измерений и пусть выборка ранжирована по неубыванию. Обозначим такую выборку через X = {x1, x2, x3, ..., xn},
(14)
где x1, x2, x3, ..., xn - какие-то числа, являющиеся результатами измерений исследуемой в опыте величины X, нижний цифровой индекс при каждом элементе выборки обозначает порядковый номер элемента в выборке, n объем выборки, т. е. число, соответствующее количеству элементов, содержащихся в выборке. Например, если n = 20, то это означает, что в выборке содержится 20 элементов x1,...x20 или, в другой форме записи, {xi}, I = 1,.,20, т. к. иногда выборку (14) записывают, как X = {xi}, i = 1,.,n. Вследствие того, что выборка (14) ранжирована по неубыванию, между элементами xi, i = 1,.,n имеет место соотношение x1 ≤ x2 ≤ x3 ≤ ... ≤ xn. Определение 6.10. Назовем точечной оценкой среднего арифметического число xср., вычисляемое применением формулы x1 + x2 + x3 + ... + xn 1 n (15) хср. = = ∑ xi . n n i =1 Например, если выборка X = {1,2,3}, то, применив формулу (15), находим, что
1+ 2 + 3 = 2. 3 Нетрудно догадаться, что число xср., во-первых, весьма приблизительно характеризует выборку, во вторых, в общем случае, не является числом постоянным. Так, если мы выполним какой-то еще один опыт, в результате которого обнаружим, что значение исследуемой нами случайной величины равно 4, то наша выборка станет выборкой X = {1, 2, 3, 4} со значением хср. =
xср. = (1+2+3+4)/4 = 2.5, которое уже по-другому характеризует исследуемую нами величину, т. к. 2.5 ≠ 2. Получается, что с каждым новым опытом мы можем вычислить новое значение числа xср., а значит каждый новый опыт изменит результат. Можно ли в таком случае сказать что-то определенное о значении xср.? И в сколь затруднительном положении оказывается государственный
85
чиновник, вынужденный принимать решение, опираясь на заявления экспертов о том, что "в среднем среди учащейся молодежи такой-то процент наркоманов"? В рамках теоретических рассуждений очевидно, что при каком-то большом увеличении объема n выборки число xср. будет стремиться к числу x* постоянному, т. е. 1 n lim ∑ xi = x * n →∞ n i =1 Однако сколь большим должно стать число n, чтобы выполнилось равенство xср.= x*? В широко распространенной литературе по экспертным оценкам наркоситуации в России автор не только ни разу не нашел ответа на этот вопрос, но и самого вопроса. Замечание 6.9. Единственным исключением оказался отчет о научноисследовательской работе [10], выполненный в Национальном институте здоровья. Очевидно, что знания значения числа xср. при оценке наркоситуации недостаточно. Нужно еще какое-то число, характеризующее все элементы выборки. Определение 6.11. Будем называть точечной оценкой выборочной дисперсии S2 число, вычисляемое применением формулы 1 n S 2 = ∑ xi − xср. 2 . (16) n i =1 Однако, число S2 обладает тем же недостатком, что и число xср. - при изменении объема выборки n оно будет изменяться.
(
)
Замечание 6.10. При выполнении некоторых расчетов в знаменателе дроби, стоящей в правой части выражения (16), вместо числа n применяют число n + 1. Такое изменение формулы (16) позволяет вычислить так называемую несмещенную точечную оценку дисперсии. Доказано, что несмещенная точечная оценка дисперсии несколько точнее характеризует свойства выборки, но, тем не менее, остается весьма приблизительной. Пример 6.3. Вычислим точечную оценку выборочной дисперсии для выборки X = {1, 2, 3}. Решение. Оценка xср. для выборки уже найдена: xср.= 2. Применив формулу (16) находим: S2 =
(
)
1 (1 − 2)2 + (2 − 2)2 + (3 − 2)2 = 2 . 3 3
86
При всех недостатках числа S2 оно все же позволяет в какой-то мере полнее охарактеризовать выборку. Например, если взять две выборки: X={1, 2, 3} и Y={2, 2, 2}, то выполнив вычисления нетрудно убедиться в том, что значение xср.= yср.= 2. Вместе с тем значение 1 S 2 = (2 − 2)2 + (2 − 2)2 + (2 − 2 )2 = 0. 3
(
)
т. е. Sx2 ≠ Sy2. Замечание 6.11. Нижними индексами у величин Sx2 и Sy2 обозначено то, что они характеризуют разные выборки, т. е. выборки X и Y. Подведем итог. Значения точечных оценок средних арифметических рассмотренных выборок X и Y равны, однако значения точечных оценок дисперсий не равны: Sx2 = 2/3, Sy2 = 0. Последнее в какой-то мере свидетельствует о том, что значения элементов выборки X отличны от значения xср.= 2 больше, чем значения элементов выборки Y от значения yср.= 2. Точечная оценка среднего арифметического случайной величины дает нам первое ориентировочное представление о ней. Однако гораздо чаще встречаются случаи, в которых наиболее важные для практических целей свойства случайной величины требуют более детального рассмотрения. Пример 6.4. В отряде специального назначения по пресечению незаконной деятельности наркодельцов два снайпера. Отряду предстоит серьезная операция, в которой необходимо участие квалифицированных снайперов, однако в силу оперативных особенностей операции задействован в операции по пресечению может быть только один снайпер. В целях оценки квалификации снайперов между ними провели небольшое экспресс-соревнование, в котором требовалось выяснить, какой из двух снайперов из трех выстрелов по мишени наберет большее число очков. Мишени были устроены так, что при стрельбе по ним за один выстрел можно было набрать 0 (промах), одно, два или три очка. Результаты экспресс-соревнования помещены в таблицу 1.
87
ТАБЛИЦА 1 РЕЗУЛЬТАТЫ СНАЙПЕРОВ № выстрела
Число очков снайпера 1
Число очков снайпера 2
1 2 3
3 0 3
2 2 2
Обозначим через xср. и yср. - точечные оценки среднего числа набранных очков снайпером 1 и снайпером 2 и вычислим их. xср = (1/3)(3+0+3) = 2, yср. = (1/3)(2+2+2) = 2. Приходим к заключению, что xср.= yср.= 2, т. е. сравнение значений точечных оценок средних не позволяет решить задачу о том, какой из снайперов является стрелком более квалифицированным. Кого же из снайперов выбрать для проведения ответственной операции по пресечению незаконной деятельности наркодельцов? Обозначим через Sx2 и Sy2 - точечные оценки дисперсий первого и второго снайперов. Выполнив вычисления, находим, что Sx2= (1/3)((3-2)2 + (0-2)2 + (3-2)2) = 6/3 = 2, Sy2= (1/3)((2-2)2 + (2-2)2 + (2-2)2) = 0, т. е. численные значения точечных оценок дисперсий снайперов разные: Sx2 ≠ Sy2, Sx2 > Sy2. Применение найденного результата - вычисленных значений точечных оценок дисперсий, предоставляет больше возможностей для решения задачи сравнения квалификации снайперов. Выполнив сравнение, приходим к заключению, что, несмотря на одинаковые средние показатели, квалификация снайперов разная. Результаты первого снайпера менее устойчивы, чем второго. Практически это означает то, что если к операции будет привлечен первый снайпер, то в результате проведения спецоперации наркодельцы, скорее всего, не предстанут перед судом - либо смогут скрыться, т. к. снайпер промахнется, либо будут уничтожены в результате очень точного попадания пули. Если же к выполнению спецоперации привлечь второго снайпера, то, скорее всего наркодельцы, после оказанной им квалифицированной медицинской помощи, предстанут перед судом, т. к. скорее всего, второй снайпер нанесет им тяжелые ранения, вследствие которых наркодельцы будут не в состоянии оказать сопротивление бойцам спецотряда.
88
Более точно и научно обоснованно оценить квалификацию снайперов можно, применив метод доверительных интервалов. С методом доверительных интервалов читатель ознакомится в последующих параграфах пособия. Несмотря на очевидную простоту вычислений, применение точечной оценки дисперсии при решении задач оценки наркоситуации может оказать существенную помощь. В частности, значение точечной оценки дисперсии может служить хоть и приблизительной, но мерой оценки устойчивости результатов наблюдений и экспериментов. Примеры применения оценки дисперсии при решении разных задач естествознания в научно-популярном изложении заинтересованный читатель может найти в книге "Элементарное введение в теорию вероятностей" [56]. Замечание 6.12. (Тем, кто не знаком с курсом математики в объеме технического вуза при чтении можно пропустить.) Примененное в пособии упрощенные определение дисперсии случайной величины не являются строгим в смысле выполнения требований, предъявляемых в современном естествознании к определениям. В целях полноты изложения напомним определение дисперсии. Дисперсией DX непрерывной случайной величины ξ называется центральный момент второго порядка, определяемый аналитическим выражением DX =
+∞
∫ (x − MX )
2
f ( x)dx.
−∞
где f(x) - плотность вероятности случайной величины, MX - начальный момент первого порядка, определяемый аналитическим выражением
MX =
+∞
∫x
f ( x)dx.
−∞
К сожалению, в многочисленных работах, написанных на основании заключений экспертов и претендующих на решение государственной задачи оценки наркоситуации, автору пособия не удалось найти примеров применения ни оценок дисперсии, ни других принятых в мировой науке и законодательно рекомендованных к применению характеристик. Своеобразными исключениями являются разве что многочисленные примеры применения противоречивых экспертных оценок среднего арифметического и процентных оценок. По мнению автора,
89
противоречивые экспертные оценки наркоситуации в России не могут быть использованы уполномоченными чиновниками государственного аппарата при решении задач управления и контроля. Очевидно, что названные задачи могут быть решены только при поручении решения задач оценки наркоситуации в России дипломированным государственными органами специалистам по математическому моделированию. В некоторых случаях при решении теоретических и прикладных задач применяется оценка S, называемая точечной оценкой среднеквадратического отклонения и определяемая аналитическим выражением
S = S2.
(17)
Случаи, в которых применяется оценка S, будут рассмотрены ниже. Продолжим изложение материала о простейших критериях согласия. Существуют критерии согласия, предназначенные для принятия или отклонения гипотез о законах распределения исследуемых случайных величин. Остановимся на критериях и методах их применения, предназначенных для проверки гипотезы о том, что исследуемая случайная величина распределена по нормальному закону. Напомним, для каких целей нужна проверка гипотезы о том, что найденные в результате выполнения экспериментов численные значения результатов измерений распределены по нормальному закону: имеющиеся в распоряжении исследователя аналитические выражения, предназначенные для нахождения вероятностных оценок, в большинстве случаев предназначены для обработки результатов измерений, распределенных по нормальному закону. Если же исследователь имеет в своем распоряжении результаты опытов и измерений, не распределенные по нормальному закону, то большинство формул, напечатанных в многочисленных пособиях и справочниках по статистической обработке результатов измерений неприменимы, так как их формальное применение приведет к ошибочным результатам. Образцы таких добросовестных заблуждений мы нередко находим в отчетах по научно-исследовательской работе, в которых статистическая обработка выполнена не специалистами по математическому моделированию, а врачами, физиологами, социологами и другими неспециалистами в этой области. Пожалуй, самым простым для применения критерием является критерий "трех сигм".
90
Критерий "трех сигм" Если доля результатов измерений, входящих в границы "трех сигм", составляет примерно 0.9973 от всех результатов измерений, то есть основания предполагать, что результаты измерений извлечены из генеральной совокупности численных значений нормально распределенной случайной величины. Покажем метод применения критерия "трех сигм" на примере. Пример 6.5. В приемный покой больницы №17 в СПб за сутки поступило 20 больных, вызвавших подозрение врачей о том, что эти больные находятся в состоянии алкогольного опьянения. Результаты последовавшего анализа крови этих больных подтвердили подозрение врачей. В таблице 2 расположены порядковые номера больных и количества промилле алкоголя, найденного в крови больного. ТАБЛИЦА 2 СОДЕРЖАНИЕ АЛКОГОЛЯ В КРОВИ В ПРОМИЛЛЕ № Содержание № Содержание больного алкоголя в больного алкоголя в крови крови 1 2 3 4 5 6 7
1.3 0.5 3 0.6 3 3.3 2
8 9 10 11 12 13 14
2.9 1.3 3.3 1.4 0.5 1 0.6
№ больного
Содержание алкоголя в крови
15 16 17 18 19 20
3.2 0.7 1.7 3.8 3.2 1.3
Замечание 6.13. В России в рамках медицины считается, что состояние человека можно квалифицировать, как состояние опьянения, начиная с концентрации алкоголя в крови, равной 0.5 промилле - "легкое опьянение". Известно, что по внешним признакам опьянения, содержанию алкоголя в крови близкому к двум промилле соответствуют признаки неустойчивой походки и нечеткой речи. Три промилле алкоголя в крови соответствуют состоянию крайне тяжелого опьянения и считаются смертельной дозой алкоголя для человека. Из рассказов врачей автору известно, что нередки случаи поступления больных с дозой алкоголя в крови, значительно превышающей смертельную дозу для человека. Своеобразным рекордом содержания алкоголя в крови, зарегистрированным в 17-й больнице
91
Санкт-Петербурга, было содержание алкоголя в крови, равное восьми промилле. Рекордсменом оказалось существо, внешним видом выдающее себя за молодую самку Homo sapiens. Проспавшись, существо совершило побег из больницы. Личность существа установить не удалось. Согласно показаниям свидетелей, видевших существо проснувшимся, существо способно вступать в речевой контакт, использовать нерегламентированные речевые слова и обороты, высказывать неуважение по отношению к государственным чиновникам России, а также осуществлять длинные монологи о правах человека. По сведениям, полученным от врачей 17-й городской больницы, существа с содержанием алкоголя в крови превышающем три промилле, склонны к аналогичному поведению. Применением критерия "трех сигм" сделать заключение о том, есть ли основание предполагать, что значения концентрации алкоголя в крови пациентов распределены нормально. Решение. Будем считать, что концентрация алкоголя в крови непрерывная случайная величина, которую мы обозначим через X, а количества алкоголя, выраженные в промилле есть численные значения этой случайной величины, которые мы обозначим через xi, i=1,...,20. В целях удобства расчетов ранжируем по неубыванию ряд выборочных значений концентрации алкоголя в крови. В результате получим неубывающий числовой ряд значений концентраций алкоголя в крови, состоящий из двадцати элементов: 0.5, 0.5, 0.6, 0.6, 0.7, 1, 1.3, 1.3, 1.3, 1.4, 1.7, 2, 2.9, 3, 3, 3.2, 3.2, 3.3, 3.3 3.8. В этом ряду первый элемент - x1 = 0.5, второй - x2 = 0.5, третий x3 = 0.6, ... , двадцатый - x20 = 3.8. Применив формулы (15) и (16), вычислим точечную оценку среднего арифметического xср. концентраций алкоголя в крови и точечную оценку дисперсии S2. Выполнив вычисления с точностью до сотых долей, находим, что: xср. = 1.93, S2 = 1.25, S = 1.12. Для применения критерия "трех сигм", численное значение характеристики S приравнивают величине, обозначаемой, как σ. В нашем случае, S= σ = 1.12. После этого, значение умножают на 3. В нашем случае 3·σ = 3·01.12 = 3.36. Затем, найденное значение "трех сигм" сначала отнимают, а потом прибавляют к значению xср.. Т. е. находят значения чисел xср. ± 3·σ. В нашем случае: xср.- 3·σ = 1.93 - 3.36 = −1.43, xср. + 3·σ = 1.93 + 3.36 = 5.29. Таким образом, интервал значений, вошедших в xср. ± 3 · σ есть интервал [−1.43, 5.29]. Из условий задачи известно и напечатано в табл.2, что наименьшее значение содержания алкоголя в
92
крови равно 0.5, наибольшее равно 3.8. Следовательно, в найденный нами интервал [-1.43, 5.29] вошли все имеющиеся в таблице 2 значения концентраций алкоголя в крови. Доля значений, которая могла не войти в интервал, равна 1 - 0.9973 = 0.0027, т. е. 20 · 0.0027 = 0.054 значения. 0.054 < 1, т. е. доля возможных значений не составляет и одного элемента выборки. Сформулируем окончательный результат: все элементы исследуемой выборки оказались принадлежащими интервалу xср. ± 3·σ, поэтому есть основание предполагать, что случайная величина, значения которой являются значениями исследуемой выборки, распределена по нормальному закону. Замечание 6.14. Результаты, найденные применением критерия "трех сигм", не являются доказательными. А именно: наличие основания предполагать, что в нашем случае исследуемая случайная величина распределена по нормальному закону, еще не доказывает, что величина действительно распределена по нормальному закону.
Расширение критерия "трех сигм" Одна и та же выборка, проверенная на нормальность закона распределения ее численных значений с помощью разных критериев, может оказаться и выборкой, которую можно считать извлеченной из генеральной совокупности численных значений нормально распределенной случайной величины и, наоборот, выборкой, извлеченной из генеральной совокупности численных значений случайной величины, не распределенной по нормальному закону. Таков, пожалуй, самый серьезный недостаток рассматриваемых нами простейших критериев согласия. Изложенное противоречие на самом деле является кажущимся противоречием: разные результаты, найденные при применении к одним и тем же выборочным данным разных критериев свидетельствуют о том, что результаты применения простейших критериев могут служить не больше, чем самой грубой ориентировкой при решении задачи нахождения закона распределения случайной величины. Однако совпадение результатов, найденных применением разных критериев, увеличивают уверенность в правильности принятой гипотезы о законе распределения случайной величины. Поэтому необходимо знание разных критериев согласия и умение их применять. Расширением критерия "трех сигм" является критерий "двух сигм" и критерий "одной сигмы".
93
Критерии "двух" и "одной сигм" Для того, чтобы можно было предположить, что исследуемая выборка есть выборка значений нормально распределенной случайной величины необходимо, чтобы доля выборки, приходящаяся на интервал значений выборочных данных xср. ± 2·σ была равна 0.9545 и доля выборки, приходящаяся на интервал значений выборочных данных xср. ± σ была равна 0.683. Пример 6.6. Использовав данные из таблицы 2 о содержании алкоголя в крови, применением критерия "двух и одной сигмы", сделать предварительное заключение о принадлежности выборочных данных к генеральной совокупности численных значений нормально распределенной случайной величины. Решение. Использовав из решения примера 6.5 знание о том, что xср.= 1.93, σ = 1.12, находим, что значения xср. ± 2·σ являются границами интервала [-0.31, +4.17]. В найденном интервале находятся все элементы исследуемой выборки; от xmin = 0.5 до xmax = 3.8, т. е. не доля выборки, равная 0.9545. Следовательно, оснований для принятии гипотезы о том, что исследуемая нами случайная величина является нормально распределенной, нет. Найденный результат противоречит применением критерия "трех сигм".
результату,
найденному
Найдем долю элементов выборки, приходящихся на интервал значений xср. + σ. Выполнив очевидные вычисления, находим, что; xср. – σ =1.931.12=0.81, xср. + σ = 1.93+1.12 = 3.05, т. е. искомый интервал значений [0.81, 3.05]. В этот интервал попадают 15 значений из 20 элементов выборки. 15/20 = 0.75, 0.75 ≠ 0.68. Следовательно, и на основании применения критерия "одной сигмы" нельзя считать, что исследуемая выборка есть выборка численных значений нормально распределенной случайной величины. Подведем итог. 1. Результаты применения критерия "трех сигм" свидетельствуют в пользу того, что исследуемая нами выборка есть выборка численных значений нормально распределенной случайной величины. 2. Результаты применения критерия "двух сигм" не свидетельствуют в пользу того, что исследуемая нами выборка есть выборка численных значений нормально распределенной случайной величины. 3. Результаты применения критерия "одной сигмы" не свидетельствуют в пользу того, что исследуемая нами выборка есть
94
выборка численных значений нормально распределенной случайной величины. Сформулируем окончательный результат применения критериев "трех, двух и одной сигм"; результаты применения указанных критериев не свидетельствуют в пользу того, что исследуемая нами выборка есть выборка численных значений нормально распределенной случайной величины. Вследствие того, что примененные критерии являются критериями предварительной оценки, найденный результат является предварительным результатом.
5. Дополнительные сведения о нормальном законе распределения В целях изучения критериев согласия, изложим некоторые дополнительные сведения о нормальном законе распределения непрерывной случайной величины. Определение 6.12. Будем называть непрерывную случайную величину величиной, распределенной по нормальному закону, если закон распределения случайной величины описывается аналитическим выражением (12) y ( x) =
1 e σ 2π
−
( x − a )2 2σ 2
.
(12)
Функцию y(x) в выражении (12) будем называть плотностью распределения нормально распределенной случайной величины. Изучим некоторые свойства функции (12). С этой целью на рис.10 помещена графическая интерпретация (график) функции (12) при значениях характеристик a = 0 и σ = 1.
95
Рис.10. На рис.10. По оси абсцисс - значения аргумента x, по оси ординат значения функции y(x) (12). Если в функции (12) значение параметра а оставить прежним – а = 0, а значения параметра σ изменять, придавая им значения σ = 1, σ = 0.7 и σ = 2, то нетрудно заметить, что увеличение параметра σ ведет к тому, что "горка" графика становится "более высокой и более крутой". Уменьшение параметра σ приводит к тому, что "горка" становится "более низкой и пологой". На рис. 11 помещена графическая интерпретация изменений функции (12) при постоянном значении параметра а = 0 и разных значениях параметра σ: σ = 0.7, σ = 1, σ = 2.
96
Рис.11. На рис.11. По оси ординат: верхняя кривая – а = 0, σ = 0.7, нижняя кривая – а = 0, σ = 2, средняя кривая – а = 0, σ = 1. По оси абсцисс - значения аргумента x. При изменении значений параметра а функции (12): с увеличением значения параметра а "горка" сдвигается вправо, при уменьшении значений параметра а "горка" сдвигается влево. На рис. 12 помещена графическая интерпретация функции (12) при разных значениях параметра а и одинаковых значениях параметра σ = 1.
97
Рис.12. На рис. 12. По оси ординат: левая "горка" - σ = 1, а = -1, средняя "горка" - σ = 1, а = 0, правая "горка" - σ = 1, а = 1. По оси абсцисс значения аргумента x. Доказано, что площадь под любой "горкой" графика функции (12) всегда равна 1, независимо от того, "крутая это горка" или "пологая". Иначе говоря, площадь фигуры, ограниченной осью абсцисс и кривой графика функции (12) всегда равна 1. Это свойство функции (12) позволило применять ее при решении задач исчисления вероятностей: известно, что вероятность p любого события A не может быть меньше 0 или больше 1. Следовательно, любое значение вероятности можно интерпретировать, как часть площади под кривой функции (12). Замечание 6.15. (Тем, кто не знаком с курсом математики в объеме технического вуза при чтении можно пропустить.) Указанное свойство площади под кривой функции (12) записывается, как x − (t − a ) 2 e 2σ
2
1 F ( x) = σ 2π
∫
−∞
dt ,
98 x − (t − a ) 2 e 2σ
2
1 σ 2π
∫
dt = 1.
−∞
Последнее равенство - условие нормировки. Для решения многих задач совсем не обязательно знать все возможные значения случайной величины и соответствующие им вероятности. Достаточно указать отдельные числовые параметры, которые позволяют в удобной, компактной форме отразить существенные особенности случайной величины. К таким числовым характеристикам относятся математическое ожидание, дисперсия, моменты разных порядков и т. д. Определим некоторые наиболее важные из характеристик. Определение 6.13. Математическим ожиданием MX случайной величины X называется сумма произведений всех возможных значений случайной величины на соответствующие вероятности появления этих значений, т. е. n
MX = ∑ xi pi .
(18)
i =1
Определение 6.14. Математическое ожидание квадрата отклонения случайной величины X от ее математического ожидания MX называют дисперсией случайной величины X и обозначают DX, т. е. DX = M(X - MX)2.
(19)
Определение 6.15. Среднеквадратическим отклонением случайной величины называется квадратный корень из дисперсии DX этой величины. Замечание 6.16. Символы MX и DX нужно воспринимать, как единые символы, своеобразные иероглифы, а не как произведения неких M или D на X. Замечание 6.17. (Тем, кто не знаком с курсом математики в объеме технического вуза при чтении можно пропустить.) Для непрерывных случайных величин математическое ожидание и дисперсия определены, как
MX =
+∞
∫x
f ( x)dx.
−∞
DX =
+∞
∫ (x − MX )
−∞
где f(x) - плотность вероятности.
2
f ( x)dx.
99
Среди бесконечного, несчетного множества всех возможных законов распределения случайных величин, единственным законом распределения, у которого параметры, входящие в аналитическое выражение закона, равны математическому ожиданию и дисперсии случайной величины, является закон нормального распределения. А именно, для параметров a и σ аналитического выражения (12) имеют место равенства: a = MX, σ2= DX. По этой причине закон нормального распределения оказался чрезвычайно удобным в пользовании при решении прикладных задач. Еще больше популярности использованию нормального закона прибавило то его уникальное свойство, что в некоторых случаях значения неизвестных параметров закона a и σ2 можно оценить, заменив их найденными по выборочным данным значениями точечной оценки среднего арифметического xср., легко вычисляемого применением формулы (15) и точечной оценки дисперсии S2, вычисляемой применением формулы (16). Иначе говоря, при решении отдельных прикладных задач можно использовать приближенные соотношения 1 n a ≈ xср. = ∑ xi , n i =1
σ 2 ≈ S2 =
1 n xi − xср. 2 , σ = + σ 2 . ∑ n i =1
(
)
(20)
К сожалению, несмотря на простоту нахождения аналитического выражения функции распределения случайной величины применением обработки результатов измерений с использованием формул (20), при изучении природных явлений нормально распределенные случайные величины встречаются крайне редко. Тем не менее, чрезвычайно распространенной ошибкой статистической обработки результатов измерений является принятие неизвестного закона распределения, с которым встречается в практике обработки результатов опытов естествоиспытатель за нормальный закон распределения. В свою очередь, это влечет к неправильным выводам, заключениям и вытекающим из них рекомендациям, с которыми мы часто встречаемся на практике. Например, известно, что в России, с одной стороны, благодаря усилиям правительства, уже не один год существует развитая система контроля над наркобизнесом и незаконным оборотом наркотиков. Однако с другой стороны, не менее известно, что, несмотря на усилия правительства и правоохранительных органов, наркоситуация в стране весьма далека от полностью подконтрольной. По мнению автора пособия, одной из главных причин сложившейся неблагоприятной наркоситуации в России, является
100
отсутствие в распоряжении уполномоченных чиновников государственного аппарата адекватных численных оценок наркоситуации, т. к. применяемые в настоящее время результаты экспертных оценок не могут служить в качестве количественных характеристик для создания научно обоснованных систем управления. Больше того, результаты обследований, предоставляемые чиновникам госаппарата экспертами, даже в тех редких случаях, когда применялся аппарат математического моделирования, все же практически всегда являются ошибочными вследствие нецелевого применения закона нормального распределения. В целях устранения недостатков систем управления, вызванных применением ошибочных приемов математического моделирования, остановимся подробнее на изучении критериев, позволяющих выполнить объективную проверку гипотез о законе распределения случайной величины, проявлением которой являются найденные в результате обследования наркоситуации численные показатели.
6. Критерии асимметрии и эксцесса Читателю известно, что результаты применения критериев "трех сигм", а также критериев "двух сигм" и "одной сигмы" при решении задачи нахождения закона распределения по выборочным данным далеко не всегда гарантируют возможности однозначных заключений о законе распределения. Изложенное обстоятельство ставит исследователя перед необходимостью уметь применять не один или два, а несколько критериев. С целью изучения критериев асимметрии и эксцесса приведем полезные для дальнейшего изучения определения. Определение 6.16. Будем называть центральным эмпирическим моментом k-го порядка, k = 1, 2,... величину µk, заданную через аналитическое выражение
µk =
1 n ∑ xi − xср. n i =1
(
)k .
(21)
Нетрудно заметить, что эмпирическая дисперсия S2, заданная через аналитическое выражение (16), есть центральный эмпирический момент второго порядка µ2, т. е. вычисленный применением формулы (21) центральный момент при k = 2. Определение 6.17. Выборочным коэффициентом асимметрии называется число А, определяемое аналитическим выражением
101
A=
µ3 . σ3
(22)
Определение 6.18. Выборочным эксцессом называется число E, определяемое аналитическим выражением
E=
µ4 −3 . σ4
(23)
Правило применения асимметрии и эксцесса Если численные значения асимметрии и эксцесса, вычисленные использованием выборочных данных равны нулю, то это свидетельствует в пользу того, что выборка извлечена из нормально распределенной генеральной совокупности, т. е. исследуемая случайная величина распределена по нормальному закону. Замечание 6.18. Равенство нулю асимметрии и эксцесса еще не является доказательством того, что исследуемая выборка непременно извлечена из генеральной совокупности численных значений случайной величины, распределенной по нормальному закону. Однако, в силу относительной простоты вычислений, значения асимметрии и эксцесса используются, но только для предварительных заключений. Более точное решение задачи о принадлежности выборочных данных к генеральной совокупности численных значений случайной величины с тем, или иным законом распределения находится применением критерия χ2-Пирсона, Колмогорова-Смирнова, ω2-Мизеса и др. Изучение этих критериев выходит за рамки пособия. Заинтересованный читатель может ознакомиться с методами их применения, воспользовавшись книгами: [28] - для читателей со средним образованием, [30], [35] - для читателей с высшим образованием, [49], [57] с высшим физико-математическим образованием. Определение 6.19. По В.И. Чернецкому нахождение по выборочным данным точечной оценки среднего арифметического, точечной оценки дисперсии, точечной оценки среднеквадратического отклонения, значений асимметрии и эксцесса называется нахождением модели элементарной статистики. Подробнее, см. в монографии [58]. Пример 6.7. Пример дан исключительно в педагогических целях. На самом деле, при таком малом объеме выборки никаких заключений о принадлежности ее элементов к той, или иной генеральной совокупности сделать нельзя.
102
Есть ли основания утверждать, что выборка X = {1, 5, 2, 3, 2} извлечена из генеральной совокупности численных значений нормально распределенной случайной величины? Решение. 1. Ранжируем выборку по неубыванию. Выполнив ранжирование, находим: X = {1, 2, 2, 3, 5}. 2. Вычислим точечную оценку среднего арифметического. Воспользовавшись формулой (15) находим, что xср. = (1+2+2+3+5)/5 = 2.6. 3. Вычислим точечную оценку дисперсии и среднеквадратического отклонения. Воспользовавшись формулами (20) находим: S2 = σ2 = (1/5)((1-2.6)2 + (2-2.6)2 + (2-2.6)2 + (3-2.6)2 + (5-2.6)2) = 1.84, σ = √01.84 = 1.356. 4. Выполним проверку гипотезы о нормальности распределения элементов выборки, применив критерий "трех сигм". Вычислим границы интервала xср. ± 3σ: 3 · 1.356 = 4.07. xср. + 3σ = 2.6 + 4.07 = 6.67. Интервал xср. – 3σ = 2.6 – 4.07 = –1.46. xср. ± 3σ есть интервал [–1.46, +6.67]. Все элементы выборки принадлежат этому интервалу. Вывод 1. Есть основание предполагать, что выборка извлечена из нормально распределенной генеральной совокупности. 5. Применим критерий "двух сигм". Вычислим границы интервала xср. ± 2σ. 2σ = 2 – 1.356 = 2.71. 2.6 - 2.71 = –0.11. 2.6 + 2.71 = 5.31. Найден интервал [–0.11, +5.31]. Все элементы выборки принадлежат найденному интервалу [–0.11, +5.31]. Вывод 2. Есть основание предполагать, что выборка извлечена из нормально распределенной генеральной совокупности. 6. Применим критерий "одной сигмы". Вычислим границы интервала xср. ± 1σ. xср. – 1σ = 2.6 – 1.356 = 1.24. 2.6 + 1.356 = 3.956. Найден интервал [1.24, 3.956]. Этому интервалу принадлежат элементы выборки: 2, 2, 3. Не принадлежат интервалу элементы выборки:1, 5. Так как объем выборки 5 элементов, то доля элементов, принадлежащих вычисленному интервалу равна 3/5=0.6. Но 0.6 < 0.68.
103
Вывод 3. Нет оснований предполагать, что выборка извлечена из нормально распределенной генеральной совокупности. 7. Применим критерий асимметрии. Воспользовавшись формулой (21), вычислим центральный эмпирический момент третьего порядка: µ3 = (1/5)((1–2.6)3 + (2-2.6)3 + (2-2.6)3 + (3-2.6)3 + (5-2.6)3) = 1.872. Вычислим значение σ3. σ3 = 1.3563 = 2.49. Воспользовавшись формулой (22), вычислим асимметрию. А = 1.872/2.49 = 0.752, т. е. А > 0. Вывод 4. Нет оснований предполагать, что выборка извлечена из нормально распределенной генеральной совокупности. 8. Применим критерий эксцесса. Воспользовавшись формулой (21), вычислим центральный эмпирический момент четвертого порядка: µ4 = (1/5)((1–2.6)4 + (2-2.6)4 + (2–2.6)4 + (3–2.6)4 + (5–2.6)4) = 8. Вычислим значение σ4. σ4 = 1.3564 = 3.381. Воспользовавшись формулой (23), вычислим эксцесс. Е = (8/3.381) – 3 = -0.63. E