Министерство образования Российской Федерации Пензенский государственный университет
А. Е. Хохлов
ОСНОВЫ ИНФОРМАТИКИ К...
5 downloads
210 Views
854KB Size
Report
This content was uploaded by our users and we assume good faith they have the permission to share this book. If you own the copyright to this book and it is wrongfully on our website, we offer a simple DMCA procedure to remove your content from our site. Start by pressing the button below!
Report copyright / DMCA form
Министерство образования Российской Федерации Пензенский государственный университет
А. Е. Хохлов
ОСНОВЫ ИНФОРМАТИКИ Конспект лекций
Наградной логотип вуза Издательство Пензенского государственного университета Пенза 2003
УДК 004 (075.8) Х 86 Р е ц е н з е н т ы: Кафедра «Вычислительные системы и моделирование» Пензенского государственного педагогического университета Кандидат технических наук, доцент кафедры «Прикладная информатика» Российского университета инновационных технологий и предпринимательства С. П. Пискарев
Х 86
Хохлов А. Е. Основы информатики: Конспект лекций. – Пенза: Изд-во Пенз. гос. ун-та, 2003. – 103 с: 19 ил., библиогр. 8 назв.
Согласно требованиям Государственных образовательных стандартов, рассматриваются основные понятия и определения информатики, методы и единицы измерения информации, формы представления информации в ЭВМ. Приводится функционально-структурная организация компьютера, основные этапы компьютерного решения задач, программные средства информационных технологий. Анализируется сетевые технологии обработки данных, основы и методы защиты информации, назначение и основы использования систем искусственного интеллекта. Работа подготовлена на кафедре «Информационно-вычислительные системы» и предназначена для студентов специальностей 351400 «Прикладная информатика в экономике» и 220200 «Автоматизированные системы обработки информации и управления».
УДК 004 (075.8) © ©
Издательство Пензенского государственного университета, 2003 Хохлов А. Е., 2003
2
Введение К началу XXI века объём знаний человечества увеличился в два раза, относительно начала XX века, поток информации увеличился в 30 раз. Информация стала главной ценностью земной цивилизации. В развитых странах формируются национальные информационные ресурсы, и происходит переход от индустриальной экономики к экономике, основанной на информации. Более половины трудового населения развитых стран в той или иной мере занято в информационной сфере. Информация стала основным предметом труда. Понятие «информационные ресурсы» (другими словами «информационный потенциал») охватывает широкий круг технических и организационных средств обработки и передачи данных, знания и навыки людей, и конечно сами данные. Можно выделить следующие группы информационных ресурсов: - информация на физических носителях, а также средства её обработки, - средства передачи и коммуникации, включая навыки и приемы их использования, - средства обработки информации, - ученые и специалисты – «производители» информации в разных сферах деятельности, - органы и службы, занимающиеся сбором, обработкой и хранением информации. Наблюдается резкий количественный рост и снижение уровня квалификации рядовых пользователей ЭВМ. Это приводит к необходимости упрощения интерфейса с ЭВМ вплоть до написания программ на естественном языке и речевого общения. Весьма перспективны нейросистемы способные к самообучению при распознавании образов. Особое значение приобретает факт широкого распространения персональных компьютеров и всемирной сети Internet. Это многократно усиливает природные возможности человеческого разума. Философам, социологам и психологам ещё предстоит осознать, глубоко исследовать идею компьютера, как духовного инструмента творческой деятельности, а также оценить все социальные последствия процесса внедрения компьютеров в социальную сферу.
3
До сих пор царило убеждение, что ЭВМ даёт только то, что в ней заложено. Но теперь ясно, что от ЭВМ можно получить нечто новое, а именно знания. Оперируя знаниями ЭВМ могут прийти к решениям, которые ускользают от человеческого разума. Индустриальное общество развитых стран перерастает в информационное общество, основанное на индустрии услуг и информации. Суть информационного общества может быть охарактеризована следующими признаками: 1. Большинство населения в таком обществе занято в сфере услуг и информации. 2. Любой гражданин может получить любую информацию, кроме государственных тайн, коммерческих и личных секретов. 3. Наличие сети гигантских накопителей информации – общедоступных банков знаний и данных, а также необходимых технологических средств (компьютеров, программного обеспечения, сетей). 4. Информация становится товаром и вместе с информационными технологиями занимает ключевое место в экономике страны. Информатизация общества – грандиозная научно-техническая проблема. Она имеет значительные социальные последствия, оказывает влияние на облик цивилизации в целом. Научным фундаментом процесса информатизации общества является научная дисциплина — информатика. В широком смысле информатика — это наука об информационной деятельности, информационных процессах и их организации в человеко-машинных системах. Основными разделами информатики являются исследование и разработка информационных средств и технологий, программных средств и моделирование предметных областей.
4
1. Основные понятия и определения информатики 1.1. Информация и информатика Термин информация имеет множество определений. В «Энциклопедии кибернетики» «информация (лат. informatio – разъяснение, изложение, осведомленность) – одно из наиболее общих понятий науки, обозначающее некоторые сведения, совокупность каких-либо данных, знаний и т.п.». В широком смысле «информация» – это отражение реального мира; в узком смысле «информация» – это любые сведения, являющиеся объектом хранения, передачи и преобразования. В России 25.01.95 принят Федеральный закон «Об информации, информатизации и защите информации». Согласно этому закону: информация – сведения о лицах, предметах, фактах, событиях, явлениях и процессах независимо от формы их представления. С практической точки зрения информация всегда представляется в виде сообщения. Общая схема передачи информации представлена на рис.1. Исто чник сооб щен.
Кодир уст-во
Кан. связ
Декодир устр-во
Получ. сообщ.
Рис.1 Сообщения от источника к приемнику передаются в материальноэнергетической форме (электрический, световой, звуковой сигналы). Человек воспринимает сообщения посредством органов чувств. Приемники информации в технике – с помощью различной измерительной и регистрирующей аппаратуры. В любом случае, с приемом информации связано изменение во времени какой-либо величины, характеризующей состояние приемника. В этом смысле информационное сообщение можно представить функцией x(t), характеризующей изменение во времени параметров физической среды. Если эта функция непрерывна, то передаваемая информация называется аналоговой. Её источником обычно являются различные природные объекты (температура, давление, влажность воздуха и т.д.),
5
объекты технологических процессов (нейтронный поток в реакторе, давление и температура теплоносителя и пр.) и др. Если функция x(t) дискретна, то информация имеет характер дискретных сообщений (сигналы тревоги, языковые сообщения письменные, звуковые или на языке жестов и т.д.) В современном мире инструментом информатики является электронная вычислительная машина (ЭВМ) или computer. Это устройство преобразования информации при выполнении последовательности операций под управлением программы. По виду информации ВМ делятся на аналоговые и цифровые. АВМ оперирует информацией, представленной в виде непрерывных изменений некоторых физических величин. Например, напряжения или силы тока. Многие явления в природе описываются одинаковыми уравнениями, поэтому АВМ позволяют с помощью одного физического процесса моделировать различные природные процессы. ЦВМ – машина, оперирующая информацией, представленной в дискретном виде. В настоящее время разработаны методы численного решения многих видов уравнений, что дало возможность решать на ЦВМ различные задачи с помощью набора простых арифметических и логических операций. АВМ являются специализированными машинами, ЦВМ – универсальными. В ЭВМ для представления дискретной информации применяется алфавитный способ, основанный на использовании конечного набора символов. Этот набор называется алфавитом. Примеры алфавитов, алфавиты естественных языков, десятичные цифры и т.д. Символы из набора алфавита называются буквами, а любая конечная последовательность букв – словом. При этом не требуется, чтобы слово имело языковое смысловое значение. Процесс преобразования информации часто требует представлять буквы одного алфавита средствами (буквами, словами) другого алфавита. Такое представление называется кодированием. Процесс обратного преобразования – декодированием. Широко используется термин: данные (data). Этот термин применяют в отношении информации, представленной в виде, позволяющем хранить, передавать или обрабатывать её с помощью технических средств. Рассмотрим теперь смысл понятия «информатика».
6
Одно из направлений трактовок информатики, связанное с трудами В.И. Сифорова, сводит её к учению об информации вообще – информологии. Это направление, по существу, развивает теорию информации К. Шеннона, его учение об источнике информации, канале, шуме, кодировании, релевантности (существенности) и т.д. Второе направление толкования понятия информатики, изложенное в работах Бернштейна Э. С. и Шрейдера Ю.А., ставит в центр внимания семантические (содержательные) стороны информации, соотношение понятий информация и знание, их функций в общественных системах. Семантическое направление в трактовках информатики нельзя считать удовлетворительным, поскольку оно оставляет в стороне такой важный аспект информационного процесса, как практическое использование знаний (информации). Для нас с вами, как специалистов в области обработки информации наиболее приемлем подход, выдвинутый основоположником отечественной вычислительной техники академиком Глушковым Виктором Михайловичем (1923-82) в 1979 году и утвержденном в 1983 году на годичном собрании АН СССР по предложению Михалевича В. С., Каныгина Ю.М., Гриценко В.И. В их трактовке: Информатика – это комплексная научная и инженерная дисциплина, которая изучает все аспекты разработки, проектирования, создания, оценки, функционирования основанных на ЭВМ систем переработки информации, их применения и воздействия на различные области социальной практики. Из определения Глушкова следует выделить два аспекта. Вопервых, информатика есть следствие развития ЭВМ, во-вторых, объектом исследований в информатике является не просто ЭВМ, а система «человек – ЭВМ – общество». Часто возникает путаница в понятиях «информатика» и «кибернетика». Основная концепция, заложенная Норбертом Винером в кибернетику, связана с разработкой теории управления сложными динамическими системами в разных областях человеческой деятельности. Кибернетика существует независимо от наличия или отсутствия компьютеров. Кибернетика и информатика, внешне очень похожие дисциплины, различаются в расстановке акцентов: - в информатике – на свойствах информации и аппаратно-программных средствах её обработки, 7
- в кибернетике – на разработке концепций и построении моделей объектов с использованием, в частности, информационного подхода. 1.2. Информационные технологии Объектом информатики являются автоматизированные информационные системы (ИС), основанные на ЭВМ и телекоммуникационной технике. Информатика изучает все стороны их разработки, проектирования, создания, анализа и использования на практике. Информационные технологии – это основанные на ЭВМ способы обработки семантической информации – данных и знаний, которые реализуются посредством автоматизированных информационных систем. В качестве признаков классификации АИС используются: направление деятельности, охватываемая территория, организация информационных процессов, область применения. Классификация по направлению деятельности: Отраслевые АИС Промышленная сфера АИС объединением, крупной фирмой АСУ ТП Непрерывными Дискретными Периодическими АСУП АСУ цехом Непромышленная сфера АИС на транспорте АИС в торговле АИС банков АИС социальными процессами Научная сфера, образование, культура АСНИ САПР Экспертные системы (ЭС) АИС «Библиотека» 8
В зависимости от организации информационных процессов АИС делятся на два больших класса: управляющие и информационные. В информационных АИС управление отсутствует (АСНИ, САПР, «Библиотека», ЭС). Классификация по территориальному признаку: АИС области АИС города АИС района Геоинформационные системы По сфере применения различают: Административные Производственные Учебные Медицинские Военные Метеорологические Экологические Криминалистические Классификация АИС на предприятии (исторически один из первых классов): Подсистемы управления производством Оперативного управления АСУ ТП Контроля качества Диагностики Стратегического прогнозирования и планирования Подсистемы организации хозяйственной деятельности Бухучета Финансов Транспорта Снабжения Складов Кадров 9
Информационные технологии (ИТ) включают два основных элемента – машинный и человеческий (социальный). Социальный элемент является главным. В отличие от производственных, энергопреобразующих технологий ИТ как объект информатики относятся к социальным, знаниепреобразующим технологиям. 1.3. Информационный ресурс и его составляющие Один и тот же объект может изучаться разными науками. Объект познания – это некий фрагмент реального мира, а его предмет – это выбранная для исследования методами данной науки сторона, грань, аспект объекта. ИТ выступили новым средством превращения знаний в информационный ресурс (ИР) общества. ИР стал основным ресурсом человечества, главной ценностью современной цивилизации Предметом информатики как новой фундаментальной науки выступает ИР – его сущность, законы функционирования, механизмы взаимодействия с другими ресурсами общества и воздействия на социальный прогресс. ИР – это знание, ставшее информацией. Поэтому знание обладает всеми характеристиками ИР: достоверностью, надежностью, релевантностью (релевантность - нужность, существенность). ИР выступает в пассивной и активной формах. К пассивной относятся такие формы существования знаний, когда они не связаны или слабо связаны с конкретными предметными областями (книги, статьи, патенты, банки данных). Активные формы существования ИР: модель, алгоритм, программа, проект. Каждая из этих четырех активных форм ИР имеет разные степени общности, научно-технический уровень и завершенность (комплектность). Теоретическая информатика рассматривает все аспекты разработки АИС: их проектирования, создания и использования с технической и а также комплекс экономического, содержательной стороны, политического и культурного воздействия на социальную динамику. Теоретическая информатика занимается анализом и традиционных систем преобразования информации: СМИ, кино, театры, справочные службы и т.д. Но рассматривает их с позиций получения и использования ИР, возможной их технологизации. Теоретическая информатика изучает общие свойства всех разновидностей ИТ, процессов и сред их протекания. Всем им характерны 10
такие понятия, как носители информации, каналы связи, информационные контуры, сигналы, прямые и обратные связи, данные, сведения и т. д. Все они описываются такими характеристиками, как надежность, эффективность, релевантность, информационный шум, избыточность и др. Все они делятся на различные фазы и процессы: прием, кодированиедекодирование, хранение, извлечение, отображение информации. Прикладная информатика изучает конкретные разновидности ИТ, которые формируются с помощью специальных ИС (управленческих, медицинских, военных, обучающих, криминалистических и др.) 1.4. История развития информатики и мировоззренческие аспекты информационных технологий Для развития любого человеческого общества необходимы материальные, инструментальные, энергетические и информационные ресурсы. Более того, информация и ее высшая форма — знания являются решающим фактором, определяющим развитие технологии и инструментальных ресурсов в целом. Без них использование материальных и энергетических ресурсов для поддержания жизнедеятельности и развития общества невозможно. Можно поэтому утверждать, что информация ставит предел технологии, а следовательно, и возможностям человечества в освоении мира и дальнейшем прогрессирующем адаптивном развитии. Этот тезис подводит нас к концепции информационно-инструментальной природы генезиса и развития человеческого общества. К. Маркс ввел концепцию социальных революций, ведущих к смене формаций, т. е. определенным образом организованных человеческих сообществ с более или менее четкой социальной структурой. В истории человечества известны три великие технологические революции — аграрная, индустриальная и информационная. Однако и социальные, и технологические революции в значительной мере детерминированы революциями информационными. Первая информационная революция связана с изобретением и освоением человечеством языка (по разным оценкам 1-2 млн. лет назад). Язык, точнее устная речь, сразу выделил человека из мира животных, позволив ему хранить, передавать, совершенствовать, наращивать и трансформировать приобретенную информацию, и прежде всего знания. Изобретение языка позволило создать племенные объединения и союзы, т. е. сообщества, в которых циркулировало и использовалось примерно 109 бит информации. Этим определялся уровень технологических 11
возможностей человечества и класс задач, которые оно могло решать, а также уровни внутри межплеменного взаимодействия. Вторая информационная революция заключалась в изобретении письменности. Символом и, так сказать, гиперконцентратором этой революции была Александрийская библиотека (3 в до н.э. -– 4 в н.э., 500 тыс. свитков). Она, по приблизительным подсчетам, содержала 1011 бит информации. Именно этим определялся информационный максимум, который могло освоить и использовать человечество вплоть до следующей информационной революции. Зафиксированное в письменных текстах знание было ограничено количественно и крайне дорого стоило. Это определяло меру его доступности. Так как человек делал то, что он умеет, а умеет он то, что знает, то объем знаний, аналогичный объему Александрийской библиотеки, ограничивал технологический, социальный и общий духовно-культурный потенциал человечества, доступный для освоения каждым последующим поколением, вплоть до изобретения книгопечатания. Книгопечатание знаменовало собой третью информационную революцию. В книгопечатании наиболее очевидна связь информации и технологии. Технологическим механизмом первой революции был речевой, акустический аппарат человека. Механизмом второй — технология папируса и глиняных табличек, механизмом третьей — печатный станок. Но каждый из этих механизмов, создававший особую информационную технологию, сам зависел от объема и качества информации. Книгопечатание, создало особый мир — вселенную Гуттенберга. Колумб вряд ли открыл бы Америку, если бы не изучил перед этим книги, посвященные географии и сферическому строению Земли. Но сын генуэзского ткача никогда не прочитал бы их, если бы существовали только дорогостоящие рукописи. Печатный станок удешевил книгу, сделал информацию и знания доступными. Мировоззрение человечества изменилось благодаря первым двум тиражам знаменитой книги Коперника. Оба они едва ли превышали 500 экземпляров, но при старой рукописной технологии для их появления понадобилось бы столетие. В печатном же исполнении они распространились буквально за несколько лет. Поразительный промышленный переворот, называемый индустриальной революцией, был бы просто невозможен без предшествующей информационной революции, порожденной книгопечатанием. Третья информационная революция позволила
12
человечеству оперировать объемами 1017 бит единовременно доступной информации. Четвертая революция, плавно переходящая в пятую, связана с созданием современных информационных технологий, которые сами явились результатом развития научных знаний в сфере физики, математики, логики, лингвистики и технологии. Телеграф, телефон, радио и телевидение, а также скоропечатающие устройства колоссально увеличили потоки информации, облегчили ее распространение, накопление, передачу и доступ к ней. Но самым поразительным шагом этой новой революции явилось создание современных компьютеров и новейших средств телекоммуникации. Впервые появилась возможность создания информационной технологии, не только передающей, хранящей информацию и знания, но и продуцирующей их. По самым общим оценкам, каждая новая информационная революция увеличивает объем информации, доступной индивиду и обществу, на два-три порядка. Нынешняя информационная революция может доставить в наше распоряжение колоссальный объем информации, определяемый в 1025 бит. По существу, информационно-компьютерная революция позволяет создать и включить в систему социального обращения такие потоки информации, которых в настоящее время достаточно для того, чтобы обеспечить максимально рациональное природопользование, демографическое, экономическое, индустриальное, аграрное и духовнокультурное развитие человечества. Этой информации в принципе, хватит, чтобы сконструировать знания, необходимые для разрешения большинства глобальных и региональных конфликтов. Разумеется, было бы наивно думать, что одной информации довольно для того, чтобы решить все болевые проблемы человечества. К счастью или к несчастью, люди руководствуются не только и не столько разумом, сколько страстями и интересами, и прежде всего интересами корыстными, властными, предметно ориентированными. Но с этой существенной оговоркой информационные ресурсы человечества сейчас таковы, что, будь они доступны и умей мы правильно ими пользоваться, многие из нынешних трудностей, личных, социальных, экономических, политических, глобальных и региональных, были бы преодолены с минимальными потерями или даже вообще без потерь.
13
1.5. Экономические и правовые аспекты информационных технологий Важнейшим аспектом социальной информатизации является формирование и развитие индустрии информатики – весьма специфической отрасли экономики. Здесь необходимо учитывать влияние следующих факторов. 1. Наличие и дальнейшее развитие всех звеньев переработки информации: ВЦ и их сети, фонды алгоритмов и программ, БД и БЗ, исследовательские и проектные институты по созданию ИС, организации по обслуживанию ВЦ и т.д. Все это представляет собой особую инфраструктуру, обслуживающую сферу хозяйства. 2. Создание производств по выпуску средств ВТ и автоматизации: ЭВМ, элементной базы, средств телекоммуникации, периферийного оборудования, магнитных носителей и т.п. 3. Создание предприятий по выпуску вспомогательного оборудования и материалов, мебели для ВЦ, средств магнитной записи и т.д. 4. Создание организаций и предприятий по разработке программного обеспечения на промышленной основе. 5. Разработка и внедрение коммуникационных сетей. Рост индустрии информатики резко опережает рост других отраслей экономики. По числу занятых, объемам продукции она уже в ряде стран выдвинулась на одно из первых мест. Этой динамичной и наукоемкой сфере придается стратегическое значение. Особенность индустрии информатики состоит в том, что она является инфраструктурной отраслью, обслуживающей другие отрасли материального производства и непроизводственной сферы, такие как связь или транспорт. Хотя её функции гораздо сложнее. Конечно, развитие технической базы информатизации очень важно, но все же основные её проблемы лежат в области социальных преобразований. И главным из них является развитие интеллектуального рынка. Информация превращается в обыкновенный товар, объект массовой купли-продажи. Информационный рынок по масштабам (обороту) и темпам роста в большинстве развитых стран далеко опередил рынок материальных продуктов и услуг. На первое место по своему экономическому значению выдвинулся рынок знаков, отодвинув на задний план рынок вещей. В данном случае рынок знаков трактуется широко: это рынок закодированных в той или иной форме знаний, их материальных носителей и средств переработки и применения. 14
К рынку знаков относятся: 1. Традиционная бумажная информация: книги, журналы, патенты, лицензии, ноу-хау, проектная документация, рецепты. 2. Опытные образцы, имеющие информационное значение и лишь потенциальное экономическое значение: опытные партии товаров, оборудования, препаратов, технологических комплексов. 3. Современная машинная информатика: алгоритмы, модели, программы, видеофильмы, игры и т.п. 4. Техника создания всей «знаковой продукции» и её использования: компьютерная техника, интегральные схемы, средства связи. 5. Основные материалы производства и использования знаковой продукции: бумага, магнитные носители и т. п. 6. Вспомогательные материалы и оборудование, например, мебель для ВЦ, оргтехника. 7. Реклама и рынок зрелищ, оборот которого связан с внутренним и международным туризмом (ведь туризм в основном связан с информационными целями). Но и это далеко не все. Есть еще информационный рынок, относящийся к бытовой сфере. Речь идет о широком классе платной информации, в частности коммерческих услуг: электронная почта, электронные газеты, услуги городских справочных бюро, телефонные справочники, сведения о вакантных рабочих местах, расписание движения транспорта, данные бюро по обмену и продаже квартир, заказы билетов на транспорт, распределение мест в гостиницах, театрах, предоставление учебно-воспитательной информации, дневник новостей, полезные советы (рецепты, мода, реклама, рекомендации врача), прогноз погоды и т. д. и т.п. Мы вступаем в период глобальной информатизации. Известно, что товар как вещь годная для потребления и обмена, явился исходным пунктом возникновения капитала, а рынок выступил основой формирования индустриального общества. Точно так же интеллектуальный (информационный) товар выступает фактором формирования информационного общества с его информационным рынком. Развитие рыночных отношений в информационной деятельности поставило вопрос о защите информации как, объекта интеллектуальной собственности и имущественных прав на нее. В Российской Федерации принят ряд указов, постановлений, законов, таких, как: "Об информации, информатизации и защите информации". "Об авторском праве и смежных правах". 15
"О правовой охране программ для ЭВМ и баз данных". "О правовой охране топологий интегральных схем". Рассмотрим основные положения закона "Об информации, информатизации и защите информации", который является базовым юридическим документом информационного общества. С его помощью удалось частично решить вопросы правового регулирования на информационном рынке ряда проблем: защиты прав и свобод личности, от угроз и ущерба, связанных с искажением, порчей, уничтожением "персональной" информации. Закон состоит из 25 статей, сгруппированных по пяти главам: - Общие положения. - Информационные ресурсы. - Пользование информационными ресурсами. - Информатизация, информационные системы, технологии и средства их обеспечения. - Защита информации и прав субъектов в области информационных процессов и информатизации. В законе определены цели и основные направления государственной политики в сфере информатизации. Информатизация определяется как важное новое стратегическое направление деятельности государства. Указано, что государство должно заниматься формированием и реализацией единой государственной научно-технической и промышленной политики в сфере информатизации. Закон создает условия для включения России в международный информационный обмен, предотвращает бесхозяйственное отношение к информационным ресурсам и информатизации, обеспечивает информационную безопасность и права юридических и физических лиц на информацию. В нем определяются комплексное решение проблемы организации информационных ресурсов, правовые положения по их использованию и предлагается рассматривать информационные ресурсы в двух аспектах: - как материальный продукт, который можно покупать и продавать; - как интеллектуальный продукт, на который распространяется право интеллектуальной собственности, авторское право. Закон закладывает юридические основы гарантий прав граждан на информацию. Он направлен на урегулирование важнейшего вопроса экономической реформы — формы, права и механизма реализации собственности на накопленные информационные ресурсы. 16
2. Количество и качество информации 2.1. Формы адекватности информации При работе с информацией всегда имеется ее источник и потребитель (получатель). Пути и процессы, обеспечивающие передачу сообщений от источника информации к ее потребителю, называются информационными коммуникациями. Для потребителя информации очень важной характеристикой является ее адекватность. Адекватность информация — это уровень соответствия образа, создаваемого с помощью полученной информации, реальному объекту, процессу, явлению и т.п. В реальной жизни вряд ли возможна ситуация, когда вы сможете рассчитывать на полную адекватность информации. Всегда присутствует некоторая степень неопределенности. От степени адекватности информации реальному состоянию объекта или процесса зависит правильность принятия решений человеком. Адекватность информации может выражаться в трех формах: синтаксической, семантической, прагматической. Синтаксическая адекватность. Она отображает формальноструктурные характеристики информации и не затрагивает ее смыслового содержания. На синтаксическом уровне учитываются тип носителя и способ представления информации, скорость передачи и обработки, размеры кодов представления информации, надежность и точность преобразования этих кодов и т.п. Информацию, рассматриваемую только с синтаксических позиций, обычно называют данными, так как при этом не имеет значения смысловая сторона. Эта форма способствует восприятию внешних структурных характеристик, т.е. синтаксической стороны информации. Семантическая (смысловая) адекватность. Эта форма определяет степень соответствия образа объекта и самого объекта. Семантический аспект предполагает учет смыслового содержания информации. На этом уровне анализируются те сведения, которые отражает информация, рассматриваются смысловые связи. В информатике устанавливаются смысловые связи между кодами представления информации. Эта форма служит для формирования понятий и представлений, выявления смысла, содержания информации и ее обобщения. 17
Прагматическая (потребительская) адекватность. Она отражает отношение информации и ее потребителя, соответствие информации цели управления, которая на ее основе реализуется. Проявляются прагматические свойства информации только при наличии единства информации, пользователя и цели управления. Прагматический аспект связан с ценностью, полезностью использования информации при выработке потребителем решения для достижения своей цели. С этой точки зрения анализируются потребительские свойства информации. Эта форма адекватности непосредственно связана с практическим использованием информации. 2.2. Информация и энтропия, измерение информации Для измерения информации вводятся два параметра: количество информации I и объем данных VД. Эти параметры имеют разные выражения и интерпретацию в зависимости от рассматриваемой формы адекватности. Каждой форме адекватности соответствует своя мера количества информации и объема данных. Синтаксическая мера информации. Эта мера количества информации оперирует с обезличенной информацией, не выражающей смыслового отношения к объекту. Объем данных в сообщении измеряется количеством символов (разрядов) в этом сообщении. В различных системах счисления один разряд имеет различный вес и соответственно меняется единица измерения данных: • в двоичной системе счисления единица измерения — бит (bit – binary digit - двоичный разряд); в современных ЭВМ наряду с минимальной единицей измерения данных "бит" широко используется укрупненная единица измерения "байт", равная 8 бит. • в десятичной системе счисления единица измерения — дит (десятичный разряд). Сообщение в двоичной системе в виде восьмиразрядного двоичного кода 10111011 имеет объем данных VД =8 бит. Сообщение в десятичной системе в виде шестиразрядного числа 275903 имеет объем данных VД =6 дит. Количество информации I на синтаксическом уровне определяется с помощью понятия неопределенности состояния системы (энтропии системы). Получение информации о какой-либо системе всегда связано с 18
изменением степени неосведомленности получателя о состоянии этой системы. Пусть до получения информации потребитель имеет некоторые предварительные (априорные) сведения о системе α. Мерой его неосведомленности о системе является функция H(α), которая в то же время служит и мерой неопределенности состояния системы. После получения некоторого сообщения β получатель приобрел некоторую дополнительную информацию Iβ(α), уменьшившую его априорную неосведомленность так, что апостериорная (после получения сообщения β) неопределенность состояния системы стала Hβ(α). Тогда количество информации Iβ(α) о системе, полученной в сообщении β, определится как Iβ(α)= H(α) - Hβ(α), т.е. количество информации равно уменьшению неопределенности состояния системы. Если конечная неопределенность Hβ(α) обратится в нуль, то первоначальное неполное знание заменится полным знанием и количество информации Iβ(α)= H(α). Иными словами, энтропия системы H(α) может рассматриваться как мера недостающей информации. Энтропия системы H(α) имеющая N возможных состояний, согласно формуле Шеннона, равна: N
H ( α ) = −∑ Pi log Pi i =1
где Pi - вероятность того, что система находится в i-м состоянии. Для случая, когда все состояния системы равновероятны, т.е. их вероятности равны Pi =
1 , ее энтропия определяется соотношением N N
H (α ) = −∑ i =1
1 1 log N N
Часто информация кодируется числовыми кодами в той или иной системе счисления, особенно это актуально при представлении информации в компьютере. Естественно, что одно и то же количество разрядов в разных системах счисления может передать разное число состояний отображаемого объекта, что можно представить в виде соотношения N = mn
где
N - число всевозможных отображаемых состояний; 19
m - основание системы счисления (разнообразие символов алфавита); n - число разрядов (символов) в сообщении. Рассмотрим пример. По каналу связи передается n-разрядное сообщение, использующее m различных символов. Так как количество N = mn , то при всевозможных кодовых комбинаций будет равновероятности появления любой из них количество информации, приобретенной абонентом в результате получения сообщения, будет I = log N = n log m . Это формула Хартли. Если в качестве основания логарифма принять m, то I=n. В данном случае количество информации (при условии полного априорного незнания абонентом содержания сообщения) будет равно объему данных I=VД, полученных по каналу связи. Для неравновероятных состояний системы всегда I