Хранение информации - процесс такой же древний, как и жизнь человеческой цивилизации. Он имеет огромное значение для обеспечения поступательного развития человеческого общества (да и любой системы), многократного использования информации, передачи накапливаемого знания последующим поколениям.

Уже в древности человек столкнулся с необходимостью хранения информации. Примерами тому служат зарубки на деревьях, чтобы не заблудиться во время охоты; счет предметов с помощью камешков, узелков; изображение животных и эпизодов охоты на стенах пещер. Человеческое общество способно бережно хранить информацию и передавать ее от поколения к поколению. На протяжении всей истории знания и жизненный опыт отдельных людей накапливаются. По современным представлениям, чем больше информации накоплено и используется в обществе, тем выше уровень его развития. Накопление информации является основой развития общества. Когда объем накапливаемой ин- формации возрастает настолько, что ее становится просто невозможно хранить в памяти, человек начинает прибегать к помощи различного рода вспомогательных средств С рождением письменности возникло специальное средство фиксирования и распространения мысли в пространстве и во времени. Родилась документированная информация - рукописи и рукописные книги, появились своеобразные информационно-накопительные центры - древние библиотеки и архивы. Постепенно письменный документ стал и орудием управления (указы, приказы, законы).

Следующим информационным скачком явилось книгопечатание. С его возникновением наибольший объем информации стал храниться в различных печатных изданиях, и для ее получения человек обращается в места их хранения (библиотеки, архивы и пр.).

В настоящее время мы являемся свидетелями быстрого развития новых - автоматизированных - методов хранения информации с помощью электронных средств. Компьютер и средства телекоммуникации предназначены для компактного хранения информации с возможностью быстрого доступа к

Информация, предназначенная для хранения и передачи, как правило, представлена в форме документа. Под документом понимается объект на любом материальном носителе, где имеется информация, предназначенная для распространения в пространстве и времени (от лат. dokumentum - свидетельство. Первоначально это слово обозначало письменное подтверждение правовых отношений и событий). Основное назначение документа заключается в использовании его в качестве источника информации при решении различных проблем обучения, управления, науки, техники, производства, социальных отношений.

Одной из процедур хранения информации является ее накопление. Оно может быть пассивным и

активным.

При пассивном накоплении поступающая информация просто "складируется", при этом принимаются меры для обеспечения ее сохранности и повторного обращения к ней (считывания). Например, запись звуковой информации на магнитофонную ленту; стенографирование выступления; размещение

документов в архиве.

При активном накоплении происходит определенная обработка поступающей информации, имеющая много градаций, но в целом направленная на обогащение знания получателя информации. Например, систематизация и обобщение документов, поступивших на хранение, перевод содержания документов в другую форму, перенесение документов на другие носители совместно с процедурами сжатия данных, обеспечения защитными кодами и т.п.

Важно помнить, что хранение очень больших объемов информации оправдано только при условии, если поиск нужной информации можно осуществить достаточно быстро, а сведения получить в доступной форме. Иными словами, информация хранится только для того, чтобы впоследствии ее можно было легко отыскать, а возможность поиска закладывается при определении способа хранения информации и доступа к ней. Таким образом, первый вопрос, на который необходимо ответить при организации любого хранилища информации - как ее потом там искать.

ВНИМАНИЕ!
Здесь приводится очень сокращённый текст реферата. Полную версию реферат по информатике можно скачать бесплатно по указанной выше ссылке.

Виды носителей информации

Носитель информации – физическая среда, непосредственно хранящая информацию. Основным носителем информации для человека является его собственная биологическая память (мозг человека). Собственную память человека можно назвать оперативной памятью. Здесь слово “оперативный” является синонимом слова “быстрый”. Заученные знания воспроизводятся человеком мгновенно. Собственную память мы еще можем назвать внутренней памятью, поскольку ее носитель – мозг – находится внутри нас.

Носитель информации - строго определённая часть конкретной информационной системы, служащая для промежуточного хранения или передачи информации.

Основа современных информационных технологий – это ЭВМ. Когда речь идет об ЭВМ, то можно говорить о носителях информации, как о внешних запоминающих устройствах (внешней памяти). Эти носители информации можно классифицировать по различным признакам, например, по типу исполнения, материалу, из которого изготовлен носитель и т.п. Один из вариантов классификация носителей информации представлен на рис. 1.1.

Список носителей информации на рис. 1.1 не является исчерпывающим. Некоторые носители информации мы рассмотрим более подробно в следующих разделах.

Ленточные носители информации

Магнитная лента - носитель магнитной записи, представляющий собой тонкую гибкую ленту, состоящую из основы и магнитного рабочего слоя. Рабочие свойства магнитной ленты характеризуются её чувствительностью при записи и искажениями сигнала в процессе записи и воспроизведения. Наиболее широко применяется многослойная магнитная лента с рабочим слоем из игольчатых частиц магнитно-твёрдых порошков гамма-окиси железа (у-Fе2О3), двуокиси хрома (СrО2) и гамма-окиси железа, модифицированной кобальтом, ориентированных обычно в направлении намагничивания при записи.

Дисковые носители информации

Дисковые носители информации относятся к машинным носителям с прямым доступом. Понятие прямой доступ означает, что ПК может «обратиться» к дорожке, на которой начинается участок с искомой информацией или куда нужно записать новую информацию .

Накопители на дисках наиболее разнообразны:

Накопители на гибких магнитных дисках (НГМД), они же флоппи-диски, они же дискеты
Накопители на жестких магнитных дисках (НЖМД), они же винчестеры (в народе просто «винты»)
Накопители на оптических компакт-дисках:

CD-ROM (Compact Disk ROM)
DVD-ROM

Имеются и другие разновидности дисковых носителей информации, например, магнитооптические диски, но ввиду их малой распространенности мы их рассматривать не будем.

Накопители на гибких магнитных дисках

Некоторое время назад дискеты были самым популярным средством передачи информации с компьютера на компьютер, так как интернет в те времена был большой редкостью, компьютерные сети тоже, а устройства для чтения-записи компакт дисков стоили очень дорого. Дискеты и сейчас используются, но уже достаточно редко. В основном для хранения различных ключей (например, при работе с системой клиент-банк) и для передачи различной отчетной информации государственным надзорным службам.

Дискета - портативный магнитный носитель информации, используемый для многократной записи и хранения данных сравнительно небольшого объема. Этот вид носителя был особенно распространён в 1970-х - начале 2000-х годов. Вместо термина «дискета» иногда используется аббревиатура ГМД - «гибкий магнитный диск» (соответственно, устройство для работы с дискетами называется НГМД - «накопитель на гибких магнитных дисках», жаргонный вариант - флоповод, флопик, флопарь от английского floppy-disk или вообще "печенюшка"). Обычно дискета представляет собой гибкую пластиковую пластинку, покрытую ферромагнитным слоем, отсюда английское название «floppy disk» («гибкий диск»). Эта пластинка помещается в пластмассовый корпус, защищающий магнитный слой от физических повреждений. Оболочка бывает гибкой или прочной. Запись и считывание дискет осуществляется с помощью специального устройства - дисковод (флоппи-дисковод). Дискета обычно имеет функцию защиты от записи, посредством которой можно предоставить доступ к данным только в режиме чтения. Внешний вид 3,5” дискеты представлен на рис. 1.2.

Накопители на жестких магнитных дисках

В качестве накопителей на жестких магнитных дисках широкое распространение в ПК получили накопители типа «винчестер».

Термин винчестер возник из жаргонного названия первой модели жесткого диска емкостью 16 КВ (IBM, 1973 г.), имевшего 30 дорожек по 30 секторов, что случайно совпало с калибром 30/30 известного охотничьего ружья «Винчестер».

Накопители на оптических дисках

Компакт-диск («CD», «Shape CD», «CD-ROM», «КД ПЗУ») - оптический носитель информации в виде диска с отверстием в центре, информация с которого считывается с помощью лазера. Изначально компакт-диск был создан для цифрового хранения аудио (т. н. Audio-CD), однако в настоящее время широко используется как устройство хранения данных широкого назначения (т. н. CD-ROM). Аудио-компакт-диски по формату отличаются от компакт-дисков с данными, и CD-плееры обычно могут воспроизводить только их (на компьютере, конечно, можно прочитать оба вида дисков). Встречаются диски, содержащие как аудиоинформацию, так и данные - их можно и послушать на CD-плеере, и прочитать на компьютере.

Оптические диски имеют обычно поликарбонатную или стеклянную термообработанную основу. Рабочий слой оптических дисков изготавливают в виде тончайших плёнок легкоплавких металлов (теллур) или сплавов (теллур-селен, теллур-углерод, теллур-селен-свинец и др.), органических красителей. Информационная поверхность оптических дисков покрыта миллиметровым слоем прочного прозрачного пластика (поликарбоната). В процессе записи и воспроизведения на оптических дисках роль преобразователя сигналов выполняет лазерный луч, сфокусированный на рабочем слое диска в пятно диаметром около 1 мкм. При вращении диска лазерный луч следует вдоль дорожки диска, ширина которой также близка к 1 мкм. Возможность фокусировки луча в пятно малого размера позволяет формировать на диске метки площадью 1-3 мкм. В качестве источника света используются лазеры (аргоновые, гелий-кадмиевые и др.). В результате плотность записи оказывается на несколько порядков выше предела, обеспечиваемого магнитным способом записи. Информационная ёмкость оптического диска достигает 1 Гбайт (при диаметре диска 130 мм) и 2-4 Гбайт (при диаметре 300 мм).

Широкое применение в качестве носителя информации получили также магнитооптические компакт-диски типа RW (Re Writeble). На них запись информации осуществляется магнитной головкой с одновременным использованием лазерного луча. Лазерный луч нагревает точку на диске, а электромагнит изменяет магнитную ориентацию этой точки. Считывание же производится лазерным лучом меньшей мощности.

Во второй половине 1990-х годов появились новые, весьма перспективные носители документированной информации - цифровые универсальные видеодиски DVD (Digital Versatile Disk) типа DVD-ROM, DVD-RAM, DVD-R с большой ёмкостью (до 17 Гбайт).

По технологии применения оптические, магнитооптические и цифровые компакт-диски делятся на 3 основных класса:

Диски с постоянной (нестираемой) информацией (CD-ROM). Это пластиковые компакт-диски диаметром 4,72 дюйма и толщиной 0,05 дюйма. Они изготавливаются с помощью стеклянного диска-оригинала, на который наносится фоторегистрирующий слой. В этом слое лазерная система записи формирует систему питов (меток в виде микроскопических впадин), которая затем переносится на тиражируемые диски-копии. Считывание информации осуществляется также лазерным лучом в оптическом дисководе персонального компьютера. CD-ROM обычно обладают ёмкостью 650 Мбайт и используются для записи цифровых звуковых программ, программного обеспечения для ЭВМ и т.п.;
Диски, допускающие однократную запись и многократное воспроизведение сигналов без возможности их стирания (CD-R; CD-WORM - Write-Once, Read-Many - один раз записал, много раз считал). Используются в электронных архивах и банках данных, во внешних накопителях ЭВМ. Они представляют собой основу из прозрачного материала, на которую нанесён рабочий слой;
Реверсивные оптические диски, позволяющие многократно записывать, воспроизводить и стирать сигналы (CD-RW; CD-E). Это наиболее универсальные диски, способные заменить магнитные носители практически во всех областях применения. Они аналогичны дискам для однократной записи, но содержат рабочий слой, в котором физические процессы записи являются обратимыми. Технология изготовления таких дисков сложнее, поэтому они стоят дороже дисков для однократной записи.

В настоящее время оптические (лазерные) диски являются наиболее надёжными материальными носителями документированной информации, записанной цифровым способом. Вместе с тем активно ведутся работы по созданию ещё более компактных носителей информации с использованием так называемых нанотехнологий, работающих с атомами и молекулами. Плотность упаковки элементов, собранных из атомов, в тысячи раз больше, чем в современной микроэлектронике. В результате один компакт-диск, изготовленный по нанотехнологии, может заменить тысячи лазерных дисков.

Электронные носители информации

Вообще говоря, все рассмотренные ранее носители тоже косвенно связаны с электроникой. Однако имеется вид носителей, где информации хранится не на магнитных/оптических дисках, а в микросхемах памяти. Эти микросхемы выполнены по FLASH-технологии, поэтому такие устройства иногда называют FLASH-дисками (в народе просто «флэшка»). Микросхема, как можно догадаться, диском не является. Однако операционные системы носители информации с FLASH-памятью определяют как диск (для удобства пользователя), поэтому название «диск» имеет право на существование.

Флэш-память (англ. Flash-Memory) - разновидность твердотельной полупроводниковой энергонезависимой перезаписываемой памяти. Флэш-память может быть прочитана сколько угодно раз, но писать в такую память можно лишь ограниченное число раз (обычно около 10 тысяч раз). Несмотря на то, что такое ограничение есть, 10 тысяч циклов перезаписи - это намного больше, чем способна выдержать дискета или CD-RW. Стирание происходит участками, поэтому нельзя изменить один бит или байт без перезаписи всего участка (это ограничение относится к самому популярному на сегодня типу флэш-памяти - NAND). Преимуществом флэш-памяти над обычной является её энергонезависимость - при выключении энергии содержимое памяти сохраняется. Преимуществом флэш-памяти над жёсткими дисками, CD-ROM-ами, DVD является отсутствие движущихся частей. Поэтому флэш-память более компактна, дешева (с учётом стоимости устройств чтения-записи) и обеспечивает более быстрый доступ.

Хранение информации

Хранение информации - это способ распространения информации в пространстве и времени. Способ хранения информации зависит от ее носителя (книга - библиотека, картина - музей, фотография - альбом). Этот процесс такой же древний, как и жизнь человеческой цивилизации. Уже в древности человек столкнулся с необходимостью хранения информации: зарубки на деревьях, чтобы не заблудиться во время охоты; счет предметов с помощью камешков, узелков; изображение животных и эпизодов охоты на стенах пещер.

ЭВМ предназначена для компактного хранения информации с возможностью быстрого доступа к ней.

Информационная система - это хранилище информации, снабженное процедурами ввода, поиска и размещения и выдачи информации. Наличие таких процедур - главная особенность информационных систем, отличающих их от простых скоплений информационных материалов.

От информации к данным

Человек по-разному подходит к хранению информации. Все зависит от того сколько ее и как долго ее нужно хранить. Если информации немного ее можно запомнить в уме. Нетрудно запомнить имя своего друга и его фамилию. А если нужно запомнить его номер телефона и домашний адрес мы пользуемся записной книжкой. Когда информация запомнена (сохранена) ее называют данные.

Данные в компьютере имеют различное назначение. Некоторые из них нужны только в течение короткого периода, другие должны храниться длительное время. Вообще говоря, в компьютере есть довольно много «хитрых» устройств, которые предназначены для хранения информации. Например, регистры процессора, регистровая КЭШ-память и т.п. Но большинство «простых смертных» даже не слышали таких «страшных» слов. Поэтому мы ограничимся рассмотрением оперативной памяти (ОЗУ) и постоянной памяти, к которой относятся уже рассмотренные нами носители информации.

Оперативная память компьютера

Как уже было сказано, в компьютере тоже есть несколько средств для хранения информации. Самый быстрый способ запомнить данные - это записать их в электронные микросхемы. Такая память называется оперативной памятью. Оперативная память состоит из ячеек. В каждой ячейке может храниться один байт данных.

У каждой ячейки есть свои адрес. Можно считать, что это как бы номер ячейки, поэтому такие ячейки еще называют адресными ячейками. Когда компьютер отправляет данные на хранение в оперативную память, он запоминает адреса, в которые эти данные помещены. Обращаясь к адресной ячейке, компьютер находит в ней байт данных.

Регенерация оперативной памяти

Адресная ячейка оперативной памяти хранит один байт, а поскольку байт состоит из восьми битов, то в ней есть восемь битовых ячеек. Каждая битовая ячейка микросхемы оперативной памяти хранит электрический заряд.

Заряды не могут храниться в ячейках долго - они «стекают». Всего за несколько десятых долей секунды заряд в ячейке уменьшается настолько, что данные утрачиваются.

Дисковая память

Для постоянного хранения данных используют носители информации (см. раздел «Виды носителей информации»). Компакт диски и дискеты имеют относительно небольшое быстродействие, поэтому большая часть информации, к которой необходим постоянный доступ, хранится на жестком диске. Вся информация на диске хранится в виде файлов. Для управления доступом к информации существует файловая система. Имеется несколько типов файловых систем.

Структура данных на диске

Чтобы данные можно было не только записать на жесткий диск, а потом еще и прочитать, надо точно знать, что и куда было записано. У всех данных должен быть адрес. У каждой книги в библиотеке есть свой зал, стеллаж, полка и инвентарный номер - это как бы ее адрес. По такому адресу книгу можно найти. Все данные, которые записываются на жесткий диск, тоже должны иметь адрес, иначе их не разыскать.

Файловые системы

Стоит отметить, что структура данных на диске зависит от типа файловой системы. Все файловые системы состоят из структур, необходимых для хранения и управления данными. Эти структуры обычно включают загрузочную запись операционной системы, каталоги и файлы. Файловая система также исполняет три главных функции:

Отслеживание занятого и свободного места
Поддержка имен каталогов и файлов
Отслеживание физического местоположения каждого файла на диске.

Различные файловые системы используются различными операционными системами (ОС). Некоторые OС могут распознавать только одну файловую систему, в то время как другие OС могут распознавать несколько. Некоторые из наиболее распространенных файловых систем:

FAT (File Allocation Table)
FAT32 (File Allocation Table 32)
NTFS (New Technology File System)
HPFS (High Performance File System)
NetWare File System
Linux Ext2 и Linux Swap

FAT

Файловая система FAT используется DOS, Windows 3.x и Windows 95. Файловая система FAT также доступна в Windows 98/Me/NT/2000 и OS/2.

Файловая система FAT реализуется при помощи File Allocation Table (FAT - Таблицы Распределения Файлов) и кластеров. FAT - сердце файловой системы. Для безопасности FAT имеет дубликат, чтобы защитить ее данные от случайного стирания или неисправности. Кластер - самая маленькая единица системы FAT для хранения данных. Один кластер состоит из фиксированного числа секторов диска. В FAT записано, какие кластеры используются, какие являются свободными, и где файлы расположены в пределах кластеров.

FAT-32

FAT32 - файловая система, которая может использоваться Windows 95 OEM Service Release 2 (версия 4.00.950B), Windows 98, Windows Me и Windows 2000. Однако, DOS, Windows 3.x, Windows NT 3.51/4.0, более ранние версии Windows 95 и OS/2 не распознают FAT32 и не могут загружать или использовать файлы на диске или разделе FAT32.

FAT32 - развитие файловой системы FAT. Она основана на 32-битовой таблице распределения файлов, более быстрой, чем 16-битовые таблицы, используемые системой FAT. В результате, FAT32 поддерживает диски или разделы намного большего размера (до 2 ТБ).

NTFS

NTFS (Новая Технология Файловой Системы) доступна только Windows NT/2000. NTFS не рекомендуется использовать на дисках размером менее 400 МБ, потому что она требует много места для структур системы.

Центральная структура файловой системы NTFS - это MFT (Master File Table). NTFS сохраняет множество копий критической части таблицы для защиты от неполадок и потери данных.

HPFS

HPFS (Файловая система с высокой производительностью) - привилегированная файловая система для OS/2, которая также поддерживается старшими версиями Windows NT.

В отличие от файловых систем FAT, HPFS сортирует свои каталоги, основываясь на именах файлов. HPFS также использует более эффективную структуру для организации каталога. В результате доступ к файлу часто быстрее и место используется более эффективно, чем с файловой системой FAT.

HPFS распределяет данные файла в секторах, а не в кластерах. Чтобы сохранить дорожку, которая имеет секторы или не используется, HPFS организовывает диск или раздел в виде групп по 8 МБ. Такое группирование улучшает производительность, потому что головки чтения/записи не должны возвращаться на нулевую дорожку каждый раз, когда ОС нуждается в доступе к информации о доступном месте или местоположении необходимого файла.

NetWare File System

Операционная система Novell NetWare использует файловую систему NetWare, которая была разработана специально для использования службами NetWare.

Linux Ext2 и Linux Swap

Файловые системы Linux Ext2 и Linux были разработаны для ОС Linux OS (Версия UNIX для свободно распространения). Файловая система Linux Ext2 поддерживает диск или раздел с максимальным размером 4 ТБ.

Каталоги и путь к файлу

Рассмотрим для примера структуру дискового пространства системы FAT, как самой простой.

Информационная структура дискового пространства - это внешнее представление дискового пространства, ориентированное на пользователя и определяемое такими элементами, как том (логический диск), каталог (папка, директория) и файл. Эти элементы используются при общении пользователя с операционной системой. Общение осуществляется с помощью команд, выполняющих операции доступа к файлам и каталогам.

Источники информации

Информатика: Учебник. – 3-е перераб. изд. / Под ред. Н.В. Макаровой. – М.: Финансы и статистика, 2002. – 768 с.: ил.
Волк В.К. Исследование функциональной структуры памяти персонального компьютера. Лабораторный практикум. Учебное пособие. Издательство Курганского государственного университета, 2004 г. – 72 с.

Информатика, кибернетика и программирование

Хранение информации данных не является самостоятельной фазой в информационном процессе а входит в состав фазы обработки. Различают структурированные данные в которых отражаются отдельные факты предметной области это основная форма представления данных в СУБД и неструктурированные произвольные по форме включающие и тексты и графику и прочие данные. Эта форма представления данных широко используется например в Интернеттехнологиях а сами данные предоставляются пользователю в виде отклика поисковыми системами. Организация того или...

PAGE \* MERGEFORMAT 3

Вопрос 2 . Хранение информации.

Хранение информации (данных) не является самостоятельной фазой в информационном процессе, а входит в состав фазы обработки. Однако, в силу важности организации хранения, данный материал вынесен в отдельный раздел.

Различают структурированные данные, в которых отражаются отдельные факты предметной области (это основная форма представления данных в СУБД), и неструктурированные, произвольные по форме, включающие и тексты, и графику, и прочие данные. Эта форма представления данных широко используется, например, в Интернет-технологиях, а сами данные предоставляются пользователю в виде отклика поисковыми системами.

Организация того или иного вида хранения данных (структурированных или неструктурированных) связана с обеспечением доступа к самим данным. Под доступом понимается возможность выделения элемента данных (или множества элементов) среди других элементов по каким-либо признакам с целью выполнения некоторых действий над элементом. При этом под элементом понимается как запись файла (в случае структурированных данных), так и сам файл (в случае неструктурированных данных).

Для данных любого вида доступ осуществляется с помощью специальных данных, которые называются ключевыми (ключами ). Для структурированных данных такие ключи входят в состав записей файлов в качестве отдельных полей записей. Для неструктурированных поисковые слова или выражения входят, как правило, в искомый текст. С помощью ключей выполняется идентификация требуемых элементов в информационном массиве (массиве хранения данных).

Дальнейшее изложение фазы хранения информации относится к структурированным данным.

Модели структурированных данных и технологии их обработки основаны на одном из трех способов организации хранения данных: в виде линейного списка (или табличном), иерархическом (или древовидном), сетевом .

Хранение информации это ее запись во вспомогательные запоминающие устройства на различных носителях для последующего использования.

Хранение является одной из основных операций, осуществляемых над информацией, и главным способом обеспечения ее доступности в течение определенного промежутка времени.

Основное содержание процесса хранения и накопления информации состоит в создании, записи, пополнении и поддержании информационных массивов и баз данных в активном состоянии.

В результате реализации такого алгоритма, документ, независимо от формы представления, поступивший в информационную систему, подвергается обработке и после этого отправляется в хранилище (базу данных), где он помещается на соответствующую "полку" в зависимости от принятой системы хранения. Результаты обработки передаются в каталог.

Этап хранения информации может быть представлен на следующих уровнях:

Внешнем;

Концептуальном, (логическом);

Внутреннем;

Физическом.

Внешний уровень отражает содержательность информации и представляет способы (виды) представления данных пользователю в ходе реализации их хранения.

Концептуальный уровень определяет порядок организации информационных массивов и способы хранения информации (файлы, массивы, распределенное хранение, сосредоточенное и др.).

Внутренний уровень представляет организацию хранения информационных массивов в системе ее обработки и определяется разработчиком.

Физический уровень хранения означает реализацию хранения информации на конкретных физических носителях.

Способы организации хранения информации связаны с ее поиском операцией, предполагающей извлечение хранимой информации.

Хранение и поиск информации являются не только операциями над ней, но и предполагают использование методов осуществления этих операций. Информация запоминается так, чтобы ее можно было отыскать для дальнейшего использования. Возможность поиска закладывается во время организации процесса запоминания. Для этого используют методы маркирования запоминаемой информации, обеспечивающие поиск и последующий доступ к ней. Эти методы применяются для работы с файлами, графическими базами данных и т.д.

Рис. 1 Алгоритм процесса подготовки информации к хранению

Маркер метка на носителе информации, обозначающая начало или конец данных либо их части (блока).

В современных носителях информации используются маркеры:

Адреса (адресный маркер) код или физическая метка на дорожке диска, указывающие на начало адреса сектора;

Группы маркер, указывающий начало или конец группы данных;

Дорожки (начала оборота) отверстие на нижнем диске пакета магнитных дисков, указывающие физическое начало каждой дорожки пакета.

Защиты прямоугольный вырез на носителе (картонном пакете, конверте, магнитном диске), разрешающий выполнение любых операций над данными: запись, чтение, обновление, удаление и др.;

Конца файла метка, используемая для указания окончания считывания последней записи файла;

Ленты (ленточный маркер) управляющая запись или физическая метка на магнитной ленте, обозначающая признак начала или конца блока данных или файла;

Сегмента специальная метка, записываемая на магнитной ленте для отделения одного сегмента набора данных от другого сегмента.

Хранение информации в ЭВМ связано как с процессом ее арифметической обработки, так и с принципами организации информационных массивов, поиска, обновления, представления информации и др.

Важным этапом автоматизированного этапа хранения является организация информационных массивов.

Массив упорядоченное множество данных.

Информационный массив система хранения информации, включающая представление данных и связей между ними, т.е. принципы их организации.

Хранение информации осуществляется на специальных носителях. Исторически наиболее распространенным носителем информации была бумага, которая, однако, непригодна в обычных (не специальных) условиях для длительного хранения информации. Для ЭВТ по материалу изготовления различают следующие машинные носители: бумажные, металлические, пластмассовые, комбинированные и др.

По принципу воздействия и возможности изменения структуры выделяют магнитные, полупроводниковые, диэлектрические, перфорационные, оптические и др.

По методу считывания различают контактные, магнитные, электрические, оптические. Особое значение при построении информационного обеспечения имеют характеристики доступа к информации, записанной на носителе. Выделяют носители прямого и последовательного доступа. Пригодность носителя для хранения информации оценивается следующими параметрами: временем доступа, емкостью памяти и плотностью записи.

Таким образом можно заключить, что хранение информации представляет процесс передачи информации во времени, связанный с обеспечением неизменности состояния материального носителя.

Хранение информации

Информация, закодированная с помощью естественных и формальных языков, а также информация в форме зрительных и звуковых образов хранится в памяти человека. Однако для долговременного хранения информации, ее накопления и передачи из поколения в поколение используются носители информации .

Материальная природа носителей информации может быть различной: молекулы ДНК, которые хранят генетическую информацию; бумага, на которой хранятся тексты и изображения; магнитная лента, на которой хранится звуковая информация; фото- и кинопленки, на которых хранится графическая информация; микросхемы памяти, магнитные и лазерные диски, на которых хранятся программы и данные в компьютере, и так далее.

По оценкам специалистов, объем информации, фиксируемой на различных носителях, превышает один эксабайт в год (10 18 байт/год). Примерно 80% всей этой информации хранится в цифровой форме на магнитных и оптических носителях и только 20% - на аналоговых носителях (бумага, магнитные ленты, фото- и кинопленки). Если всю записанную в 2000 году информацию распределить на всех жителей планеты, то на каждого человека придется по 250 Мбайт, а для ее хранения потребуется 85 миллионов жестких магнитных дисков по 20 Гбайт.

Информационная емкость носителей информации. Носители информации характеризуются информационной емкостью, то есть количеством информации, которое они могут хранить. Наиболее информационно емкими являются молекулы ДНК, которые имеют очень малый размер и плотно упакованы. Это позволяет хранить огромное количество информации (до 10 21 битов в 1 см 3 ), что дает возможность организму развиваться из одной-единственной клетки, содержащей всю необходимую генетическую информацию.

Современные микросхемы памяти позволяют хранить в 1 см 3 до 10 10 битов информации, однако это в 100 миллиардов раз меньше, чем в ДНК. Можно сказать, что современные технологии пока существенно проигрывают биологической эволюции.

Однако если сравнивать информационную емкость традиционных носителей информации (книг) и современных компьютерных носителей, то прогресс очевиден. На каждом гибком магнитном диске может храниться книга объемом около 600 страниц, а на жестком магнитном диске или DVD - целая библиотека, включающая десятки тысяч книг.

Надежность и долговременность хранения информации. Большое значение имеет надежность и долговременность хранения информации. Большую устойчивость к возможным повреждениям имеют молекулы ДНК, так как существует механизм обнаружения повреждений их структуры (мутаций) и самовосстановления.

Надежность (устойчивость к повреждениям) достаточно высока у аналоговых носителей, повреждение которых приводит к потери информации только на поврежденном участке. Поврежденная часть фотографии не лишает возможности видеть оставшуюся часть, повреждение участка магнитной ленты приводит лишь к временному пропаданию звука и так далее.

Цифровые носители гораздо более чувствительны к повреждениям, даже утеря одного бита данных на магнитном или оптическом диске может привести к невозможности считать файл, то есть к потере большого объема данных. Именно поэтому необходимо соблюдать правила эксплуатации и хранения цифровых носителей информации.

Наиболее долговременным носителем информации является молекула ДНК, которая в течение десятков тысяч лет (человек) и миллионов лет (некоторые живые организмы), сохраняет генетическую информацию данного вида.

Аналоговые носители способны сохранять информацию в течение тысяч лет (египетские папирусы и шумерские глиняные таблички), сотен лет (бумага) и десятков лет (магнитные ленты, фото- и кинопленки).

Цифровые носители появились сравнительно недавно и поэтому об их долговременности можно судить только по оценкам специалистов. По экспертным оценкам, при правильном хранении оптические носители способны хранить информацию сотни лет, а магнитные - десятки лет.

Хранение и накопление являются одними из основных действий, осуществляемых над информацией и главным средством обеспечения ее доступности в течение некоторого промежутка времени. В настоящее время определяющим направлением реализации этой операции является концепция базы данных, склада (хранилища) данных.

База данных может быть определена как совокупность взаимосвязанных данных, используемых несколькими пользователями и хранящихся с регулируемой избыточностью. Хранимые данные не зависят от программ пользователей, для модификации и внесения изменений применяется общий управляющий метод.

Банк данных - система, представляющая определенные услуги по хранению и поиску данных определенной группе пользователей по определенной тематике.

Система баз данных - совокупность управляющей системы, прикладного программного обеспечения, базы данных, операционной системы и технических средств, обеспечивающих информационное обслуживание пользователей.

Хранилище данных (ХД - используют также термины Data Warehouse, «склад данных», «информационное хранилище») - это база, хранящая данные, агрегированные по многим измерениям. Основные отличия ХД от БД: агрегирование данных; данные из ХД никогда не удаляются; пополнение ХД происходит на периодической основе; формирование новых агрегатов данных, зависящих от старых - автоматическое; доступ к ХД осуществляется на основе многомерного куба или гиперкуба.

Альтернативой хранилищу данных является концепция витрин данных (Data Mart). Витрины данных - множество тематических БД, содержащих информацию, относящуюся к отдельным информационным аспектам предметной области.

Еще одним важным направлением развития баз данных являются репозитарии. Репозитарий, в упрощенном виде, можно рассматривать просто как базу данных, предназначенную для хранения не пользовательских, а системных данных. Технология репозитариев проистекает из словарей данных, которые по мере обогащения новыми функциями и возможностями приобретали черты инструмента для управления метаданными.

Каждый из участников действия (пользователь, группа пользователей, «физическая память») имеет свое представление об информации

По отношению к пользователям применяют трехуровневое представление для описания предметной области: концептуальное, логическое и внутреннее (физическое).

Концептуальный уровень связан с частным представлением данных группы пользователей в виде внешней схемы, объединяемых общностью используемой информации. Каждый конкретный пользователь работает с частью БД и представляет ее в виде внешней модели. Этот уровень характеризуется разнообразием используемых моделей (модель «сущность-связь», ER-модель, модель Чена), бинарные и инфологические модели, семантические сети).

Логический уровень является обобщенным представлением данных всех пользователей в абстрактной форме. Используются три вида моделей: иерархические, сетевые и реляционные.

Структура базовой информационной технологии.

Определим структуру и состав типовой ИТ. Мы будем называть типовую ИТ базовой , если она ориентирована на определенную область применения. Базовая ИТ создает модели, методы средства решения задач. Базовая ИТ создается на основе базовых (типовых) аппаратно-программных средств. Базовая ИТ подчинена основной цели - решению функциональных задач в своей предметной области (задачи управления, проектирования, научного эксперимента, испытания и т. д.).

На вход базовой ИТ как системы поступает комплекс решаемых задач, для которых должны быть найдены типовые решения с помощью методов и средств, присущих именно ИТ. Рассмотрим использование базовой ИТ на концептуальном, логическом и физическом уровнях.

Концептуальный уровень базовой ИТ - задается идеология автоматизированного решения задач. Типовая последовательность решения задач может быть представлена в виде алгоритма.

Рис. 2 . Концептуальная модель базовой ИТ.

Начальный этап - постановка задачи (ПЗ). Если эта задача автоматизированного управления, то она представляет собой совокупность взаимосвязанных алгоритмов, которые обеспечивают управление. ПЗ - содержательное описание задачи: целевое назначение задачи, экономико-математическая модель и метод ее решения, функциональная и информационная взаимосвязь с другими задачами. Оформляется документально в методических материалах «Постановка задачи и алгоритм решения». На этом этапе очень важна корректность описания с точки зрения критериев.

Следующий этап - формализация задачи (ФЗ). Разрабатывается математическая модель.

Если математическая модель установлена, следующий этап - алгоритмизация задачи (АЗ). Алгоритм - процесс преобразования исходных данных в искомое результат за конечное число шагов.

Реализация алгоритма на основе конкретных вычислительных средств осуществляется на этапе программирования задачи - ПРЗ. Это объемная задача, но она осуществляется как правило на типовых технологиях программирования.

При наличии программы осуществляется РЗ - решение задач - получение конкретных результатов для входных данных и принятых ограничений.

Этап АР - анализ решения. При анализе решения можно уточнить модель формализации задач.

Наиболее сложными, творческими и объемными являются этапы постановки задачи и ее формализации. Понятие первоначальной задачи - это глубокое понимание процессов в предметной области.

В условиях базовой ИТ глобальная задача - это разработка модели предметной области (МПО).

При реализации ИТ часто встречаются с плохо формализуемыми задачами. Тут приходят на помощь экспертные системы. В основу ЭС закладываются знания лучших экспертов в предметной области. Разработчик ЭС собирает все известные способы формализации данной задачи. Пользователь - разработчик данной ИТ - получает варианты решения задач. Это процесс автоматизирования проектирования ИТ.

Логический уровень создания ИТ. Модели базовой ИТ

На логическом уровне устанавливают модели решения задачи и организации информационных процессов. Если известна общая модель управления некой АСУ, в которую будет внедряться базовая ИТ, мы можем представить взаимосвязь моделей базовой ИТ.

Цель базовой ИТ на логическом уровне - построение модели решаемой задачи и ее реализация на основе организации информационных процессов.

Рассмотрим взаимосвязь моделей базовой ИТ на схеме.

Рис. 3 . Логический уровень базовой ИТ. Модель организации информационных процессов.

Модель решения задачи в условиях выбранной базовой ИТ согласуется с моделью организации информационных процессов (МОИП). МОИП включает в себя МОД (модель обработки данных), МО (модель обмена данными), МУПД (модель управления данными), МНД(модель накопления данных), МПЗ (модель представления знаний). Каждая из этих моделей отражает определенные информационные процессы и содержит базы построения частных матмоделей конкретного информационного процесса.

Модель обмена - оценивает вероятностно-временные характеристики процесса обмена с учетом маршрутизации (М), коммутации (К) и передачи (П) информации. В качестве воздействий в этом процессе участвуют: входные (потоки сообщений); мешающие (потоки ошибок), и управляющие (потоки управления). На основании этой модели синтезируют систему обмена данными, то есть выбирают технологию сети, метод оптимальной коммутации, маршрутизации.

Модель накопления данных МНД. Определяет схему информационной базы СИБ, устанавливает логическую организацию информационных массивов ОИМ, задает физическое размещение информационных массивов РИМ.

Информационный массив - основное понятие, основной элемент внутримашинного информационного обеспечения. ИМ - совокупность данных по группе однородных объектов, содержащих одинаковый набор сведений. ИМ могут включать информацию:

программы ОС и тестовые программы (обеспечивают работу ЭВМ);
прикладные программы (обеспечивают решение набора функциональных задач);
библиотека стандартных программ.

Типы информационных массивов:

постоянные (формируются до начала работы системы - директивные, справочные, нормативные данные - не изменяемые во времени);
промежуточные (возникают как результат предыдущего расчета и основа для следующего);
текущие (содержат рабочую информацию о состоянии управляемого объекта);
служебные (обслуживают остальные массивы);
вспомогательные (возникают при операциях над основными массивами).

По виду носителя ИМ делятся на массивы на машинных (внутренних и внешних) и немашинных носителях.

Особенность ИМ - его структура, способ упорядочивания данных по ключевым признакам. Записи могут упорядочиваться по возрастанию или убыванию значения ключевого признака. В качестве ключевого выбирается наиболее часто встречающийся признак.

Модель обработки данных МОД. Она определяет организацию вычислительных процессов ОВП для решения задач пользователя. Последовательность и процедуры решения вычислительных задач должны быть оптимизированы с точки зрения критериев: объем памяти, ресурсы, числа обращений и т. д. Организация процесса впрямую зависит от предметной области. При разработке базовой ИТ прежде всего следует правильно выбрать ОС. Именно ОС задает реальные возможности по управлению вычислительным процессом.

Структура вычислительного процесса задается числом задач. Очень важными являются требования к моменту запуска и выпуска (выхода результатов) задач. Эти моменты определяют динамику получения результатов, то есть динамику всего процесса управления производством.

Первые ОС были ориентированы на пакетную обработку информации. Этот режим в принципе не пригоден для задач управления большой размерности и оперативности. Переход к системам разделения времени позволил в условиях прерывания отдавать предпочтение приоритетным задачам. Оказалось возможным планировать вычислительный процесс.

Новые возможности для пользователя заложены в виртуальных ОС. Она позволила пользователю иметь неограниченный вычислительный ресурс, не замечая работы соседних пользователей. В условиях распределенной обработки данных возникают новые требования к вычислительному процессу. Требуется не только распределить вычислительный ресурс между пользователями и их вычислительными задачами, но и учесть топологию пользователей.

При создании моделей организации вычислительного процесса (ОВП) используют два возможных подхода: детерминированный и вероятностный. При детерминированном подходе применяется теория расписаний очередности задач при накладываемых ограничениях. К сожалению, в этот удобный метод вмешиваются случайные помехи. Могут возникнуть непредвиденные задачи, требующие срочного решения. Для них выделяются дополнительные интервалы времени. При вероятностном подходе устанавливает средний вычислительный ресурс, среднее время выполнения программы, усредненная производительность вычислительной системы. Усредненные параметры рассчитываются на основании статистических данных и постоянно корректируются.

Если мы склонны к типизации решаемых вычислительных задач для конкретной ИТ, то очень большое значение имеет разработка пакетов прикладных программ (ППП).

Среди моделей обработки данных следует еще упомянуть имитационные модели. С их помощью решаются задачи планирования организации вычислительного процесса.

Модель представления знаний МПЗ. Модели представления знаний являются основой автоматизированного решения задач управления. Модели представления знаний существуют в виде логического Л, алгоритмического А, семантического С, фреймового Ф и интегрального И представлений.

Модель управления данными МУПД. Управление данными - управление процессами накопления, обмена и обработки данных. Накопление данных сейчас происходит в условиях современных бах данных, при этом управляющее воздействие должны обеспечить ввод информации, обновление ее, размещение массивов в БД. Эти функции осуществляет современная СУБД.

С появлением ЭВМ данные накапливались в виде совокупности одинаково построенных записей - файлов. При решении каждой новой задачи создавались новые файлы. Логическая связь между файлами отсутствовала. Возникала проблема целостности данных. Для каждого обращения к файлам создавалась своя программа. Отдельные данные в файлах дублировались. Совершенствование вычислительной техники и одновременно рост объемов информации привели к появлению концепции баз данных. В БД записи взаимосвязаны, могут совместно использоваться для решения все новых задач.

В зависимости от решаемых задач выбираются модели баз данных.

Современное производство решает огромное количество рутинных информационных задач. Но и очень велико количество задач, требующих информацию для принятия решения. Для этого требуется новые подходы к формированию данных, вводу и выводу их, обработке. Эти новые подходы реализуются с помощью новых ИТ, реализующих их взаимную организацию. Этой организацией ведает модель управления данными. Модель базируется на том, что данные обладают относительной стабильностью. Стабильность структуры данных дает возможность строить базы со стабильной структурой. А получаемую информацию отображать в виде переменных значений данных в этой стабильной структуре.

В соответствии с моделью предметной области может быть сформирован класс данных для всех решаемых задач. На логическом уровне предметная БД включает в себя логические записи, их элементы и взаимосвязь между ними.

Сетевая модель является моделью объектов-связей, допускающей только бинарные связи «многие к одному» и использует для описания модель ориентированных графов.

Иерархическая модель является разновидностью сетевой, являющейся совокупностью деревьев (лесом).

Реляционная модель использует представление данных в виде таблиц (реляций), в ее основе лежит математическое понятие теоретико-множественного отношения, она базируется на реляционной алгебре и теории отношений.

Физический (внутренний) уровень связан со способом фактического хранения данных в физической памяти ЭВМ. Во многом определяется конкретным методом управления. Основными компонентами физического уровня являются хранимые записи, объединяемые в блоки; указатели, необходимые для поиска данных; данные переполнения; промежутки между блоками; служебная информация.

По наиболее характерным признакам БД можно классифицировать следующим образом:

по способу хранения информации:

интегрированные;
распределенные;

по типу пользователя:

монопользовательские;
многопользовательские;

по характеру использования данных:

прикладные;
предметные.

В настоящее время при проектировании БД используют два подхода. Первый из них основан на стабильности данных, что обеспечивает наибольшую гибкость и адаптируемость к используемым приложениям. Применение такого подхода целесообразно в тех случаях, когда не предъявляются жесткие требования к эффективности функционирования (объему памяти и продолжительности поиска), существует большое число разнообразных задач с изменяемыми и непредсказуемыми запросами.

Второй подход базируется на стабильности процедур запросов к БД и является предпочтительным при жестких требованиях к эффективности функционирования, особенно это касается быстродействия.

Другим важным аспектом проектирования БД является проблема интеграции и распределения данных. Господствовавшая до недавнего времени концепция интеграции данных при резком увеличении их объема, оказалась несостоятельной. Этот факт, а также увеличение объемов памяти внешних запоминающих устройств при их удешевлении, широкое внедрение сетей передачи данных способствовало внедрению распределенных БД. Распределение данных по месту их использования может осуществляться различными способами:

Копируемые данные. Одинаковые копии данных хранятся в различных местах использования, так как это дешевле передачи данных. Модификация данных контролируется централизованно;
Подмножество данных. Группы данных, совместимые с исходной базой данных, хранятся отдельно для местной обработки;
Реорганизованные данные. Данные в системе интегрируются при передаче на более высокий уровень;
Секционированные данные. На различных объектах используются одинаковые структуры, но хранятся разные данные;
Данные с отдельной подсхемой. На различных объектах используются различные структуры данных, объединяемые в интегрированную систему;
Несовместимые данные. Независимые базы данных, спроектированные без координации, требующие объединения.

Важное влияние на процесс создания БД оказывает внутреннее содержание информации. Существует два направления:

прикладные БД, ориентированные на конкретные приложения, например, может быть создана БД для учета и контроля поступления материалов;
предметные БД, ориентированные на конкретный класс данных, например, предметная БД «Материалы», которая может быть использована для различных приложений.

Конкретная реализация системы баз данных с одной стороны определяется спецификой данных предметной области, отраженной в концептуальной модели, а с другой стороны типом конкретной СУБД (МБД), устанавливающей логическую и физическую организацию.

Для работы с БД используется специальный обобщенный инструментарий в виде СУБД (МБД), предназначенный для управления БД и обеспечения интерфейса пользователя.

Основные стандарты СУБД:

независимость данных на концептуальном, логическом, физическом уровнях;
универсальность (по отношению к концептуальному и логическому уровням, типу ЭВМ);
совместимость, неизбыточность;
безопасность и целостность данных;
актуальность и управляемость.

Существуют два основных направления реализации СУБД: программное и аппаратное.

Программная реализация (в дальнейшем СУБД) представляет собой набор программных модулей, работает под управлением конкретной ОС и выполняет следующие функции:

описание данных на концептуальном и логическом уровнях;
загрузку данных;
хранение данных;
поиск и ответ на запрос (транзакцию);
внесение изменений;
обеспечение безопасности и целостности.

Обеспечивает пользователя следующими языковыми средствами:

языком описания данных (ЯОД);
языком манипулирования данными (ЯМД);
прикладным (встроенным) языком данных (ПЯД, ВЯД).

Аппаратная реализация предусматривает использование так называемых машин баз данных (МБД). Их появление вызвано возросшими объемами информации и требованиями к скорости доступа. Слово «машина» в термине МБД означает вспомогательный периферийный процессор. Термин «компьютер БД» - автономный процессор баз данных или процессор, поддерживающий СУБД.

Основные направления МБД:

параллельная обработка;
распределенная логика;
ассоциативные ЗУ;
конвейерные ЗУ;
фильтры данных и др.

Совокупность процедур проектирования БД можно объединить в четыре этапа. На этапе формулирования и анализа требований устанавливаются цели организации, определяются требования к БД. Эти требования документируются в форме, доступной конечному пользователю и проектировщику БД. Обычно при этом используется методика интервьюирования персонала различных уровней управления.

Этап концептуального проектирования заключается в описании и синтезе информационных требований пользователей в первоначальный проект БД. Результатом этого этапа является высокоуровневое представление информационных требований пользователей на основе различных подходов.

В процессе логического проектирования высокоуровневое представление данных преобразуется в структуре используемой СУБД. Полученная логическая структура БД может быть оценена количественно с помощью различных характеристик (число обращений к логическим записям, объем данных в каждом приложении, общий объем данных и т.д.). На основе этих оценок логическая структура может быть усовершенствована с целью достижения большей эффективности.

На этапе физического проектирования решаются вопросы, связанные с производительностью системы, определяются структуры хранения данных и методы доступа.

Весь процесс проектирования БД является итеративным, при этом каждый этап рассматривается как совокупность итеративных процедур, в результате выполнения которых получают соответствующую модель.

Взаимодействие между этапами проектирования и словарной системой необходимо рассматривать отдельно. Процедуры проектирования могут использоваться независимо в случае отсутствия словарной системы. Сама словарная система может рассматриваться как элемент автоматизации проектирования.

Этап расчленения БД связан с разбиением ее на разделы и синтезом различных приложений на основе модели. Основными факторами, определяющими методику расчленения, являются: размер каждого раздела (допустимые размеры); модели и частоты использования приложений; структурная совместимость; факторы производительности БД. Связь между разделом БД и приложениями характеризуется идентификатором типа приложения, идентификатором узла сети, частотой использования приложения и его моделью.

Модели приложений могут быть классифицированы следующим образом:

Приложения, использующие единственный файл.
Приложения, использующие несколько файлов, в том числе:

Допускающие независимую параллельную обработку;

Допускающие синхронизированную обработку.

Сложность реализации этапа размещения БД определяется многовариантностью. Поэтому на практике рекомендуется в первую очередь рассмотреть возможность использования определенных допущений, упрощающих функции СУБД, например, допустимость временного рассогласования БД, осуществление процедуры обновления БД из одного узла и др. Такие допущения оказывают большое влияние на выбор СУБД и рассматриваемую фазу проектирования.

Средства проектирования и оценочные критерии используются на всех стадиях разработки. Любой метод проектирования (аналитический, эвристический, процедурный), реализованный в виде программы, становится инструментальным средством проектирования, практически не подверженным влиянию стиля проектирования.

В настоящее время неопределенность при выборе критериев является наиболее слабым местом в проектировании БД. Это связано с трудностью описания и идентификации бесконечного числа альтернативных решений. При этом следует иметь в виду, что существует много признаков оптимальности, являющихся неизмеримыми, им трудно дать количественную оценку или представить их в виде целевой функции. Поэтому оценочные критерии принято делить на количественные и качественные. Наиболее часто используемые критерии оценки БД, сгруппированные в такие категории, представлены ниже.

Количественные критерии: время, необходимое для ответа на вопрос, стоимость модификации, стоимость памяти, время на создание, стоимость на реорганизацию.

Качественные критерии: гибкость, адаптивность, доступность для новых пользователей, совместимость с другими системами, возможность конвертирования в другую вычислительную среду, возможность восстановления, возможность распределения и расширения.

Трудность в оценке проектных решений связана также с различной чувствительностью и временем действия критериев. Например, критерий эффективности обычно является краткосрочным и чрезвычайно чувствительным к проводимым изменениям, а такие понятия, как адаптируемость и конвертируемость, проявляются на длительных временных интервалах и менее чувствительны к воздействию внешней среды.

Предназначение склада данных - информационная поддержка принятия решений, а не оперативная обработка данных. Потому база данных и склад данных не являются одинаковыми понятиями.

Основные функции репозитариев:

парадигма включения/выключения и некоторые формальные процедуры для объектов;
поддержка множественных версий объектов и процедуры управления конфигурациями для объектов;
оповещение инструментальных и рабочих систем об интересующих их событиях;
управление контекстом и разные способы обзора объектов репозитария;
определение потоков работ.

Рассмотрим кратко основные направления научных исследований в области баз данных:

развитие теории реляционных баз данных;
моделирование данных и разработка конкретных моделей разнообразного назначения;
отображение моделей данных, направленных на создание методов их преобразования и конструирования коммутативных отображений, разработку архитектурных аспектов отображения моделей данных и спецификаций определения отображений для конкретных моделей данных;
создание СУБД с мультимодельным внешним уровнем, обеспечивающих возможности отображения широко распространенных моделей;
разработка, выбор и оценка методов доступа;
создание самоописываемых баз данных, позволяющих применить единые методы доступа для данных и метаданных;
управление конкурентным доступом;
развитие системы программирования баз данных и знаний, которые обеспечивали бы единую эффективную среду как для разработки приложений, так и для управления данными;
совершенствование машины баз данных;
разработка дедуктивных баз данных, основанных на применении аппарата математической логики и средств логического программирования, а также пространственно-временных баз данных;
интеграция неоднородных информационных ресурсов.

А также другие работы, которые могут Вас заинтересовать
46498.		Эхинококкоз печени. Клиника, диагностика, методы хирургического лечение	17.71 KB
	Эхинококкоз печени. При перкуссии расширения границ печени.Периоды развития: латентный продромальных явлений прогрессивное увеличение печени период осложнений.
46499.		Анализ прибыли предприятия	17.72 KB
	Прибыль предприятия характеризует превышение если наоборот то убыток выручки над расходами является главным показателем эффективности деятельности и отражает цель предпринимательства. В зависимости способа вычисления и направлений распределения различают такие основные виды прибыли предприятия: валовую балансовую прибыль операционную прибыль прибыль от обычной деятельности и прибыль после налогообложения чистую прибыль.Валовая балансовая прибыль Gross Profit разность между чистым доходом от реализации продукции и себестоимостью...
46500.		Понятие и методы калькуляции затрат	17.86 KB
	Калькуляция служит основой для определения средних издержек производства и установления себестоимости продукции. Методы калькуляции это методы расчёта издержек производства себестоимости продукции объёма незавершённого производства основанные на калькуляции затрат. Попередельный метод калькуляции это метод исчисления себестоимости применяемый на предприятиях где исходный материал в процессе производства проходит ряд переделов или где из одних исходных материалов в одном технологическом процессе получают различные виды продукции....
46501.		Техническое диагностирование. Этапы комплексной диагностики участков МТ.	17.87 KB
	Основными задачами контроля и диагностики МТ являются определение технического состояния на основе комплексного мониторинга в процессе создания и эксплуатации системы оценка и прогнозирование динамики технического состояния с целью обеспечения надежной и безопасной эксплуатации газотранспортной системы. Контроль и мониторинг технического состояния трубопроводных систем включает: получение информации в предэксплуатационный период ранняя диагностика из проектных материалов включая материалы изысканий лабораторных исследований грунтов...
46502.		Диаграммы UML	17.91 KB
	Диаграммы UML. UML определяет следующие диаграммы: 1. Диаграммы применения use cse Или диаграммы вариантов использования Представляют собой граф из действующих лиц ctors и их взаимодействие с системой представленное сценариями применения. Диаграммы классов Cодержат набор статических декларативных элементов как например классы типы их связи объединенные в граф.
46503.		Обеспечение электробезопасности техническими способами и СЗ	17.91 KB
	При случайном прикосновении для обеспечения электробезопасности применяют: защитные оболочки защитные ограждения временные или стационарные безопасное расположение токоведущих частей изоляцию этих частей и РМ малое U защитное отключение предупредительную сигнализацию блокировку и знаки безопасности; а при прикосновении к нетоковедущим металлическим частям защитное заземление зануление выравнивание потенциала защитное отключение изоляцию нетоковедущих частей электроразделение сети малое U контроль электроизоляции и СИЗ....
46504.		Формы производственной деятельности фирмы	17.98 KB
	Различают три основные формы организации производства: Специализация Кооперирование Комбинирование Специализация производства Специализация производства выражается в том что каждое производство ограничивается изготовлением определённого вида конструктивной и технологически однородной продукции. Соответственно этому различают четыре вида специализации предприятий: предметную; подетальную иногда называют узловая; технологическую; по услугам вспомогательного производства. Подетальная специализация характеризуется...
46505.		Природа грамматического значения: общая характеристика, отношение к лексическому значению, функциональный статус	18.04 KB
	Природа грамматического значения: общая характеристика отношение к лексическому значению функциональный статус. Большинство слов обладает двумя значениями: лексическим и грамматическим. В области морфологии это общие значения слов как частей речи напр. значения предметности у существительных процессуальное у глаголов а также частные значения словоформ и слов в целом противопоставляемые друг другу в рамках морфологических категорий например значения того или иного времени лица числа рода.
46506.		Поверхностное упрочнение детали. Выбор метода поверхностного упрочнения	18.07 KB
	При обработке поверхности шлифованием и полированием устраняющей неровности которые служат концентраторами напряжений повышается усталостная прочность детали. Назначение метода упрочняющей обработки зависит от условий работы детали в машине и ее технологических особенностей. Деталь помещают внутри спирали индуктора или под проводником по которому пропускается переменный ток большой частоты; он вызывает появление вихревых токов на поверхности детали и быстро разогревает слой с наибольшей плотностью индуцированного тока.

Под хранением информации (от хранить – содержать в безопасности/целости ) следует понимать содержание информации во внешней памяти компьютера.

С хранением информации связаны такие понятия, как носитель информации (память), внутренняя память, внешняя память, хранилище информации. Носитель информации – это физическая среда, непосредственно хранящая информацию. Основным носителем информации для человека является его собственная биологическая память (мозг человека). Ее можно назвать внутренней памятью, поскольку ее носитель – мозг – находится внутри человека. Все прочие виды носителей информации можно назвать внешними (по отношению к человеку). Виды этих носителей менялись со временем от камня до бумаги. Развитие информационной техники привело к созданию магнитных, оптических и других современных видов носителей информации.

Хранилище информации – это определенным образом организованная совокупность данных на внешних носителях, предназначенная для длительного хранения и постоянного использования. Примерами хранилищ являются архивы документов, библиотеки, справочники, картотеки. Основной информационной единицей хранилища является определенный физический документ – анкета, книга, дело, досье, отчет и пр. Под организацией хранилища понимается наличие определенной структуры, т.е. упорядоченность, классификация хранимых документов. Такая организация необходима для удобства ведения хранилища: пополнения его новыми документами, удаления ненужных документов, поиска информации и пр.

Знания, хранящиеся в памяти человека, можно рассматривать как внутреннее хранилище информации, однако организацию этого хранилища нам понять трудно. Основное свойство человеческой памяти – большая скорость воспроизведения хранящейся в ней информации. Но по сравнению с внешними хранилищами человеческая память менее надежна. Поэтому для более надежного хранения человек использует внешние носители, организует хранилища информации.

Основные свойства хранилища информации – объем хранимой информации, надежность хранения, время доступа (т.е. время поиска нужных сведений), наличие защиты информации.

Информацию, хранимую на устройствах компьютерной памяти, принято называть данными. Организованные хранилища данных на устройствах внешней памяти компьютера принято называть базами данных.

В современных компьютерах основными носителями информации для внешней памяти служат магнитные и оптические диски. Рассмотрим, каким образом организуется хранение информации на магнитных дисках. Такой подход оправдан тем, что оптические диски для этой цели стали использоваться гораздо позже, а потому ради обеспечения совместимости с магнитными устройствами они во многом имитируют структуру последних.

Размещение информации на носителях. Обычный магнитный диск имеет две поверхности, пригодные для размещения информации, которые в технической литературе принято называть сторонами (side) диска. Учитывая, что в накопителях на жестких дисках на одной оси могут устанавливаться несколько дисковых пластин, общее количество сторон может быть и больше .

Каждую поверхность обслуживает собственная магнитная головка (head). Все головки собраны в единый механический блок и могут двигаться вдоль радиуса дисков, причем движение это является дискретным, т.е. головки занимают относительно диска только строго определенные положения. Наконец, каждая дорожка разделена на отдельные секторы (sector) (рис. 1.4). Сектор является неделимой порцией информации и может быть прочитан только целиком. Последней координатой информации на диске служит номер требуемого байта в секторе.

Итак, положение байта информации на магнитном диске определяется четырьмя “координатами”: номером стороны, номером дорожки диска, номером сектора и номером байта в нем. Такая система хранения данных сложна и требует определенных усилий по их извлечению. Поэтому созданы специальные программы, которые позволяют пользователю извлекать необходимые данные, не требуя от него знания всех этих координат.

Единицы хранения данных. При хранении данных решаются две проблемы: как сохранить данные в наиболее компактном виде и как обеспечить к ним удобный и быстрый доступ (если доступ не обеспечен, то это не хранение). Для обеспечения доступа необходимо, чтобы данные имели упорядоченную структуру, а при этом возникает необходимость дополнительно записывать адресные данные. Без них нельзя получить доступ к нужным элементам данных, входящих в структуру .

Поскольку адресные данные тоже имеют размер и тоже подлежат хранению, хранить данные в виде мелких единиц, таких, как байты, неудобно. Их неудобно хранить и в более крупных единицах (килобайтах, мегабайтах и т.п.), поскольку неполное заполнение одной единицы хранения приводит к неэффективности хранения.

В качестве единицы хранения данных принят объект переменной длины, называемый файлом. Файл – это последовательность произвольного числа байтов, обладающая уникальным собственным именем. Обычно в отдельном файле хранят данные, относящиеся к одному типу. В этом случае тип данных определяет тип файла.

В определении файла особое внимание уделяется имени. Оно фактически несет в себе адресные данные, без которых данные, хранящиеся в файле, не станут информацией из-за отсутствия метода доступа к ним. Кроме функций, связанных с адресацией, имя файла может хранить и сведения о типе данных, заключенных в нем. Для автоматических средств работы с данными это важно, поскольку по имени файла они могут автоматически определить адекватный метод извлечения информации из файла. Очевидно, что имя файла должно быть уникальным, так как это обеспечивает однозначность доступа к данным.

Понятие о файловой структуре. Хранение файлов организуется в иерархической структуре, которая в данном случае называется файловой структурой. В качестве вершины структуры служит имя носителя, на котором сохраняются файлы. Далее файлы группируются в каталоги (папки), внутри которых могут быть созданы вложенные каталоги (папки). Путь доступа к файлу начинается с имени устройства и включает все имена каталогов (папок), через которые проходит. В качестве разделителя используется символ “\” (обратная косая черта).

Уникальность имени файла обеспечивается тем, что полным именем файла считается собственное имя файла вместе с путем доступа к нему. Понятно, что в этом случае на одном носителе не может быть двух файлов с тождественными полными именами.

Пример записи полного имени файла:

<имя носителя>\<имя каталога1 >\...\<имя каталогаМ >\ <собственное имя файла>

Следует иметь в виду, что сектора с информацией одного файла совсем не обязательно располагаются по порядку в одном месте диска. При записи система активно использует свободные места, которые образуются при удалении ненужных файлов. В результате отдельные части файла вполне могут попасть в разные области диска, что будет заметно замедлять доступ к информации. Для устранения этого явления в состав операционных систем обычно входят специальные служебные программы дефрагментации файлов.

Такой подход к организации хранения данных исторически был обусловлен тем, что в качестве материального носителя данных использовались накопители на магнитных дисках. При этом поверхность диска, на которую осуществлялась запись данных, форматировалась: разбивалась на дорожки и сектора. Программы форматирования обеспечивали создание сектора объемом 512 байт. Таким образом, для записи данных, принадлежащих одному файлу, как правило, требуется нескольких секторов. На рисунке отчетливо видно, что сектора на внешних дорожках диска имеют больший размер, чем ближайшие к центру. Это дает основания считать, что данные дорожки должны записываться более надежно. Поэтому нулевая дорожка, которая служит для хранения наиболее важной системной информации, всегда размещается на внешнем кольце поверхности диска.

Человек хранит информацию в собственной памяти, а также в виде записей на различных внешних (по отношению к человеку) носителях: на камне, папирусе, бумаге, магнитных и оптических носителях и пр. Благодаря таким записям информация передается не только в пространстве (от человека к человеку), но и во времени - из поколения в поколение.

Разнообразие носителей информации

Информация может храниться в различных видах: в виде текстов, в виде рисунков, схем, чертежей; в виде фотографий, в виде звукозаписей, в виде кино- или видеозаписей. В каждом случае применяются свои носители. Носитель - это материальная среда, используемая для записи и хранения информации.

К основным характеристикам носителей информации относятся: информационный объем или плотность хранения информации, надежность (долговечность) хранения.

Бумажные носители

Носителем, имеющим наиболее массовое употребление, до сих пор остается бумага . Изобретенная во II веке н.э. в Китае, бумага служит людям уже 19 столетий.

Для сопоставления объемов информации на разных носителях будем пользоваться универсальной единицей - байт , считая, что один символ текста “весит” 1 байт. Книга, содержащая 300 страниц, при размере текста на странице примерно 2000 символов имеет информационный объем 600 000 байт, или 586 Кб. Информационный объем средней школьной библиотеки, фонд которой составляет 5000 томов, приблизительно равен 2861 Мб = 2,8 Гб.

Что касается долговечности хранения документов, книг и прочей бумажной продукции, то она очень сильно зависит от качества бумаги, от красителей, используемых при записи текста, от условий хранения. Интересно, что до середины XIX века (с этого времени в качестве бумажного сырья начали использовать древесину) бумага делалась из хлопка и текстильных отходов - тряпья. Чернилами служили натуральные красители. Качество рукописных документов того времени было довольно высоким, и они могли храниться тысячи лет. С переходом на древесную основу, с распространением машинописи и средств копирования, с использованием синтетических красителей срок хранения печатных документов снизился до 200–300 лет.

Магнитные носители

В XIX веке была изобретена магнитная запись. Первоначально магнитная запись использовалась только для сохранения звука. Самым первым носителем магнитной записи была стальная проволока диаметром до 1 мм. В начале XX столетия для этих целей использовалась также стальная катаная лента. Качественные характеристики всех этих носителей были весьма низкими. Для производства 14-часовой магнитной записи устных докладов на Международном конгрессе в Копенгагене в 1908 г. потребовалось 2500 км, или около 100 кг проволоки.

В 20-х годах прошлого века появляется магнитная лента сначала на бумажной, а позднее - на синтетической (лавсановой) основе, на поверхность которой наносится тонкий слой ферромагнитного порошка. Во второй половине XX века на магнитную ленту научились записывать изображение, появляются видеокамеры, видеомагнитофоны.

На ЭВМ первого и второго поколений магнитная лента использовалась как единственный вид сменного носителя для устройств внешней памяти. На одну катушку с магнитной лентой, использовавшейся в лентопротяжных устройствах первых ЭВМ, помещалось приблизительно 500 Кб информации.

С начала 1960-х годов в употребление входят компьютерные магнитные диски : алюминиевый или пластмассовый диск, покрытый тонким магнитным порошковым слоем толщиной в несколько микрон. Информация на диске располагается по круговым концентрическим дорожкам. Магнитные диски бывают жесткими и гибкими, бывают сменными и встроенными в дисковод компьютера. Последние традиционно называют винчестерами, а сменные гибкие диски - флоппи-дисками.

“Винчестер” компьютера - это пакет магнитных дисков, надетых на общую ось . Информационная емкость современных винчестеров измеряется в гигабайтах - десятки и сотни Гб. Наиболее распространенный тип гибкого диска диаметром 3,5 дюйма вмещает 2 Мб данных. Флоппи-диски в последнее время выходят из употребления.

В банковской системе большое распространение получили пластиковые карты. На них тоже используется магнитный принцип записи информации, с которой работают банкоматы, кассовые аппараты, связанные с информационной банковской системой.

Оптические носители

Применение оптического, или лазерного, способа записи информации начинается в 1980-х годах. Его появление связано с изобретением квантового генератора - лазера, источника очень тонкого (толщина порядка микрона) луча высокой энергии. Луч способен выжигать на поверхности плавкого материала двоичный код данных с очень высокой плотностью. Считывание происходит в результате отражения от такой “перфорированной” поверхности лазерного луча с меньшей энергией (“холодного” луча). Благодаря высокой плотности записи оптические диски имеют гораздо больший информационный объем, чем однодисковые магнитные носители. Информационная емкость оптического диска составляет от 190 до 700 Мб. Оптические диски называются компакт-дисками - CD.

Во второй половине 1990-х годов появились цифровые универсальные видеодиски DVD (D igital V ersatile D isk ) с большой емкостью, измеряемой в гигабайтах (до 17 Гб). Увеличение их емкости по сравнению с CD связано с использованием лазерного луча меньшего диаметра, а также двухслойной и двусторонней записи. Вспомните пример со школьной библиотекой. Весь ее книжный фонд можно разместить на одном DVD.

В настоящее время оптические диски (CD - DVD) являются наиболее надежными материальными носителями информации, записанной цифровым способом. Эти типы носителей бывают как однократно записываемыми - пригодными только для чтения, так и перезаписываемыми - пригодными для чтения и записи.

Флэш-память

В последнее время появилось множество мобильных цифровых устройств: цифровые фото- и видеокамеры, МР3-плееры, карманные компьютеры, мобильные телефоны, устройства для чтения электронных книг, GPS-навигаторы и многое другое. Все эти устройства нуждаются в переносных носителях информации. Но поскольку все мобильные устройства довольно миниатюрные, то и к носителям информации для них предъявляются особые требования. Они должны быть компактными, обладать низким энергопотреблением при работе и быть энергонезависимыми при хранении, иметь большую емкость, высокие скорости записи и чтения, долгий срок службы. Всем этим требованиям удовлетворяют флэш-карты памяти. Информационный объем флэш-карты может составлять несколько гигабайт.

В качестве внешнего носителя для компьютера широкое распространение получили флэш-брелоки (“флэшки” - называют их в просторечии), выпуск которых начался в 2001 году. Большой объем информации, компактность, высокая скорость чтения-записи, удобство в использовании - основные достоинства этих устройств. Флэш-брелок подключается к USB-порту компьютера и позволяет скачивать данные со скоростью около 10 Мб в секунду.

“Нано-носители”

В последние годы активно ведутся работы по созданию еще более компактных носителей информации с использованием так называемых “нанотехнологий”, работающих на уровне атомов и молекул вещества. В результате один компакт-диск, изготовленный по нанотехнологии, сможет заменить тысячи лазерных дисков. По предположениям экспертов приблизительно через 20 лет плотность хранения информации возрастет до такой степени, что на носителе объемом примерно с кубический сантиметр можно будет записать каждую секунду человеческой жизни.

Организация информационных хранилищ

Информация сохраняется на носителях для того, чтобы ее можно было просматривать, искать нужные сведения, нужные документы, пополнять и изменять, удалять данные, потерявшие актуальность. Иначе говоря, хранимая информация нужна человеку для работы с ней. Удобство работы с такими информационными хранилищами сильно зависит от того, как информация организована.

Возможны две ситуации: либо данные никак не организованы (такую ситуацию иногда называют кучей), либо данные структурированы . С увеличением объема информации вариант “кучи” становится все более неприемлемым из-за сложности ее практического использования (поиска, обновления и пр.).

Под словами “данные структурированы” понимается наличие какой-то упорядоченности данных в их хранилище: в словаре, расписании, архиве, компьютерной базе данных. В справочниках, словарях, энциклопедиях обычно используется линейный алфавитный принцип организации (структурирования) данных.

Крупнейшими хранилищами информации являются библиотеки. Упоминания о первых библиотеках относятся к VII веку до н.э. С изобретением книгопечатания (XV век) библиотеки стали распространяться по всему миру. В библиотечном деле имеется многовековой опыт организации информации.

Для организации и поиска книг в библиотеках создаются каталоги: списки книжного фонда. Первый библиотечный каталог был создан в знаменитой Александрийской библиотеке в III веке до н.э. С помощью каталога читатель определяет наличие в библиотеке нужной ему книги, а библиотекарь находит ее в книгохранилище. При использовании бумажной технологии каталог - это организованный набор картонных карточек со сведениями о книгах.

Существуют алфавитные и систематические каталоги. В алфавитных каталогах карточки упорядочены в алфавитном порядке фамилий авторов и образуют линейную (одноуровневую ) структуру данных . В систематическом каталоге карточки систематизированы по тематике содержания книг и образуют иерархическую структуру данных . Например, все книги делятся на художественные, учебные, научные. Учебная литература делится на школьную и вузовскую. Книги для школы делятся по классам и т.д.

В современных библиотеках происходит смена бумажных каталогов на электронные. В таком случае поиск книг осуществляется автоматически информационной системой библиотеки.

Данные, хранящиеся на компьютерных носителях (дисках), имеют файловую организацию. Файл подобен книге в библиотеке. Аналогично библиотечному каталогу операционная система создает каталог диска, который хранится на специально отведенных дорожках. Пользователь ищет нужный файл, просматривая каталог, после чего операционная система находит этот файл на диске и предоставляет пользователю. На первых дисковых носителях небольшого объема использовалась одноуровневая структура хранения файлов. С появлением жестких дисков большого объема стали использовать иерархическую структуру организации файлов. Наряду с понятием “файл” появилось понятие папки (см. “Файлы и файловая система ”).

Более гибкой системой организации хранения и поиска данных являются компьютерные базы данных (см. “Базы данных ”).

Надежность хранения информации

Проблема надежности хранения информации связана с двумя видами угроз для хранимой информации: разрушение (потеря) информации и кража или утечка конфиденциальной информации. Бумажные архивы и библиотеки всегда были подвержены опасности физического исчезновения. Огромный ущерб для цивилизации принесло разрушение упомянутой выше Александрийской библиотеки в I веке до н.э., поскольку большая часть книг в ней существовала в единственном экземпляре.

Основной способ защиты информации в бумажных документах от потери - их дублирование. Использование электронных носителей делает дублирование более простым и дешевым. Однако переход на новые (цифровые) информационные технологии создал новые проблемы защиты информации.

В процессе изучения курса информатики ученики приобретают определенные знания и умения, относящиеся к хранению информации.

Ученики осваивают работу с традиционными (бумажными) источниками информации. В стандарте для основной школы отмечается, что ученики должны научиться работать с некомпьютерными источниками информации: справочниками, словарями, каталогами библиотек. Для этого их следует ознакомить с принципами организации этих источников и с приемами оптимального поиска в них. Поскольку данные знания и умения имеют большое общеучебное значение, то желательно дать их ученикам как можно раньше. В некоторых программах пропедевтического курса информатики этой теме уделяется большое внимание.

Ученики должны овладеть приемами работы со сменными компьютерными носителями информации. Все реже в последнее время используются гибкие магнитные диски, на смену которым пришли емкие и быстрые флэш-носители. Ученики должны уметь определять информационную емкость носителя, объем свободного пространства, сопоставлять с ним объемы сохраняемых файлов. Ученики должны понимать, что для длительного хранения больших объемов данных наиболее подходящим средством являются оптические диски. При наличии пишущего CD-дисковода следует научить их организации записи файлов.

Важным моментом обучения является разъяснение опасностей, которым подвергается компьютерная информация со стороны вредоносных программ - компьютерных вирусов. Следует научить детей основным правилам “компьютерной гигиены”: осуществлять антивирусный контроль всех вновь поступающих файлов; регулярно обновлять базы антивирусных программ.

Виды носителей информации

Ленточные носители информации

Дисковые носители информации

Накопители на гибких магнитных дисках

Накопители на жестких магнитных дисках

Накопители на оптических дисках

Электронные носители информации

Хранение информации

От информации к данным

Оперативная память компьютера

Регенерация оперативной памяти

Дисковая память

Структура данных на диске

Файловые системы

FAT

FAT-32

NTFS

HPFS

NetWare File System

Linux Ext2 и Linux Swap

Каталоги и путь к файлу

Источники информации

Структура базовой информационной технологии.

Логический уровень создания ИТ. Модели базовой ИТ

А также другие работы, которые могут Вас заинтересовать

Разнообразие носителей информации

Организация информационных хранилищ

Надежность хранения информации