В пособии рассмотрены задачи и перспективы развития научной библиотеки в информационно-образовательном пространстве, вопросы информатизации библиотеки, развития и хранения информации, обмена информационными ресурсами между пользователями.
Составитель: зав. сектором компьютеризации информационно-библиотечных процессов М.А. Мухтанова
Технический редактор: А.П. Бенадыкова
1.Новые технологии в научной библиотеке
Основной объем знаний человечества хранится на печатных носителях, но недостаток бумажных изданий, высокая стоимость производства и распространения, быстрое старение приводит к тому, что печатные издания постепенно вытесняются электронными ресурсами. Среди последних большой интерес у пользователя вызывают полнотекстовые электронные ресурсы – цифровые коллекции виртуальных библиотек и баз данных.
Следствием этого является и изменение роли и имиджа библиотеки: она все чаще превращается в хранилище огромного и многообразного количества изданий на электронных носителях, обеспечивая тем самым преимущества в поиске информации, экономии времени пользователя, площадей хранения. Большинство университетских библиотек стремятся стать не только хранилищами первоисточников, но и реальными информационными центрами, которые обслуживают своих потребителей всем спектром информационных продуктов.
В структуре библиотек стали появляться особые отделы – медиатеки, интегрирующие возможности этих новых носителей информации в работу библиотеки, обеспечивающие комплексный характер информационного обслуживания посетителей. В распоряжении пользователей медиатеки ныне оказываются все доступные формы электронных изданий, важнейшими из которых являются мультимедийные диски.
За рубежом, например, во Франции еще в середине 90-х г. на стенах некоторых зданий появилось новое слово «медиатека». Так стали называться те библиотеки, которые, наряду с печатными изданиями, широко предоставляли своим пользователям другие средства информации -телевизоры, видео, аудио, слайды, музыкальные записи, компьютеры. При этом французские библиотекари исходят из того, что преимущество медиатек, по сравнению с обычными библиотеками, заключается в многоаспектности первых - в одних стенах объединена и библиотека, видеотека, видеозал и выставочный зал.
Создание медиатеки - одно из направлений развития современной вузовской библиотеки. Это новый имидж библиотеки, которая заботится о повышении информационной культуры пользователей.
Медиатека - это качественно новое, экономически и методически обоснованное обеспечение целей учебно-воспитательного процесса вуза. Это возможность приобщиться к совершенно новому виду самостоятельной учебной деятельности - работе с информацией не только вербальной, но и образной, конкретной и условной (текстовая, аудио- и видеоинформация, графическая, символическая).
2. Информационные ресурсы
Фонд библиотеки сформирован в соответствии с рабочими программами учебных дисциплин по специальностям, реализуемым в университете. В библиотеке университета можно найти следующие электронные информационные ресурсы:
- электронную базу данных на весь фонд библиотеки;
- электронную базу данных «Новые поступления»;
- комплекс учебно-методического обеспечения (учебно-методические пособия преподавателей, методические рекомендации, курсы лекций, лабораторные работы;
- юридическую базу данных - «Закон»;
- справочники и энциклопедии в электронном виде;
Информационные ресурсы библиотеки включают профильный фонд документов на бумажных носителях, электронную библиотеку, многоаспектный справочно-поисковый аппарат, в который входят 4 карточных каталогов, электронный каталог. Благодаря постоянной заботе руководства университета библиотека постоянно пополняется новыми изданиями. Ежегодно в фонд библиотеки поступают свыше 50 тыс. экз. новых научных и учебных изданий на бумажных и электронных носителях, а также постоянно пополняется новыми ресурсами, как приобретенными, так создаваемыми в библиотеке.
В 2006 году обновлен проект «Электронная библиотека ПГУ». В состав электронных изданий вошли электронные учебники, справочники, словари, авторефераты диссертаций, методические пособия, разработанные преподавателями ПГУ, электронные документы полученные из других органов информации, а также электронные приложения к книгам и журналам.
Оцифрованы ценные, малоэкземплярные издания, имеющие научное, культурное и историческое значение, справочники, статистические данные, методические пособия, периодические издания в помощь учебному процессу.
Сканирование осуществляется на книжном сканере ЭЛАР ПланСкан серии «А». Это современное устройство для сканирования, которое позво¬ляет эффективно оцифровывать необходимые документы и расширить масштабы электронного информационного фонда библиотеки.
На наш взгляд, оцифровка наиболее используемых изданий привлекательна, но влечет за собой проблемы авторского права, в этом случае сотрудниками сектора разработан договор с автором.
Формирование фондов электронных ресурсов в библиотеке отвечает по содержанию учебным планам. Сформировавшаяся структура ресурсов Интернета, содержащих актуальную для учебной деятельности информацию, увеличивает объем информационных ресурсов. Сайт библиотеки обеспечивает возможность предоставления и продвижения информации о библиотеке, информационных ресурсах, продукции и услугах.
Внутривузовские издания - пласт уникальной информации, постоянно используемый в рамках научного и учебного процессов. Создание их электронной версии стало приоритетным при создании Электронной библиотеки. С повсеместным внедрением Интернета появилась возможность восполнить пробел в комплектовании библиотеки зарубежными научными изданиями и выйти на новый уровень информационного обслуживания. Сотрудники научной библиотеки проводят поиск электронных ресурсов в Интернете по различным направлениям научной и учебной деятельности университета. Важно не только иметь информационные ресурсы и обеспечить доступ к ним, но и информировать пользователей об их существовании.
Научная библиотека размещает на сайте и в образовательном портале университета свои электронные ресурсы: «Бюллетень новых поступлений», «Виртуальные выставки», цель которых презентация новой литературы, поступившей в фонд университетской библиотеки.
На сайте в разделе «Информация» перед виртуальными посетителями раскрывается актуальная информация: объявление о выставках, о днях кафедр, о днях информации и массовых мероприятиях, которые систематически организуются в стенахбиблиотеки. На основе предоставленных на сайте сведений пользователь может составить исчерпывающую картину информационного потенциала и принять решение о необходимости посещения библиотеки в наиболее удобное время.
Основные, базисные свойства электронных ресурсов:
- дискретность;
- машиночитаемость;
- однородность массива данных, безотносительно к характеристикам отражаемого объекта (черно-белый или цветной, одномерный или многомерный, текст или звук и т.п.);
- зависимость от программно-аппаратного обеспечения (в том числе электропитание, компьютеры, общесистемные и специальные
программы) для использования электронных ресурсов;
- способность к совмещению разнородной информации (мультимедийные ресурсы);
- способность к клонированию, то есть к созданию абсолютно идентичных копий ресурса;
- возможность дистанционного управления электронными ресурсами (обработка, копирование, пересылка и т.д.);
- возможность организации контроля и устранения ошибок в массивах данных.
Виды электронных ресурсов по отношению к печатным:
электронные ресурсы, не имеющие печатных аналогов (электронная почта, домашние страницы и другие материалы веб-сайтов, дискуссионные группы в Интернете, некоторые научные и популярные журналы, базы данных, мультимедийные материалы, специфические виды рекламы, вирусы и т.п.);
электронные ресурсы, созданные для поддержки имеющихся печатных ресурсов, например, для обеспечения сохранности или
расширения и улучшения обслуживания пользователей (в частности, организация мультидоступа для спрашиваемых изданий путем предоставления в множественный доступ их электронных аналогов), и подлежащие долговременному хранению (электронные
книги, цифровые версии печатных документов и т.п.);
электронные ресурсы, создаваемые на короткий срок в технологических целях на основе печатных ресурсов, не предназначенные для долговременного хранения или подлежащие уничтожению после однократного использования (электронные справки, квитанции и т.д.).
В последние годы многие научные библиотеки Казахстана активно внедряют прогрессивные технологии производства и распространения информации, позволяющие оперативно обеспечивать ею пользователей в том объеме и формате, которые соответствуют их потребностям.
Многие вузовские библиотеки в целях информационной поддержки образования и науки сформировали систему электронных ресурсов, которую составляют базы данных (БД) на государственном, русском и иностранных языках, электронные учебные материалы (статичные или автономные публикации, выпущенные в качестве отдельных объектов на СD-RОМ).
Рассмотрим опыт использования электронных ресурсов в информа¬ционном обслуживании пользователей в научной библиотеке ПГУ им.
С.Торайгырова.
Научная библиотека ПГУ начала формировать фонд изданий на электронных носителях параллельно с автоматизацией библиотечных процессов в 1998 году. В рамках проекта была заложена материальная база (приобретены: компью¬терный парк, специализированное программное обеспечение, проложена локальная сеть научной библиотеки, приобретены первые издания на элек¬тронных носителях информации, составившие основу фонда электронных документов.
Следующим этапом в обеспечении читателей доступом к электронным ресурсам было подключение библиотеки к Интернету, что существенно расширило возможности поиска новейшей информации. На сегодняшний день фонд насчитывает около 3 тысяч наименований (на внешних носителях информации СD-RОМ и хранящихся на файл-сервере научной библиотеки). Доступ к ним осуществляется в зале электронных ресурсов библиотеки, открытом в 2001 году. К услугам читателей установлено 8 персональных компьютеров. Также для обеспечения более широких возможностей в поиске информации, все компьютеры зала подключены к сети Интернет.
Стабильным спросом у студентов пользуются электронные приложения к книгам и журналам, в которых материал дается с таблицами, схемами, описаниями. Оперативно осуществляется поиск в электронных энциклопедиях, словарях и справочниках на СD-RОМ, при работе с которыми можно получить необходимую информацию для подготовки докладов, сообщений, рефератов и курсовых работ, воспользоваться предложенным иллюстративным материалом.
Имеющиеся в библиотеке БД условно можно разделить на три блока:
- первый блок - правовая БД, которая представлена в библиотеке справочно-поисковой системой «Заң».
- второй блок - коллекция БД научной библиотеки на внешних носителях информации и хранящиеся на файл-сервере библиотеки. Для удобного поиска информации интересующей читателей ведется электронный каталог (ЭК), все электронные ресурсы на внешних носителях поступающие в библиотеку вносятся в ЭК. ЭК научной библиотеки ПГУим.С. Торайгырова создается с 1998 года, и реализовывался последовательно с помощью таких информационных систем как «Библиотека 4.02», «Библиотека 5». На данный момент приобретена программа ИРБИС- 64.
-третий блок - on-line издания, доступные читателям посредством сети Интернет.
Использование электронных ресурсов в обслуживании пользователей способствует увеличению информационной составляющей учебно-воспитательного и научного процессов университета, содействует развитию системы дистанционного обучения, воспитывает у студентов навыки самообразования.
В то же время существуют определенные проблемы, общие для многих библиотек: необходимость проведения процедуры тендеров и котировок, что значительно увеличивает трудозатраты библиотеки в приобретении электронных изданий; недостаток текущего финансирования, которое не всегда обеспечивает высокоскоростное подключение к Интернет. Недостаток текущего финансирования и тендерная система комплектования фонда, также закрывают возможность подключения к западным - on-line БД, Еlsevire, ЕВSСО и т.д., в целом включающим в себя большую часть мировых научных изданий. Стоимость подключения к таким БД исчисляется сотнями тысяч тенге, но, несмотря на высокую стоимость доступа к этим БД, стоимость литературы, содержащейся в них значительно выше, если приобретать ее на традиционных носителях. Не имея доступа к таким полнотекстовым БД, мы не можем своевременно получать информацию, публикующуюся в зарубежных научных изданиях. В сложившейся ситуации существует несколько возможных выходов.
Во-первых, можно рассмотреть вариант приобретения коллективного доступа к коммерческим on-line БД для всех научных библиотек ВУЗов Казахстана.
Кроме недостатка финансирования приобретения доступа к полнотекстовым БД существует еще и законодательная проблема, научные библиотеки приобретают литературу, в том числе и электронные ресурсы, на тендерной основе. В условиях слаборазвитого собственного рынка электронных ресурсов сложно найти одно и тоже издание, представленное в разных книготоргующих организациях. Доступ к on-line БД можно приобрести только у официальных представителей их разработчиков, соответственно стоимость такого доступа определяется разработчиком. Таким образом, комплектовать фонд библиотеки электронными изданиями с использованием тендерной системы закупок практически невозможно.
Несмотря на это, можно с уверенностью сказать, что использование электронных ресурсов в библиотеке с каждым годом будет возрастать, а спектр оказываемых с их помощью услуг - расширяться.
3. Электронные ресурсы
Электронные ресурсы включают полнотекстовые базы данных образовательного назначения:
-Электронная библиотека полнотекстовых баз данных:
- «Президент»
- «Павлодарское Прииртышье»
- «Фонд редких книг»
- «Профессиональная пресса»
- «Труды академиков НАН РК уроженцев Павлодарской области»
- «Учебно-методические издания ПГУ»
Электронная библиотека является систематизированным собранием образовательных и научных ресурсов, электронных журналов, электронных копий традиционных книг и периодических изданий.
Поиск производится по следующим критериям:
- автору;
- заглавию;
- предметной рубрике;
- ключевым словам.
- БД «Заң Закон»
Электронный свод законодательных и нормативно - правовых актов государства на казахском и русском языках. База данных комплектуется только из официальных источников, что позволяет обеспечить исключительную достоверность нормативного материала.
Имеются областные программы, решения, постановления местных органов власти по областям РК. Эту базу предоставил Республиканский центр правовой информации (РЦПИ).
-БД «Информационно-поисковая система «Казпатент».
Информационно-поисковая система «Казпатент» предназначена для выполнения следующих задач: поиск изобретений и полезных моделей по номерам патентов и предпатентов, номерам заявок, датам подачи заявок, наименованиям, авторам и патентообладателям. Данная информационно-поисковая система большую помощь оказывает, прежде всего, дипломникам технических специальностей и изобретателям.
БД «Полнотекстовая БД «EBSCOhost»
Проект Электронная информация для библиотек (EIFL Direct) и базы данных EBSCO host позволяет получить доступ к крупнейшим в мире базам данных зарубежных периодических изданий, в т. ч к более 4000 полнотекстовых научных журналов на языке оригинала.
В ON-Line режиме доступны: научные академические базы данных в области гуманитарных наук Academic Search Elite и Business Source Premier; базы данных популярных периодических изданий общей направленности MasterFile Premier, Newspaper Source; медицинская база данных Medline с полными текстами. Каждая из баз данных обладает поисковой системой для поиска требуемой информации по ключевым словам.
Электронная библиотека. Структура и основные элементы. Формирование фонда электронных документов учебной библиотеки.
Понятие «электронная библиотека» определяется как упорядоченная система электронных материалов и технологий по обеспечению их накопления, сохранности, поиска и передачи пользователям.
Электронная библиотека университета предназначена для обеспечения студентов необходимыми учебными и учебно-методическими материалами в электронном виде. Фонды библиотеки формируются в соответствии с рабочими программами учебных дисциплин по специальностям университета.
Электронная библиотека размещена на файловом сервере локальной сети библиотеки университета, которая является частью сети Интернет университета.
Доступ к ресурсам возможен при авторизации пользователей, имеющих учетную запись в соответствующей базе данных, идентификация производится по имени и паролю. Студенты и преподаватели получают логин и пароль для доступа к электронному каталогу и полнотекстовым ресурсам локальной сети при записи в библиотеку.
Выбранную информацию можно сохранить на локальный носитель.
Структура и содержание Электронной библиотеки определяются базовыми принципами создания информационных систем - одноразовая обработка документа (источника) и многократное его использование.
Электронная библиотека постоянно дополняется и развивается, обеспечивая полноту информационной поддержки учебного процесса. Учитывая уже существующий опыт по сбору электронных документов для электронной библиотеки, библиотекойпринято методическое решение - принимать для пополнения коллекции только монографии, учебники, методические пособия и другие материалы, имеющие научную ценность.
Достоверность, полноту, сохранность и защиту электронных образовательных ресурсов, архивирование, резервное копирование осуществляет отдел информатизации университета.
Электронная библиотека является частью информационно-образовательной среды университета и реализует на своем уровне информационную поддержку образовательных и научных процессов университета, обеспечивает определенный набор сервисов, навигации и поиска.
Этапы разработки информационно-поисковой системы «Электронная библиотека»:
1. Создание оболочки ИПС. Создание баз данных для хранения и обработки информации
2. Создание связей ИПС к документам
3. Создание БД, содержащих основную информацию
Наполнение массива электронной библиотеки производится путем перевода в электронную форму печатных оригиналов из фондов библиотек республики и получением копий электронных документов от авторов, из издающих организаций и Интернета. Информационный поиск в ЭБ максимально прост и основан на использовании самого популярного метода- поиска по ключевым словам.
Цели создания электронной библиотеки
В рамках национальной задачи формирования в Казахстане информационного общества и интеграции в международное информационное общество путем обеспечения свободного доступа пользователей к разнообразным информационным ресурсам создание электронной библиотеки НБ им. академика С.Бейсембаева направлен на достижение следующих целей:
• обеспечение доступности документов, предоставление которых читателям затруднено или ограничено (редких книг, фотоальбомов, рукописных книг, диссертаций, архивов, недоступных большинству библиотек, и т. п.);
• обеспечение доступа к информации, существующей исключительно в электронной форме;
• предоставление пользователям качественно новых возможностей работы с большими объемами машиночитаемых данных;
• целенаправленное информационное обеспечение различных областей науки, культуры, образования путем создания и предоставления полнотекстовых баз данных в режиме теледоступа.
Ожидаемые результаты:
- единая база данных (фонд), содержащая электронные документы с единым пользовательским интерфейсом доступа из одной точки ко всем коллекциям, составляющим базу данных ЭБ.
- система метаданных ЭБ, в первую очередь -электронный каталог.
- технология надежного накопления, сохранения и использования электронных документов.
Электронная библиотека ПГУ им.С.Торайгырова – это распределенная информационная система, позволяющая надежно накапливать, сохранять и эффективно использовать разнообразные коллекции электронных изданий и документов, доступные в удобном для пользователей виде через глобальные сети передачи данных. Электронная библиотека является частью библиотеки университета и представляет собой комплекс разнородных электронных массивов информации и электронных средств доступа.
Электронная библиотека формируется и работает в соответствии с Законами Республики Казахстан «Об образовании», «О сертификации», нормативными документами МОН РК, межгосударственными и международными стандартами ПГУ, Положением о ЭБ. Электронная библиотека обеспечивает оперативное информационное и библиотечное обслуживание студентов, слушателей и сотрудников университета, предоставляет пользователям доступ к электронным информационным ресурсам, в соответствии с «Правилами пользования Электронной библиотекой».
Структура и состав фонда Электронной библиотеки ПГУ им.С Торайгырова включает в себя следующие информационные разделы:
Электронный каталог фонда библиотеки ПГУ им.С Торайгырова:
• информация о книгах, журналах, учебно-методических материалах, имеющихся в библиотеке университета.
Электронные издания
• Издания НИЦ ПГУ им. С. Торайгырова.
Электронные аналоги (версии) печатных изданий, подготовленные преподавателями и сотрудниками ПГУ и изданные НИЦ ПГУ. Издания НИЦ являются собственностью ПГУ им.С Торайгырова.
• Документы УМК
Электронные документы учебно-методического назначения, подготовленные преподавателями и сотрудниками ПГУ для организаций учебного процесса. Документы УМК являются собственностью ПГУ.
• Инициативные документы
Электронные издания и документы учебно-методического назначения, подготовленные преподавателями и сотрудниками ПГУ в инициативным порядке. Инициативные документы являются собственностью авторов.
• Аналоги изданий
Электронные издания – аналоги печатных изданий из фонда НБ ПГУ им. академика С. Бейсембаева, созданные с использованием методов сканирования. Порядок предоставления аналогов изданий определён в подразделе 5.6.
• Сторонние издания
Электронные издания и документы, авторы которых не являются преподавателями и сотрудниками ПГУ.
• Издания и документы на электронных носителях, приобретенные в книготорговых и книгоиздающих организациях, а также организациях – поставщиках электронных изданий и документов.
• Электронные издания и документы из Интернета, к которым предоставлен свободный доступ.
Основными способами комплектования Электронной библиотеки полнотекстовыми документами являются:
• получение электронных документов из внешних источников;
• сканирование текстов;
• создание электронных документов, не имеющих “бумажных” аналогов;
Для представления полных текстов в Электронную библиотеку используются:
• форматы DOC, RTF, PDF;
• форматы для изображений TIFF, JPEG;
• гипертекстовый язык разметки HTML.
СУБД функционирует под управлением ОС Linux 11 на сервере HP Proliant DL 580.
Электронные библиотеки Казахстана: управление и координация
Сегодня очень острой является проблема эффективности использования и обеспечения доступности документов, которые хранятся в библиотечных фондах. Решить эту проблему предполагается путем компьютеризации библиотек, в том числе создав единую информационную структуру, которая бы охватывала библиотеки на базе использования современных информационных технологий. Основные направления координации научных библиотек Казахстана области информационного обеспечения образования и науки: формирование и использование информационных ресурсов, обслуживание пользователей, создание сводного электронного каталога, других баз данных и т.д. Научные библиотеки являются не только потребителями внешней информации: они сами генерируют информационные ресурсы.
Министерством образования и науки Республики Казахстан совместно с Ассоциацией научно-образовательной компьютерной сети Казахстана «КазРЕНА» разработаны Рекомендации по созданию Республиканской межвузовской электронной библиотеки (РМЭБ). Подписан меморандум о создании РМЭБ с 45 вузами Казахстана. В настоящее время к сети «КазРЕНА» подключены высшие учебные заведения шести областей Казахстана, в т.ч. Павлодарский государственный университет им. С.Торайгырова. В связи с тем, что, Ассоциация вузов РК приступила к разработке компьютерной программы РМЭБ для оперативного обмена информацией, в ЭБ вуза сотрудниками сектора из книжного и журнального фонда вуза вводятся полные тексты учебников, учебных пособий, научных и методических материалов и опубликованных научных работ ученых вуза, необходимые для учебного процесса. ЭБ пополняется путем сканирования вышеперечисленных источников и ввода электронных учебников.
Критериями отбора электронных ресурсов для РМЭБ являются подлинность электронного ресурса, полезность и значимость информации для учебного процесса и научных исследований, идентичность с бумажными аналогами, возможность воспроизведения информации без дополнительного программного обеспечения.
Обновление электронного каталога производится сотрудниками сектора самостоятельно и один раз в месяц передается по электронной почте на главный сервер РМЭБ. Работа ведется совместно с отделом технического сопровождения информатизации университета.
4 Основные способы создания электронных ресурсов
Мы рассматриваем ниже лишь весьма ограниченный ряд примеров и возможностей создания цифровых ресурсов: технология меняется очень быстро, и важно иметь общее представление, а не увлекаться деталями.
4.1. Набор текстов вручную на клавиатуре или клавиатурный ввод данных. Можно выделить два направления клавиатурного ввода данных.
Создание авторских текстов. В основном это творческая работа. До широкого внедрения планшетных устройств с распознаванием рукописных текстов все новые тексты, как правило, создаются именно так (в том числе — данный учебник).
Набор или повтор имеющихся текстов. Фактически — работа машинистки. Ручная набивка текста (равно как и перенабивка) — очень трудоемкий процесс, тем не менее он до сих пор широко применяется
4.2. Конверсия печатного материала в электронный формат. Существует несколько синонимов для обозначения этого процесса: "оцифровывание" или сканирование. Оцифровка чаще всего осуществляется сканированием печатных или рукописных материалов.
4.3. Изготовление цифровых фото- или аудио/видеоматериалов с помощью цифровых фотоаппаратов, видеокамер, других оптико-электронных технических средств создания электронных ресурсов. Этот процесс очень близок к сканированию: изображение разбивается на небольшие участки (пиксели), яркость и цвет которых фиксируется.
Сканирование и обработка документа при помощи программы ABBY Fine Reader 8.0
Сканирование (от английского scan — поле зрения, развертка, разложение изображения) — управляемое пространственное перемещение какого-либо луча или пучка по определенному закону". Процесс, по сути, аналогичен процессу создания изображения на телевизионном экране или компьютерном мониторе, только осуществляется "в обратном направлении
- Откройте крышку сканера и поместите картинку на стекло лицевой стороной вниз. Закройте крышку.
- Запустите FineReader (Start>Programs>ABBY FineReader 8.0 или Desktop>ABBY FineReader 8.0 Shortcut).
Перед Вами откроется окно программы FineReader 8.0, которое выглядит следующим образом:
Рис.4. 1. Главное окно программы FineReader 8.0 |
Процесс оцифровки документов состоит из четырех этапов: 1) сканирование, 2) распознавание, 3) проверка, 4) сохранение результатов распознавания (Рис.4.2)
Рис. 4.2. Панель Scan&Read программы FineReader 8.0 |
После нажатия на кнопку Сканировать, загрузится окно программы драйвера сканера и начнется процесс сканирования. При этом Вы увидите картинку предварительного просмотра.
Внимание! При работе с разными сканерами окно приложения может выглядеть по-разному. У сканера HP ScanJet 3690 оно выглядит так:
Рис. 4.3. Окно поставляемого приложения управлением сканером |
- Выделите область, подлежащую сканированию. Для этого очертите ее на экране с помощью мыши. Выделяемая область, при этом, помечается пунктирной линией (Рис. 4.3). Выделив необходимую область, продолжите сканирование, нажав на кнопку (Accept) Принять.
По окончании процесса сканирования окно программы драйвера сканера автоматически закроется, и работа с отсканированным изображением продолжится в программе ABBY Fine Reader 8.0.
В результате сканирования появится окно Изображение, содержащее "фотографию" страницы.
- Перед тем, как начать распознавание страницы необходимо вручную разбить изображение на блоки: текст, таблицы, рисунки, формулы (если имеются).
- Затем необходимо перейти к процессу распознавания полученного изображения, нажав на кнопку Распознать. Обработанные участки изображения закрашиваются голубым цветом.
Внимание! Перед тем, как начать распознавание текста, необходимо выбрать язык распознавания :казахский- русский-английский.
- Результат распознавания Вы увидите в окне Текст. В этом же окне Вы можете проверить и отредактировать распознанный текст (кнопка Проверить).
- После предварительной проверки полученного текста, Вы можете сохранить распознанный текст в Word или сохранить весь пакет на диск, чтобы продолжить обработку и сканирование в другое время (команда Сохранить).
- Если Вам нужно получить итоговое изображение просто в виде «фотографии», то после процесса сканирования нет необходимости в распознавании и можно сразу сохранить изображения в виде графического файла формата JPEG, используя стандартную команду Save image as (Сохранить рисунок как) в меню Файл.
Формат электронной версии документов
4.4. Полученный документ необходимо сохранить в формате DOC или PDF.
4.5 Имя файла должно состоять из латинских букв. Вместо пробела должно стоять нижнее подчеркивание. Имя файла включает: автор, название, сиглу библиотеки (avtor_nazvanie_nlkr).
Отправка электронных документов
Подготовленный документ необходимо выслать руководителю проекта по электронной почте rafikova_s@mail.auca.kg либо на электронном носителе по адресу: г. Бишкек, ул. Абдумомунова, 205. Библиотека АУЦА, к. 103.
Сканированные книги — это файлы, хранящие целые электронные изображения каждой страницы книги. Такие файлы делаются путём сканирования бумажной книги постранично и дальнейшей обработки с целью улучшения качества и уменьшения размеров файла. Поскольку каждая страница хранится в виде ряда точек (растра), то такие книги можно кратко называть растровыми, чтобы отличить их от векторных. Основные форматы, употребляющиеся для растровых файлов, это PDF и DJVU. В этих форматах можно добавить также и распознанный текст, закладки и гиперссылки, чтобы были возможны быстрые переходы по книге и автоматический поиск текста. Поэтому качественно сделанные растровые книги не менее удобны в использовании, чем векторные, и несущественно проигрывают им в качестве распечатанного текста. Типичный размер растровой книги — от 5 (редко) до 10—15 килобайт на страницу, в зависимости от разрешения и качества текста или иллюстраций.
Производство векторной электронной книги из бумажной книги путём компьютерного распознавания (OCR) связано с колоссальными затратами труда, особенно если книга содержит много иллюстраций, графиков, диаграмм, таблиц, или формул, ибо нынешнее состояние распознавательных программ заставляет форматировать всё это вручную, и нередко — исправлять ошибки распознавания текста. Поэтому для таких книг гораздо легче делать именно растровые, а не векторные электронные версии. Даже в чисто текстовых книгах — без иллюстраций, таблиц или формул — автоматическое распознавание порой даёт трудновыявимые ошибки. Гораздо быстрее приготовить растровую электронную книгу, тем более что современная технология сжатия изображений позволяет делать файлы вполне приемлемого размера. Например, средний размер растровых книг, включая распознанный текст — 13 КБ на страницу. Это означает, что растровая книга, имеющая 400 страниц, в среднем занимает около 5 МБ (цифры приводятся для формата DJVU). На стандартном ДВД-носителе (4,3 ГБ) может поместиться около 900 таких книг. Некоторые программы позволяют делать файлы формата PDF, в которых весь плохо распознанный материал содержится в виде отсканированных картинок, а текст является векторным. Такие PDF файлы однако сильно проигрывают чисто растровым книгам и по внешнему виду (нестыковка векторных шрифтов и фрагментов изображения страницы), и по размеру файлов.
Правовые аспекты
По существующим в большинстве стран законам, книги являются объектами одновременно авторского и имущественного права. Имущественное право — это право на распространение и продажу книги, а также право на любое копирование или даже бесплатное распространение через Интернет. Автор книги имеет особые права, такие, как требовать признания авторства или заключать контракты с издателями. Если данная книга является объектом имущественного права, это означает, что её нельзя копировать или вообще как-либо распространять (даже бесплатно) без разрешения правообладателя.
На каждой книге среди выходных данных указаны обладатели имущественного права и, соответственно, ограничения на распространение книги. Однако имущественное право на книги имеет конечный срок давности, — это обычно 50 лет (в некоторых странах 75 лет) после смерти автора и 75 лет (в США — 95 лет) со времени публикации книги. В России и других странах бывшего СССР имеет место особая ситуация с книгами, вышедшими до 1971 года, поскольку лишь в 1971 году СССР вступил в международную конвенцию по авторским правам. Поэтому книги, вышедшие в СССР до 1971 года, как правило (есть и исключения), не являются больше объектами имущественного права. Книги, изданные в США до 1924 года включительно, или в Европе до 1932 года включительно, тоже, как правило, уже больше не являются объектами имущественного права.
Законной является оцифровка книг, права на которые истекли, или книг, авторы и издатели которых разрешают их свободное распространение через Интернет или другим образом (например, если автор выложил на Интернет-странице электронную книгу после того, как издательство вернуло ему все имущественные права). Учтите, что законом запрещается оцифровывать или копировать (в том числе через бесплатные или платные Интернет-сайты) электронные книги, являющиеся в настоящее время объектами имущественного права. Хранение таких электронных книг на вашем личном компьютере уже является копированием и также запрещено, за исключением того случая, если вы сами купили эту книгу у издательства в электронном виде. Даже если у вас есть купленный вами бумажный экземпляр какой-либо книги, защищенной имущественным правом, закон запрещает вам изготавливать оцифрованную версию этой книги или хранить на своём компьютере где-либо взятую оцифрованную версию, если только вы сами не купили электронную книгу у издательства, дополнительно к бумажному экземпляру.
Мы призываем вас знать и соблюдать законы той страны, где вы живете, и оцифровывать только материалы, не являющиеся объектами имущественных прав. Данное руководство по оцифровке книг имеет чисто технический характер и не может рассматриваться как инструкция по нарушению закона. Ссылки на Интернет-источники предоставляются только в целях ознакомления с техникой оцифровки.
Основные моменты сканирования
Есть два основных метода сканирования: целым разворотом и по одной странице. При любом методе части страницы, где находится текст, должны быть полностью прижаты к стеклу — иначе возникает характерное затемнение в области корешка из-за наклонного падения света лампы подсветки (в любых сканерах) и размывание текста из-за малой глубины резкости (только в CIS-сканерах). Поэтому практически невозможно хорошо отсканировать книги, которые плохо открываются. (Существует, однако, специальный сканер OpticBook 3600, позволяющий сканировать книгу, открытую на 90 градусов. Этот сканер пока имеет драйверы только под Windows.) При сканировании разворотом, если книга полностью не влезает на стекло, может возникать дополнительное размытие текста на краю страницы из-за того, что текст не прижат к стеклу (только в CIS-сканерах). Всё это необходимо тестировать перед началом сканирования и определить оптимальный метод.
Необходимо также определить оптимальную рамку сканирования и контрастность. Это можно подобрать только методом проб и ошибок, но это необходимо подобрать правильно перед сканированием. Желательно также сразу же установить гамму и точки белого и чёрного, если это позволяет софт Вашего сканера.
Класть книгу абсолютно ровно, без перекосов, у Вас всё равно не получится, но это и не нужно, так как выравнивание можно проделать автоматически специальным софтом на стадии обработки сканов. Разрезание отсканированных разворотов и выравнивание полей тоже делается почти автоматически.
Иногда имеет смысл сделать ксерокс с книги и сканировать этот ксерокс. Дело в том, что в ксерокс-машинах гораздо больше глубина резкости, чем у сканеров, и поэтому удаётся скопировать участки текста, прилегающие к корешку книги, даже если книга плохо раскрывается. Кроме того, ксероксы специально делают повышение контрастности изображения, что позволяет избавиться от серого фона страниц и максимально уменьшить затемнение в середине разворота.
Софт для управления сканером можно использовать любой, например VueScan (есть для Windows / Linux), Irfan View (Windows), XnView (Windows), gimp/sane (Linux). Поддержка сканеров для Linux/Mac гораздо хуже, потому что как правило все производители делают драйверы только для Windows.
Обработка отсканированных изображений
После сканирования необходимо просмотреть все страницы и убедиться, что нет явных огрехов. Например, иногда по недосмотру книга неровно легла на стекло сканера и часть текста на какой-либо странице не отсканировалась, или были вовсе пропущены некоторые страницы. После этого можно архивировать отсканированные изображения и приступать к обработке. Поскольку сканирование — физически самый трудоёмкий этап, рекомендуется держать резервную копию всех исходных сканов (такими, какими они были до обработки) на случай какого-либо сбоя.
Каковы главные задачи обработки? Они зависят от того, ставим ли мы целью создание векторного файла или растрового файла. Для создания векторного файла производится распознавание текста и его дальнейшее редактирование вручную в текстовом процессоре (таком, как MS Word или Adobe Pagemaker). Конечным продуктом обычно является сверстанная книга в формате PDF. Для создания растрового файла необходима доводка графических изображений до высокой степени сжатия и качества, а распознавание (OCR) производится лишь начерно, без вычитки и правки текста, в самом конце процесса. Обработка графических изображений производится обычно в пакетном режиме, так что не требуется обрабатывать каждую страницу вручную в Photoshope или другом графическом редакторе. Поэтому затраты времени на создание растровой электронной книги гораздо меньше, чем на создание векторной книги.
Графическая обработка сканов состоит из следующих основных шагов:
• преобразование серых сканов в черно-белые (если исходные сканы были серыми в 300 dpi, то после этого получаются черно-белые в 600 dpi)
• разрезание разворотов на два изображения отдельных страниц (если книгу сканировали в развороте)
• поворот изображения каждой страницы, чтобы текст стал по возможности горизонтальным
• отрезание ненужных тёмных полос на краях, создание ровных и одинаковых для всех страниц белых полей
• вычищение «грязи» на страницах (включая помарки от руки, штапмы и прочее)
Эти шаги частично автоматизированы в программе «Scan Kromsator» (Windows) и описаны в инструкции «Scan and Share». Однако если Scan Kromsator показался для вас слишком сложным, вы можете воспользоваться Scan Tailor (ссылка на неё внизу страницы).
После создания чистовой версии всех страниц книги, которые пока что хранятся в отдельных графических файлах, приступают к сжатию всех страниц в единый файл формата DJVU или PDF.
Файлы PDF и DJVU могут использовать разные степени сжатия. Наибольшее сжатие достигается в формате DJVU (алгоритм JBIG2), если текст черно-белый, отсканирован четко (это сильно зависит от физического состояния исходной книги), шрифт не слишком мелкий, а края букв ровные (не рваные). Формат PDF позволяет сжимать как алгоритмом JBIG2 (при этом размер получается на 20—30% больше, чем размер DJVU), так и менее эффективными алгоритмами, например TIFF-G4. Размер PDF файла после сжатия PDF/TIFF-G4 примерно в 4—8 раз больше, чем у PDF/JBIG2.
Имеются программы для создания хорошо сжатых DJVU и PDF/JBIG2 файлов. Для формата DJVU это коммерческие программы от LizardTech: DjvuSolo и Djvu Document Editor. Для формата PDF это коммерческая версия Adobe Acrobat (не Reader). Есть и бесплатные программы для создания DJVU и PDF/JBIG2, но они пока не дают настолько хорошего сжатия, как коммерческие версии. Полубесплатная программа CPCtool, используемая как промежуточный этап перед окончательным сжатием, позволяет несколько улучшить сжатие DJVU (10—30%) и во многих случаях сгладить «лохматые» контуры букв.
Оборудование для оцифровки документов
Для оцифровки бумажных документов и книг стандартно используются:
обычные планшетные сканеры,
специальные документные сканеры,
книжные сканеры.
В зависимости от назначения, требующейся производительности и цены используются различные типы сканеров:
- планшетные — для листа размером А4, пожалуй, самые простые и недорогие (в пределах 100 долларов), работают с единичным листовым материалом.
В более сложных моделях используется автоподача листов, что в 2—3 раза увеличивает стоимость сканера:
- барабанные, которые удобнее для работы с большим количеством листового материала;
- планетарные -предназначены для работы с переплетенными документами. Специальное устройство (колыбель), в котором книга лежит не полностью открытой, позволяет обеспечивать сохранность редких изданий.
Книги, чертежи, карты, различные документы на планшетном сканере сканируются "лицом вниз", что создает ряд проблем. При сканировании книг и журналов полученное изображение имеет широкую темную полосу на месте сгиба страниц в переплете. Если полоса перекрывает текст, то он становится нечитаемым на изображении. Если при позиционировании книги или другого объекта "лицом вниз" страницы оказались согнутыми или перекошенными, то и на полученном изображении это будет отображено.
Толстые книги непригодны для такого сканирования вообще, так как их невозможно развернуть в плоскость сканирования, не повредив переплет. Обычный планшетный сканер офисного класса позволяет сканировать книги толщиной до 2-3 сантиметров с реальной скоростью порядка 1 разворот (т.е. 2 страницы) в минуту. Для интенсивной оцифровки книг и больших массивов документов традиционный планшетный сканер - недорогое, но алоэффективное решение.
При этом сканер обычного формата А4 позволит сканировать книги формата не более, чем А5 (15 х 21 см). Для сканирования документов большего формата, чем этот, придется использовать значительно более дорогой сканер формата А3.
Значительно ускорит работу специальный документный сканер, имеющий скоростную планшетную часть - как, например, Fujitsu fi-4220C2, fi-4340C (формат А4) или fi-4640S, fi-5750C (формат А3).
Оцифровка книг с планшета документного сканера позволяет получить реальную скорость сканирования до 20-25 страниц в минуту. При этом оператор должен перелистывать страницы и укладывать книгу разворотом вниз, стараясь разместить ее на стекле без перекосов.
Если книгу, журнал, подшивку документов расшить на отдельные страницы (что допустимо далеко не всегда), то скорость сканирования можно увеличить до многих десятков страниц в минуту при использовании автоподатчика. Для такого высокоскоростного автоматического сканирования применяются сканеры Fujitsu fi-5110C, fi-4120C2 (формат А4) или fi-4530C, fi-4860 Ultra, M4099D (формат А3).
Наиболее профессиональным решением проблемы сканирования книг, журналов, подшивок газет, других документов является применение специализированных книжных сканеров Zeutschel OMNISCAN, Kodak Filemaster+, ЭЛАР ПланСкан.