(499) 236-8067
Москва, Ленинский пр-т, д.4
support@libermedia.ru
Комплексные решения для библиотек
Главная / Публикации / Структура формата записи RUSMARC

НазадСтруктура формата записи RUSMARC

МИНИСТЕРСТВО КУЛЬТУРЫ РОССИЙСКОЙ ФЕДЕРАЦИИ
РОССИЙСКАЯ БИБЛИОТЕЧНАЯ АССОЦИАЦИЯ

РОССИЙСКИЙ КОММУНИКАТИВНЫЙ ФОРМАТ
ПРЕДСТАВЛЕНИЯ БИБЛИОГРАФИЧЕСКИХ ЗАПИСЕЙ В МАШИНОЧИТАЕМОЙ ФОРМЕ

Структура формата


3.1 Структура

Российский коммуникативный формат, как и UNIMARC, реализует библиографическую запись в машиночитаемой форме в структуре международного стандарта ISO 2709. Каждая библиографическая запись, подготовленная для обмена, должна содержать:

- МАРКЕР ЗАПИСИ, состоящий из 24-х символов;
- СПРАВОЧНИК, состоящий из 3-х цифровой метки для каждого поля данных, указания длины поля и позиции начального символа, относящегося к первому полю данных;
- ПОЛЯ ДАННЫХ переменной длины, отделенные друг от друга разделителем поля;

Общая структура:

МАРКЕР ЗАПИСИ СПРАВОЧНИК ПЕРЕМЕННЫЕ ПОЛЯ %
% - Разделитель записи

ISO 2709 устанавливает, что данным в поле могут предшествовать индикаторы; кроме того, поля могут подразделяться на подполя. Российский коммуникативный формат, как и UNIMARC, использует следующие положения, установленные Международным стандартом ISO 2709:

3.2 Маркер записи

ISO 2709 предписывает, что каждая запись начинается с 24-х символьного МАРКЕРА ЗАПИСИ. Он содержит данные, относящиеся к структуре записи, определения которых даются в стандарте ISO 2709, а также некоторые элементы данных, выделенные ISO 2709 для особого применения. Эти элементы данных, определяемые при применении, связаны с типом записи, ее библиографическим уровнем и положением в иерархии уровней, степенью полноты записи и использованием правил ISBD или других правил подготовки записи, основанных на ISBD. Элементы данных в МАРКЕРЕ ЗАПИСИ предназначены прежде всего для обработки записи и только косвенно - для идентификации самого библиографического документа.

3.3 Справочник

За Маркером записи следует СПРАВОЧНИК. Каждая статья справочника состоит из трех частей: 3х-цифровой метки, 4х-значного числа, указывающего длину поля данных, и 5ти-значного числа, указывающего позицию начального символа. Другие символы в статье справочника не допускаются.

СПРАВОЧНИК:

1-ая статья справочника 2-ая статья Другие статьи  
Метка Длина поля Позиция начального символа  
............... @
@ - Разделитель поля

Первая часть каждой статьи справочника - метка поля. Вторая часть статьи справочника определяет число символов в поле, на которое указывает метка, приведенная в первой части статьи. В это число включаются все символы - индикаторы, идентификаторы подполей, текстовые или кодированные данные и разделитель полей. Третья часть статьи справочника содержит позицию первого символа поля относительно позиции первого символа той части записи, которая содержит переменные поля. Первый символ первого переменного поля имеет символьную позицию 0. Положение символьной позиции 0 внутри записи задается позициями символов 12-16 Маркера записи.
Длина метки поля - 3 символа, длина элемента "длина поля данных" - 4 символа, длина элемента "позиция начального символа" - 5 символов. После всех 12-ти-символьных статей справочника, соответствующих каждому полю записи, справочник заканчивается разделителем поля IS2 по ISO 646 (1/14 в 7ми-битной кодовой таблице). Иллюстрации Маркера и Справочника и их положения относительно полей данных - см. в Приложении L. Статьи справочника упорядочены по первой цифре метки. Рекомендуется при упорядочении использовать, где это возможно, метку целиком. Для самих полей данных определение порядка не является необходимым, так как их положение полностью определяется через справочник.

3.4 Переменные поля

Поля данных переменной длины следуют за справочником и содержат библиографические данные (в отличие от данных общей обработки, содержащихся в маркере).

Переменное (контрольное) поле (00-):

Данные @

Переменное поле (от 01– до 999):

Индикаторы Идентификаторы подполя  
Другие подполя
Инд.1 Инд.2 $a (и т. д.) Данные Данные .................. @

Метки не содержатся в полях данных, а приводятся только в справочнике. Исключение делается для меток во Встроенных полях (см. блок 4--). Поля с меткой 00- ( такие как 001) состоят только из данных и разделителя поля. Остальные поля данных состоят из двух индикаторов и следующим за ними любым количеством подполей. Каждое подполе начинается с идентификатора подполя, который состоит из разделителя подполя IS1 (1/15 по ISO 646) и кода подполя (буквенного или цифрового символа), идентифицирующего подполе. За идентификаторами подполя следуют кодированные или текстовые данные произвольной длины, не превышающей указанной в начале описания поля. за последним символом данных в записи следует символ конца поля IS2, и далее - символ конца записи IS3 (1/13 по ISO 646).

3.5 Обязательные поля

Набор обязательных в записи Российского коммуникативного формата полей соответствует списку обязательных полей UNIMARC.

3.5.1. Поля, обязательные для всех записей

001 ИДЕНТИФИКАТОР ЗАПИСИ
100 ДАННЫЕ ОБЩЕЙ ОБРАБОТКИ
200 ЗАГЛАВИЕ И СВЕДЕНИЯ ОБ ОТВЕТСТВЕННОСТИ (подполе $a обязательно для каждой записи)
801 ИСТОЧНИК ЗАПИСИ

3.5.2. Поля, обязательные для отдельных типов записей

Записи для документов, содержащих текстовую информацию

101 ЯЗЫК ДОКУМЕНТА

Записи для картографических материалов

120 ПОЛЕ КОДИРОВАННЫХ ДАННЫХ: КАРТОГРАФИЧЕСКИЕ МАТЕРИАЛЫ - ОБЩИЕ ХАРАКТЕРИСТИКИ
123 ПОЛЕ КОДИРОВАННЫХ ДАННЫХ: КАРТОГРАФИЧЕСКИЕ МАТЕРИАЛЫ - МАСШТАБ И КООРДИНАТЫ
206 ОБЛАСТЬ СПЕЦИФИЧЕСКИХ СВЕДЕНИЙ: КАРТОГРАФИЧЕСКИЕ МАТЕРИАЛЫ - МАТЕМАТИЧЕСКИЕ ДАННЫЕ

Записи для электронных ресурсов

230 СПЕЦИФИЧЕСКИЕ ХАРАКТЕРИСТИКИ МАТЕРИАЛА: ЭЛЕКТРОННЫЕ РЕСУРСЫ
300 ОБЩИЕ ПРИМЕЧАНИЯ (для ЭР – примечание об источнике основного заглавия)

3.5.3. Обязательные поля и ретроспективная конверсия В случае, если ранее созданные записи не содержат достаточной информации для обязательных полей, там, где это возможно, должно использоваться значение по умолчанию. Если использовать значение по умолчанию невозможно, допускается использование символа-заполнителя. В крайнем случае поле может не включаться в запись, но этот факт должен быть обязательно отмечен в сопроводительной документации при обмене записями (см. Прил. K).

Пример

101 |#$aund

    Программа конвертирования не может корректно сгенерировать код языка документа на основании имеющихся данных.

3.6 Длина записей

Длина записи, которая ограничена в формате 99 999 символами, согласуется участниками обмена.

3.7 Связь записей

Российский коммуникативный формат, как и UNIMARC, предусматривает технику установления связи между записями. Для этих целей резервируется блок полей 4--. Более подробная информация приведена в описании этих полей и во введении к блоку 4--.
Связываемое поле включает библиографические данные, относящиеся к другому документу, с указанием или без указания информации об идентификаторе записи, в которой описан этот документ. Поле связи состоит из подполей, каждое из которых содержит метку, индикаторы, идентификаторы и содержание полей, включая идентификаторы подполей. Встроенные поля не доступны через Справочник, так как точку входа в Справочник имеет только поле связи целиком.

3.8 Наборы символов

Для обмена данными в Российском коммуникативном формате, как и в формате UNIMARC, используются стандарты ISO на наборы символов. Маркер записи, справочник, индикаторы, идентификаторы подполя и кодовые обозначения, указанные в данном документе, должны кодироваться с использованием управляющих функций и графических символов по ISO 646 (IRV), который рассматривается как набор по умолчанию для записи. Техника расширения кода, указанная в ISO 2022, используется, когда в записи требуется множество наборов. Позиции символов 26-29 и 30-33 подполя $a в поле 100 используются для определения наборов по умолчанию и дополнительных наборов графических символов, используемых в записи. Наборы символов должны быть зарегистрированы ISO, но также могут быть предметом договора между участниками обмена.

Во всех случаях используются следующие управляющие функции ISO 646, принятые для записи в Российском коммуникативном формате:

IS1 по ISO 646 (позиция 1/15 7ми-битовой кодовой таблицы): первый символ двухсимвольного идентификатора подполя.
IS2 по ISO 646 (позиция 1/14 7ми-битовой кодовой таблицы): разделитель поля находится в конце справочника и каждого поля данных.
IS3 по ISO 646 (позиция 1/13 7ми-битовой кодовой таблицы): разделитель записи находится в конце каждой записи.

Когда необходимы дополнительные наборы символов, обычно используется управляющая функция ESC по ISO 646. Две управляющие функции по ISO 6630, используемые при сортировке, также допустимы в данных UNIMARC. Приложение J Руководства по UNIMARC дает дополнительную информацию по наборам символов, использующимся в UNIMARC.

3.9 Повторение данных

Возможно четыре случая повторения данных в различных формах:

  • Данные приводятся в кодированной и в текстовой форме, выводимые и не выводимые на экран дисплея.
    По возможности обе формы данных должны приводиться в записи, даже если в исходном формате информация приводится лишь единожды.

  • Документ содержит одинаковую информацию на разных языках.
    ISBD устанавливает, когда и как параллельные данные каталогизируемого документа должны включаться в запись. Это реализовано в UNIMARC с использованием различных, в том числе повторяющихся, подполей. Примеры см. поле 200.

  • При каталогизации используется более чем один язык для многоязычной аудитории пользователей.
    Использование более одного языка каталогизации (например, в полях примечаний) удобно, а в некоторых случаях обязательно в локальном формате. Записи UNIMARC подготавливаются на одном языке, поскольку агентства - пользователи, получая записи на нескольких языках, часто вынуждены исключать информацию на других языках, кроме своего "рабочего" языка. Допускается наличие отдельных записей на нескольких языках или формирование разноязычных обменных массивов на отдельных магнитных лентах.

  • Некоторая информация, повторяемая в различной графике, для представления вариантов сложных случаев вывода данных.
    В идеальном случае каталогизационная запись составляется с использованием графики описываемого документа. На практике это не всегда представляется возможным. В связи с этим необходим механизм, позволяющий представить сведения в каталогизационной записи как в оригинальной графике, так и в транслитерации, с тем чтобы при обмене принимающее агентство могло выбрать вариант, наиболее отвечающий его потребностям. Соответствующий механизм описан в п.3.10.

3.10 Цифровые подполя

Следующие цифровые подполя определены для использования в библиографическом формате:

Подполе Описание Примечание
$1 Данные связи 4--; 604
$2 Системный код Фингерпринт 012
$2 Код системы 0--; 102; 5--; 6--; 852
$2 Код формата 801; 886
$2 Текст ссылки 856
$3 Номер авторитетной записи 6--; 7--
$4 Код отношений 6--; 7--
$5 Организация, к которой относится поле 2--; 3--; 5--; 6--; 7--
$6 Связь между полями все блоки
$7 Графика поля все блоки
$8 Зарезервировано  
$9 Подполе для локального использования  

3.11. Обработка альтернативной графики

Для альтернативных графических представлений в полях 001-099 и 200-899 используются те же определители содержания. Все поля формата будут считаться повторяемыми для записи альтернативных графических представлений или написаний вне зависимости, указаны они как повторяющиеся или нет в основной части текста. Поля, указанные как неповторяемые, должны использоваться не более одного раза для каждого альтернативного графического представления / написания, включенного в запись.

В каждое поле, повторенное для записи альтернативного графического представления / графики, включаются подполе $6 (Связь между полями) и, если требуется, подполе $7 (Графика поля). Особые инструкции по использованию подполей $6 и $7 следующие:

$6 Связь между полями
Подполе содержит информацию, позволяющую при обработке данных связать поле с другими полями в записи. Подполе также содержит код, указывающий на причину связи. При использовании подполя первые два элемента в подполе (позиции символов 0-2) должны присутствовать всегда, третий элемент (позиции символов 3-5) необязателен. Таким образом, длина этого подполя может быть 3 или 6 символов.
Подполе $6, как правило, является первым подполем в поле (за исключением случаев, когда ему предшествует подполе $3 Номер авторитетной / нормативной записи) и предшествует любому $7.
Следует заметить, что если альтернативное графическое изображение / графика связаны с другим языком, то такие параллельные данные следует помещать в авторитеный / нормативный файл. Если такое решение по каким-либо причинам не подходит возможно использовать поля национального / локального применения, предназначенные для записи параллельных данных (например, 790, 791).

Факультативное.
Не повторяется.

Данные, приводимые в подполе $6, записываются следующим образом:

Наименование элемента данных Количество символов Позиция символа
Код, объясняющий связь 1 0
Номер связи 2 1-2
Метка связываемого поля 3 3-5

$6/0 Код, объясняющий связь
Код указывает причину установления связи между полями. Определены следующие значения:

a = альтернативное графическое представление / графика
z = другая причина для связи

$6/1-2 Номер связи
Номер из двух цифр приводится в подполе $6 каждого из полей, связанных друг с другом. Его функция состоит в осуществлении подбора связываемых полей; номер связи не предназначен для использования в качестве порядкового номера. Номер связи может присваиваться произвольно, с условием, что будет идентичным в каждом из взаимосвязанных полей и отличаться от любых других пар или групп связанных полей в данной записи.

$6/3-5 Метка связываемого поля
Элемент состоит из 3х-символьной метки связываемого поля. Элемент является факультативным. Если метки для обоих связываемых полей идентичны, они обычно опускаются.

$7 Графика поля
Подполе содержит код для алфавита и/или графики основного содержания поля. Кодовые значения те же, что и для поля 100 подполя $a позиции символов 34-35 Графика заглавия. Это подполе обычно опускается в полях с тем же алфавитом / графикой, коды которых приведены в позициях символов 34-35 поля 100.
Подполе должно размещаться в поле непосредственно перед первым подполем данных (например $a). Подполе $7 обычно следует за подполем $6, кроме тех случаев, когда отсутствует параллельное поле и, следовательно, подполе $6.
Следуя предложениям ISO 2022 Секция 1 ("Коды, определяющие наборы символов, созданы чтобы использоваться для данных, которые обрабатываются последовательно в прямом порядке.") следует предположить, что символы вводятся в логическом порядке. Когда данные, например, на арабском языке или на иврите, вводятся в порядке, который предполагает, что они должны читаться справа налево, то это должно быть отмечено кодом "/r" после кода графики. ISO 2022 Секция 1 также устанавливает, что "Использование этих кодов в строке данных, обрабатываемых в любом другом порядке или включенных в данные, отформатированные для обработки записи фиксированной длины, может иметь нежелательные результаты или может потребовать специального дополнительного толкования для обеспечения корректной интерпретации"

Необходимо понимать, что указание графики в подполе $7 не может использоваться в качестве инструкции системе для корректной обработки данных. Для того, чтобы обеспечить правильное и однозначное интерпретирование графики системой, необходимо использовать механизм, описанный в Приложении J Руководства по UNIMARC.

Факультативное.
Не повторяется.

Примеры

Пример 1.

100 ##$a позиции символов 34-35 = ba [латинская]
600 #0$6a01$a[Имя лица в латинизированной форме]
600 #0$6a01$7ea$a[Имя лица в китайском написании]

Два параллельных поля, содержащих латинскую и китайскую формы имени лица, деятельность которого является предметом описания определенного материала. Первое поле не имеет $7, так как значение его приводится в том же алфавите, который указан в позициях символов 34-35 поля 100, то есть "ba" (латинский).

Пример 2.

100 ##$a позиции символов 34-35 = ka [корейская]
200 1#$6a01$a[Заглавие в символах корейской графики]
200 1#$6a01$7ba$a[Заглавие в латинизированной форме]

Два поля параллельных заглавий, содержащие версии заглавий в корейской и латинской графике. Первое поле не имеет $7, так как значение его приводится в том же алфавите, который указан в позициях символов 34-35 поля 100, то есть "ka" (корейский).

Пример 3.

100 ##$a позиции символов 34-35 = db [японская - канджи]
701 #0$6a04$a[Имя первого соавтора, записанное в канджи]
701 #0$6a04$7dc$a[Имя первого соавтора, записанное в кана]
701 #0$6a04$7ba$a[Имя первого соавтора, записанное в латинизированной форме]
701 #0$6a08$a[Имя второго соавтора, записанное в канджи]
701 #0$6a08$7dc$a[Имя второго соавтора, записанное в кана]
701 #0$6a08$7ba$a[Имя второго соавтора, записанное в латинизированной форме]

Поля дополнительных точек доступа для отражения имен авторов в японских азбуках канджи, кана и в латинизированной форме. Поля, записанные в канджи, не содержат подполя $7, так как позиции символов 34-35 поля 100 содержат "db'' (японская азбука канджи).

Пример 4.

100 ##$a позиции символов 34-35 = ca [кириллическая]
710 02$6a05791$aРоссийская национальная библиотека
791 02$6a05710$7ba$aNational Library of Russia


Пример 5.

100 ##$a позиции символов 26-29 = 0103, позиции символов 30-31 = 05, позиции символов 34-35 = ga [греческая]
200 1#$a01/11 07/13????????01/11 07/14 Windows XP01/11 07/13 - ? ??????? ??????01/11 07/14

Заглавие на греческом языке включает фразу на английском языке. Указание графики в подполе $7 не обеспечит необходимой информации для обработки комбинации графики в поле. В этом случае необходимо использовать механизм, описанный в ISO 2022.
ISO 5426 (расширенный латинский набор) был определен как набор G1, ISO 5428 (греческий набор) определен как набор G2. В нужный момент набор G2 загружается в колонки 10-15 с помощью LS2R (битовая комбинация 01/11 07/13), замещая набор G1. После того, как необходимость использования греческого набора символов в поле исчезает, набор G1 по умолчанию вновь возвращается в колонки 10-15 с помощью LS1R (битовая комбинация 01/11 07/14).